Населення проти вибіркової стандартної девіації
У статистиці декілька індексів використовуються для опису набору даних, що відповідає його центральній тенденції, дисперсності та косості. Стандартне відхилення - це один із найпоширеніших заходів розповсюдження даних від центру набору даних.
Через практичні труднощі неможливо використовувати дані цілої сукупності при тестуванні гіпотези. Тому ми використовуємо значення даних із зразків, щоб робити висновки про сукупність. У такій ситуації вони називаються оцінками, оскільки вони оцінюють значення параметрів сукупності.
Вкрай важливо використовувати неупереджені оцінки в умовиводі. Кажуть, що оцінювач є неупередженим, якщо очікуване значення цього оцінника дорівнює параметру сукупності. Наприклад, ми використовуємо вибіркове середнє значення як неупереджений оцінювач середнього рівня населення. (Математично можна показати, що очікуване значення вибіркової середньої величини дорівнює середній сукупності). У разі оцінки стандартного відхилення популяції стандартне відхилення вибірки є також неупередженим оцінкою.
Що таке стандартне відхилення населення?
Коли дані з усієї сукупності можуть бути враховані (наприклад, у разі перепису), можна розрахувати стандартне відхилення населення. Для обчислення стандартного відхилення сукупності спочатку обчислюються відхилення значень даних від середньої сукупності. Середньоквадратичний квадрат (середнє квадратичне) відхилень називається стандартним відхиленням сукупності.
У класі з 10 учнів дані про учнів легко збираються. Якщо гіпотеза перевірена на цій сукупності студентів, тоді не потрібно використовувати вибіркові значення. Наприклад, ваги 10 учнів (у кілограмах) вимірюються як 70, 62, 65, 72, 80, 70, 63, 72, 77 і 79. Тоді середня вага десяти чоловік (у кілограмах) становить (70 + 62 + 65 + 72 + 80 + 70 + 63 + 72 + 77 + 79) / 10, що становить 71 (у кілограмах). Це середня чисельність населення.
Тепер для обчислення стандартного відхилення чисельності ми обчислюємо відхилення від середнього. Відповідні відхилення від середнього значення становлять (70 - 71) = -1, (62 - 71) = -9, (65 - 71) = -6, (72 - 71) = 1, (80 - 71) = 9, (70 - 71) = -1, (63 - 71) = -8, (72 - 71) = 1, (77 - 71) = 6 і (79 - 71) = 8. Сума квадратів відхилення дорівнює ( -1)2 + (-9)2 + (-6)2 + 12 + 92 + (-1)2 + (-8)2 + 12 + 62 + 82 = 366. Стандартне відхилення населення становить population (366/10) = 6,05 (у кілограмах). 71 - точна середня вага учнів класу і 6,05 - точне стандартне відхилення ваги від 71.
Що таке стандартне відхилення вибірки?
Коли дані з вибірки (розміру n) використовуються для оцінки параметрів сукупності, обчислюється стандартне відхилення вибірки. Спочатку обчислюються відхилення значень даних від середньої вибірки. Оскільки середнє значення вибірки використовується замість середньої сукупності (що невідомо), то квадратичне середнє не є доцільним. Для компенсації використання середньої вибірки сума квадратів відхилень ділиться на (n-1) замість n. Стандартне відхилення вибірки є квадратним коренем цього. У математичних символах S = √ ∑ (xi-ẍ)2 / (n-1), де S - стандартне відхилення вибірки, ẍ середнє значення вибірки і xi- це точки даних.
Тепер припустимо, що в попередньому прикладі населення - це учні всієї школи. Тоді клас буде лише зразком. Якщо цей зразок використовується при оцінці, стандартне відхилення вибірки складе √ (366/9) = 6,38 (у кілограмах), оскільки 366 було поділено на 9 замість 10 (розмір вибірки). Факт, який слід зазначити, полягає в тому, що це не гарантоване значення точного значення стандартного відхилення населення. Це лише оцінка для цього.
Яка різниця між стандартним відхиленням населення та стандартним відхиленням вибірки? • Стандартне відхилення популяції - це точне значення параметра, яке використовується для вимірювання дисперсії від центру, тоді як стандартне відхилення вибірки - це неупереджений оцінювач. • Стандартне відхилення населення розраховується, коли всі дані щодо кожної особи населення відомі. Крім того, обчислюється стандартне відхилення вибірки. • Стандартне відхилення чисельності населення задається σ = √ ∑ (xi-µ)2/ n де µ - середнє значення сукупності і n - розмір популяції, але стандартне відхилення вибірки задається S = √ ∑ (xi-ẍ)2 / (n-1) де ẍ середня вибірка і n - розмір вибірки.
|