Різниця між стандартним відхиленням і стандартною помилкою

Вступ

Стандартний Dавіація (SD) і Sтандард Ежах (SE) начебто схожі термінології; однак вони концептуально настільки різноманітні, що в літературі про статистику вони використовуються майже взаємозамінно. Обидва терміни передують символу плюс-мінус (+/-), що вказує на те, що вони визначають симетричне значення або представляють діапазон значень. Незмінно обидва доданки з'являються із середнім (середнім) набором вимірюваних значень.

Цікаво, що ПП не має нічого спільного ні зі стандартами, ні з помилками, ні з передачею наукових даних.

Детальний погляд на походження та пояснення SD та SE виявить, чому професійні статистики та ті, хто використовує це з пильною увагою, обидва схильні до помилок.

Стандартне відхилення (SD)

SD - це описовий статистична характеристика поширення розподілу. Як показник він корисний, коли дані нормально поширюються. Однак він менш корисний, коли дані сильно перекошені або бімодальні, оскільки це не дуже добре описує форму розподілу. Зазвичай ми використовуємо SD при повідомленні характеристик вибірки, оскільки ми маємо намір це зробити описати наскільки дані варіюються навколо середнього. Інші корисні статистичні дані для опису розповсюдження даних - це міжквартильний діапазон, 25-й та 75-й процентилі та діапазон даних.

Рисунок 1. SD - це міра поширення даних. Коли дані є вибіркою з нормально розподіленого розподілу, тоді очікується, що дві третини даних лежать в межах 1 стандартного відхилення середнього.

Варіантність - це описовий статистична також, і вона визначається як квадрат стандартного відхилення. Зазвичай не повідомляється при описі результатів, але це більш математично відстежувана формула (наприклад, сума квадратичних відхилень) і відіграє роль у обчисленні статистики.

Наприклад, якщо у нас є дві статистичні дані П & Q з відомими дисперсіями вар(P) & вар(Q), то дисперсія суми P + Q дорівнює сумі дисперсій: вар(P) +вар(Q). Зараз очевидно, чому статистики люблять говорити про розбіжності.

Але стандартні відхилення мають важливе значення для поширення, особливо коли дані зазвичай розподіляються: Середнє значення інтервалу +/ - 1 СД можна очікувати захоплення 2/3 вибірки, а середнє інтервал +- 2 СД можна очікувати, що він забирає 95% вибірки.

SD надає вказівку на те, наскільки окремі відповіді на питання варіюють або «відхиляються» від середнього значення. SD розповідає досліднику, наскільки поширені відповіді - чи сконцентровані вони середні, чи розсіяні далеко і вшир? Чи всі ваші респонденти оцінили ваш продукт посеред вашої шкали, чи хтось його схвалив, а хтось не схвалив?

Розглянемо експеримент, коли респондентам пропонується оцінити продукт за рядом атрибутів за 5-бальною шкалою. Середнє значення для групи з десяти респондентів (позначених нижче від "A" до "J" для "хороше співвідношення ціни та якості") становило 3,2 при SD 0,4, а середнє значення для "надійності продукту" - 3,4, а SD - 2,1.

На перший погляд (дивлячись лише на засоби) здавалося б, що надійність оцінюється вище, ніж значення. Але більш висока SD щодо надійності може вказувати (як показано в розподілі нижче), що відповіді були дуже поляризованими, де більшість респондентів не мали проблем із надійністю (оцінили атрибут "5"), але менший, але важливий сегмент респондентів мав проблема надійності та оцінив атрибут "1". Дивлячись лише на середину розповідає лише частину історії, однак, частіше за все, саме на цьому акцентують увагу дослідники. Важливо врахувати розподіл відповідей, і УР надає цінний описовий захід.

Відповідач Гарне співвідношення ціни та якості Надійність продукту
А 3 1
Б 3 1
С 3 1
D 3 1
Е 4 5
Ж 4 5
Г 3 5
Н 3 5
Я 3 5
J 3 5
Середній 3.2 3.4
Std. Дев. 0,4 2.1

Перше опитування: респонденти оцінюють продукт за 5-бальною шкалою

Дві дуже різні розподіли відповідей за 5-бальною шкалою оцінок можуть дати однакове значення. Розглянемо наступний приклад, що показує значення відповіді для двох різних оцінок.

У першому прикладі (Рейтинг «A») SD дорівнює нулю, оскільки ВСІ відповіді були саме середнім значенням. Окремі відповіді зовсім не відхилялися від середнього значення.

У рейтингу “B”, хоча середнє значення групи є таким же (3,0), як у першого розподілу, стандартне відхилення вище. Стандартне відхилення 1,15 показує, що індивідуальні відповіді в середньому * були трохи більше ніж на 1 бал від середнього.

Відповідач Рейтинг "A" Рейтинг "B"
А 3 1
Б 3 2
С 3 2
D 3 3
Е 3 3
Ж 3 3
Г 3 3
Н 3 4
Я 3 4
J 3 5
Середній 3.0 3.0
Std. Дев. 0,00 1.15

Друге опитування: респонденти оцінюють продукт за 5-бальною шкалою

Інший спосіб розгляду SD - це побудова графіку розподілу як гістограми відповідей. Розподіл із низьким рівнем SD відображатиметься як вузька висока форма, тоді як великий SD позначається ширшою формою.

У загальному випадку SD не вказує "правильно чи неправильно" або "краще чи гірше" - нижчий SD не обов'язково є більш бажаним. Він використовується суто як описова статистика. Він описує розподіл по відношенню до середнього.

Тетнічні застереження щодо СД

Розгляд СД як «середнього відхилення» - це відмінний спосіб концептуального розуміння його значення. Однак насправді це не розраховується як середнє значення (якби воно було, ми би називали це «середнім відхиленням»). Натомість це "стандартизований", дещо складний метод обчислення значення, використовуючи суму квадратів.

Для практичних цілей обчислення не важливі. Більшість програм табуляції, електронних таблиць або інших інструментів управління даними обчислює SD для вас. Важливіше - зрозуміти, що передає статистика.

Стандартна помилка

Стандартна помилка - це інфекційний статистика, яка використовується при порівнянні вибіркових засобів (середніх показників) для груп населення. Це міра точність середньої вибірки Вибірка середнього значення - це статистика, отримана з даних, що мають основний розподіл. Ми не можемо візуалізувати його так само, як дані, оскільки ми провели один експеримент і мають лише одне значення. Статистична теорія говорить нам, що середнє значення вибірки (для великої "достатньо" вибірки та за кількох умов регулярності) приблизно нормально розподілене. Стандартне відхилення цього нормального розподілу - це те, що ми називаємо стандартною помилкою.

Малюнок 2. Розподіл внизу репреснадсилає розподіл даних, тоді як розподіл у верхній частині є теоретичним розподілом середньої вибірки. SD 20 - це міра поширення даних, тоді як SE 5 - це міра невизначеності навколо середньої вибірки.

Коли ми хочемо порівняти засоби результатів з двопробного експерименту з лікування А проти лікування Б, то нам потрібно оцінити, наскільки точно ми виміряли засоби.

Насправді нас цікавить, наскільки точно ми виміряли різницю між двома засобами. Ми називаємо цю міру стандартною помилкою різниці. Ви, можливо, не здивуєтеся, дізнавшись, що стандартна помилка різниці в вибірковій формі є функцією стандартних помилок засобу:

Тепер, коли ви зрозуміли, що стандартна помилка середнього значення (SE) і стандартне відхилення розподілу (SD) - це два різних звіра, вам може бути цікаво, як вони заплуталися в першу чергу. Хоча вони концептуально відрізняються, вони мають просте співвідношення математично:

,де n - кількість точок даних.

Зауважте, що стандартна похибка залежить від двох компонентів: стандартного відхилення вибірки та розміру вибірки н. Це має інтуїтивний сенс: чим більше стандартне відхилення вибірки, тим менш точним ми можемо говорити про нашу оцінку справжнього середнього значення.

Крім того, чим більший розмір вибірки, тим більше інформації ми маємо про кількість населення і тим точніше ми можемо оцінити справжнє середнє значення.

SE - це показник надійності середнього. Невеликий SE - це показник того, що середня вибірка є більш точним відображенням фактичної середньої сукупності. Більший розмір вибірки, як правило, призводить до меншої SE (тоді як розмір вибірки безпосередньо не впливає на SD).

Більшість дослідницьких досліджень включає в себе вибірку з населення. Потім ми робимо висновки про сукупність за результатами, отриманими з цього зразка. Якщо був обраний другий зразок, результати, ймовірно, не будуть точно відповідати першому зразку. Якщо середнє значення для атрибута рейтингу становило 3,2 для одного зразка, воно може бути 3,4 для другого зразка такого ж розміру. Якби ми взяли з нашої сукупності нескінченну кількість зразків (однакового розміру), ми могли б відображати спостережувані засоби як розподіл. Тоді ми могли б обчислити середнє значення всіх наших вибіркових засобів. Це означає, що дорівнювало б справжньому населенню. Ми також можемо розрахувати SD розподілу засобів вибірки. SD цього розподілу засобів вибірки є SE кожного середнього середнього зразка.

Таким чином, у нас є найзначніше спостереження: SE - це середнє значення серед населення.

Зразок Середній
1-й 3.2
2-й 3.4
3-й 3.3
4-й 3.2
5-й 3.1
… . … .
… . … .
… . … .
… . … .
… . … .
Середній 3.3
Std. Дев. 0,13

Таблиця, що ілюструє відношення між SD та SE

Зараз зрозуміло, що якщо SD цього розподілу допомагає нам зрозуміти, наскільки середня вибірка знаходиться в середньому від справжньої сукупності, то ми можемо використати це, щоб зрозуміти, наскільки точним є будь-який середній зразок по відношенню до справжнього середнього. У цьому суть SE.

Насправді ми взяли лише один зразок з нашої сукупності, але ми можемо використовувати цей результат, щоб дати оцінку надійності спостережуваного середнього зразка.

Насправді, SE каже нам, що ми можемо бути на 95% впевнені, що спостережуване середнє значення вибірки становить плюс-мінус приблизно 2 (фактично 1,96) Стандартні помилки серед населення означають.

Наведена нижче таблиця показує розподіл відповідей з нашого першого (і єдиного) зразка, використаного для наших досліджень. SE, що становить 0,13, будучи відносно невеликим, дає нам свідчення про те, що наша середня величина є відносно близькою до справжньої середньої сукупності нашого населення. Похибка (при 95% достовірності) для нашого середнього значення (приблизно) вдвічі перевищує це значення (+/- 0,26), що говорить нам про те, що справжня середня величина, швидше за все, між 2,94 і 3,46.

Відповідач Рейтинг
А 3
Б 3
С 3
D 3
Е 4
Ж 4
Г 3
Н 3
Я 3
J 3
Середній 3.2
Std. Помилка 0,13

Підсумок

Багато дослідників не розуміють відмінності між стандартним відхиленням і стандартною помилкою, хоча вони зазвичай включаються в аналіз даних. Хоча фактичні розрахунки для стандартного відхилення та стандартної помилки виглядають дуже схоже, вони представляють два дуже різні, але взаємодоповнюючі заходи. SD розповідає про форму нашого розподілу, наскільки близькі окремі значення даних від середнього значення. SE каже нам, наскільки близький наш вибірковий показник до справжнього середнього для всієї сукупності. Разом вони допомагають надати більш повну картину, ніж може сказати нам одне середнє.