Стандартне відхилення проти середнього
В описовій та інфекційній статистиці використовується декілька індексів для опису набору даних, що відповідає його центральній тенденції, дисперсності та спотвореності. У статистичному висновку вони зазвичай відомі як оцінки, оскільки вони оцінюють значення параметрів сукупності.
Центральна тенденція стосується і локалізує центр розподілу значень. Середнє значення, режим та медіана - це найчастіше використовувані показники для опису центральної тенденції набору даних. Дисперсія - це кількість розповсюдження даних з центру розподілу. Діапазон і стандартне відхилення - це найчастіше використовувані заходи дисперсії. Коефіцієнти нахилу Пірсона використовуються при описі косості розподілу даних. Тут під косою розуміється, чи є набір даних симетричним щодо центру чи ні, чи ні, наскільки він перекошений.
Що це значить?
Середній - найпоширеніший індекс центральної тенденції. За даним набором даних середнє значення обчислюється шляхом взяття суми всіх значень даних, а потім діленням його на кількість даних. Наприклад, ваги 10 осіб (у кілограмах) вимірюються як 70, 62, 65, 72, 80, 70, 63, 72, 77 і 79. Тоді середня вага десяти чоловік (у кілограмах) може бути розраховується наступним чином. Сума ваг - 70 + 62 + 65 + 72 + 80 + 70 + 63 + 72 + 77 + 79 = 710. Середнє = (сума) / (кількість даних) = 710/10 = 71 (у кілограмах).
Як і в цьому конкретному прикладі, середнє значення набору даних може не бути точкою даних набору, але буде унікальним для даного набору даних. Середній матиме ті ж одиниці, що й вихідні дані. Тому він може бути позначений на одній осі з даними та може бути використаний у порівняннях. Також не існує обмеження знаків для середнього набору даних. Це може бути негативним, нульовим або позитивним, оскільки сума набору даних може бути негативною, нульовою або додатною.
Що таке стандартне відхилення?
Стандартне відхилення - це найпоширеніший показник дисперсії. Для обчислення стандартного відхилення спочатку обчислюються відхилення значень даних від середнього. Середнє значення відхилень кореневого квадрата називається стандартним відхиленням.
У попередньому прикладі відповідні відхилення від середнього значення становлять (70 - 71) = -1, (62-71) = -9, (65-71) = -6, (72-71) = 1, (80- 71) = 9, (70-71) = -1, (63-71) = -8, (72-71) = 1, (77-71) = 6 і (79-71) = 8. Сума квадрати відхилення дорівнюють (-1) 2+ (-9)2+ (-6)2+ 12+92+ (-1)2+ (-8)2+ 12+ 62 + 82 = 366. Стандартне відхилення √ (366/10) = 6,05 (у кілограмах). З цього можна зробити висновок, що більшість даних знаходиться в інтервалі 71 ± 6,05 за умови, що набір даних не сильно перекошений, і це дійсно так у цьому конкретному прикладі.
Оскільки стандартне відхилення має ті самі одиниці, що і вихідні дані, воно дає нам міру, на скільки відхилилися дані від центру; більше стандартне відхилення, більша дисперсія. Також стандартне відхилення буде негативним значенням незалежно від характеру даних у наборі даних.
Яка різниця між середнім відхиленням і середнім значенням? • Стандартне відхилення - це міра дисперсії від центру, тоді як середнє вимірює розташування центру набору даних. • Стандартне відхилення - це завжди негативне значення, але середнє може приймати будь-яке реальне значення.
|