Різниця між T-TEST та ANOVA

T-TEST проти ANOVA

Збір та обчислення статистичних даних для отримання середнього значення часто є тривалим і виснажливим процесом. Т-тест та односторонній аналіз дисперсії (ANOVA) - це два найпоширеніші тести, які використовуються для цієї мети.

T-тест - це тест статистичної гіпотези, коли статистика тесту слід за розподілом Стьюдента, якщо нульова гіпотеза підтримується. Цей тест застосовується тоді, коли статистика випробувань дотримується нормального розподілу і значення значення масштабування в статистиці тесту є відомим. Якщо термін масштабування невідомий, його замінюють оцінкою на основі наявних даних. Тестова статистика відбуватиметься за t-розподілом Стьюдента.

Вільям Сілі Госсет представив t-статистику в 1908 році. Госсет був хіміком пивоварні Гіннеса в Дубліні, Ірландія. Пивоварня Гіннеса проводила політику набору найкращих випускників з Оксфорда та Кембриджу, вибираючи тих, хто міг би забезпечити застосування біохімії та статистики для встановлених виробничих процесів компанії. Вільям Сілі Госсет був одним із таких випускників. У ході цього процесу Вільям Сілі Госсет розробив t-тест, який спочатку передбачався як спосіб моніторингу якості стаута (темного пива, яке виробляє пивоварня) економічно ефективним способом. Госсет опублікував тест під назвою пера «Студент» у Біометріці, близько 1908 року. Причиною назви ручки було наполягання Гіннеса, оскільки компанія хотіла зберегти свою політику щодо використання статистики як частини своєї «комерційної таємниці»..

Статистика T-тесту зазвичай відповідає формі T = Z / s, де Z і s є функціями даних. Змінна Z призначена для чутливості до альтернативної гіпотези; Ефективно, величина змінної Z більша, коли альтернативна гіпотеза є істинною. Тим часом 's' є параметром масштабування, що дозволяє визначати розподіл T. Припущення, що лежать в основі t-тесту, полягають у тому, що а) Z дотримується стандартного нормального розподілу за нульовою гіпотезою; б) ps2 слід за розподілом distribution ‡ 2 з p ступенями свободи за нульовою гіпотезою (де р - позитивна константа); і c) значення Z і s значення незалежні. У конкретному типі t-тесту ці умови є наслідками досліджуваної сукупності, а також способом вибірки даних..

З іншого боку, аналіз дисперсії (ANOVA) - це сукупність статистичних моделей. Хоча принципи ANOVA використовувались дослідниками та статистиками протягом тривалого часу, лише до 1918 р. Сер Рональд Фішер зробив пропозицію формалізувати дисперсійний аналіз у статті під назвою "Кореляція між родичами щодо менделівського спадщини" . З цього моменту ANOVA розширилась у своєму масштабі та застосуванні. ANOVA насправді є неправильним, оскільки вона не походить від відмінностей дисперсій, а від відмінностей між групами. Він включає супутні процедури, коли спостережувана дисперсія в певній змінній розподіляється на компоненти, що відносяться до різних джерел варіації.

По суті, ANOVA забезпечує статистичний тест, щоб визначити, чи всі засоби кількох груп рівні, і, як результат, узагальнює t-тест на більш ніж дві групи. ANOVA може бути кориснішим, ніж двопробний тест, оскільки він має менший шанс допустити помилку типу I. Наприклад, наявність декількох двопробних t-тестів матиме більший шанс допустити помилку, ніж ANOVA тих самих змінних, які беруть участь у отриманні середнього значення. Модель однакова, а тестова статистика - відношення F. Простіше кажучи, t-тести - це лише особливий випадок ANOVA: виконання ANOVA матиме однаковий результат множинних t-тестів. Існує три класи моделей ANOVA: a) моделі з фіксованими ефектами, які припускають, що дані надходять із звичайних сукупностей, що відрізняються лише своїми засобами; b) Моделі випадкових ефектів, які передбачають, що дані описують ієрархію різних груп, відмінності яких обмежує ієрархія; c) моделі змішаного ефекту, які є ситуаціями, коли є як фіксовані, так і випадкові ефекти.

Підсумок:

  1.  T-тест використовується при визначенні того, два середні значення або засоби однакові чи різні. ANOVA є кращим при порівнянні трьох або більше середніх значень або засобів.
  2.  Т-тест має більше шансів помилки, чим більше засобів використовується, тому ANOVA використовується при порівнянні двох або більше засобів.