Варіантність проти коваріації
Варіантність та коваріантність - це два заходи, що застосовуються у статистиці. Варіантність - це міра розсіювання даних, а коваріація вказує на ступінь зміни двох випадкових величин разом. Варіантність - це досить інтуїтивне поняття, але коваріація визначається математично не спочатку інтуїтивно.
Детальніше про Варіантність
Варіантність - це міра диспергування даних від середнього значення розподілу. Це говорить про те, наскільки точки даних лежать від середнього значення розподілу. Це один з первинних дескрипторів розподілу ймовірностей та один із моментів розподілу. Також дисперсія є параметром сукупності, а дисперсія вибірки від сукупності виступає оцінкою дисперсії сукупності. З одного погляду він визначається як квадрат стандартного відхилення.
Простий мовою його можна описати як середнє значення квадратів відстані між кожною точкою даних та середнім значенням розподілу. Наступна формула використовується для обчислення дисперсії.
Var (X) = E [(X-µ)2 ] для населення, і
Var (X) = E [(X-‾x)2 ] для вибірки
Далі може бути спрощено дати Var (X) = E [X2 ] - (E [X])2.
Варіант має деякі властивості підпису і часто використовується в статистиці для спрощення використання. Варіантність негативна, оскільки це квадрат відстаней. Однак діапазон дисперсії не обмежений і залежить від конкретного розподілу. Дисперсія постійної випадкової величини дорівнює нулю, а дисперсія не змінюється щодо параметра розташування.
Більше про коваріацію
У статистичній теорії коваріація - це міра того, наскільки дві випадкові величини змінюються разом. Іншими словами, коваріація - це міра сили кореляції між двома випадковими змінними. Також це можна розглядати як узагальнення поняття дисперсії двох випадкових величин.
Коваріація двох випадкових величин X і Y, які спільно розподілені з кінцевим другим імпульсом, відома як σXY= E [(X-E [X]) (Y-E [Y])]. Звідси дисперсію можна розглядати як особливий випадок коваріації, де дві змінні однакові. Cov (X, X) = Var (X)
Нормалізуючи коваріацію, можна отримати коефіцієнт лінійної кореляції або коефіцієнт кореляції Пірсона, який визначається як ρ = E [(X-E [X]) (Y-E [Y])] / (σХ σY ) = (Cov (X, Y)) / (σХ σY)
Графічно коваріація між парою точок даних може розглядатися як область прямокутника з точками даних у протилежних вершинах. Це можна інтерпретувати як міру величини поділу між двома точками даних. Розглядаючи прямокутники для всієї сукупності, перекриття прямокутників, які відповідають усім точкам даних, можна вважати силою поділу; дисперсія двох змінних. Коваріація в двох вимірах через дві змінні, але спрощення її до однієї змінної дає дисперсію одиниці як поділ в одному вимірі.
Яка різниця між варіацією та коваріацією?
• Варіантність - це міра поширення / дисперсії в сукупності, тоді як коваріація розглядається як міра зміни двох випадкових величин або сили кореляції.
• Варіантність може розглядатися як особливий випадок коваріації.
• Варіантність та коваріантність залежать від величини значень даних, і їх неможливо порівняти; тому вони нормалізуються. Коваріація нормалізується на коефіцієнт кореляції (ділення на добуток стандартних відхилень двох випадкових величин) і дисперсія нормалізується на стандартне відхилення (шляхом взяття квадратного кореня)