Лінійна проти логістичної регресії
У статистичному аналізі важливо визначити зв’язок між змінними, що стосуються дослідження. Іноді це може бути єдиною метою самого аналізу. Одним із сильних інструментів, що використовуються для встановлення існування відносин та виявлення зв'язку, є регресійний аналіз.
Найпростішою формою регресійного аналізу є лінійна регресія, де відношення між змінними є лінійною залежністю. У статистичному плані він виявляє зв'язок між пояснювальною змінною та змінною відповіді. Наприклад, за допомогою регресії ми можемо встановити залежність між ціною товару та споживанням на основі даних, зібраних з випадкової вибірки. Регресійний аналіз дасть регресійну функцію набору даних, яка є математичною моделлю, яка найкраще відповідає наявним даним. Це легко представити сюжетною схемою. Графічна регресія рівнозначна пошуку найкращої кривої пристосування для даного набору даних. Функція кривої - це регресія. За допомогою математичної моделі можна передбачити використання товару за ціною.
Тому регресійний аналіз широко використовується при прогнозуванні та прогнозуванні. Він також використовується для встановлення взаємозв'язків в експериментальних даних у галузі фізики, хімії та багатьох природничих та технічних дисциплін. Якщо відношення або регресія є лінійною функцією, то процес відомий як лінійна регресія. У розкиданому сюжеті його можна представити як пряму лінію. Якщо функція не є лінійною комбінацією параметрів, то регресія нелінійна.
Логістична регресія порівнянна з багатоваріантною регресією, і вона створює модель для пояснення впливу декількох предикторів на змінну відповіді. Однак у логістичній регресії змінна кінцевого результату повинна бути категоричною (зазвичай поділяється; тобто, пара досяжних результатів, таких як смерть чи виживання, хоча спеціальні методи дозволяють моделювати більш категоризовану інформацію). Неперервна змінна результат може бути перетворена в категоричну змінну, яка буде використана для логістичної регресії; однак, згортання безперервних змінних таким чином в основному не рекомендується, оскільки це знижує точність.
На відміну від лінійної регресії у напрямку до середнього, змінні предиктора в логістичній регресії не повинні бути змушені бути лінійно пов'язаними, загальнорозподіленими або мати однакову дисперсію всередині кожного кластеру. Як результат, співвідношення між прогнозним і змінним результатів, ймовірно, не буде лінійною функцією.
Яка різниця між логістичною та лінійною регресією?
• При лінійній регресії припускається лінійне відношення між пояснювальною змінною та змінною відповіді, а параметри, що задовольняють моделі, знаходять аналіз, щоб дати точну залежність.
• Лінійна регресія проводиться для кількісних змінних, а результуюча функція - кількісна.
• У логістичній регресії використовувані дані можуть бути категоричними або кількісними, але результат завжди категоричний.