І Кореляція, і Регресія є статистичними інструментами, які мають справу з двома або більше змінними. Хоча обидва стосуються одного і того ж предмету, між ними є відмінності. Різниці між ними пояснюються нижче.
Термін кореляція з посиланням на дві або більше змінних означає, що змінні певним чином пов'язані. Кореляційний аналіз визначає, чи існує взаємозв'язок між двома змінними, і міцність зв'язку. Якщо дві змінні x (незалежні) і y (залежні) настільки пов'язані між собою, що зміна величини незалежної змінної супроводжується зміною величини залежної змінної, то, як кажуть, дві змінні корелюють.
Кореляція може бути лінійною або нелінійною. Лінійна кореляція - це така, де змінні настільки пов'язані, що зміна значення однієї змінної призведе до послідовної зміни значення іншої змінної. У лінійній кореляції розсіяні точки, пов'язані з відповідними значеннями залежних і незалежних змінних, згрупуються навколо негоризонтальної прямої лінії, хоча горизонтальна пряма лінія також вказуватиме на лінійну залежність між змінними, якби пряма лінія могла з'єднати точки, що представляють змінні.
Регресійний аналіз, з іншого боку, використовує існуючі дані для визначення математичної залежності між змінними, яка може бути використана для визначення значення залежної змінної стосовно будь-якого значення незалежної змінної.
Кореляція стосується вимірювання сили асоціації або інтенсивності взаємозв'язку, коли регресія стосується прогнозування значення залежної змінної по відношенню до відомого значення незалежної змінної. Це можна пояснити за допомогою наступних формул.
Коефіцієнт кореляції або коефіцієнт кореляції (r) між x & y встановлюють за такою формулою;
r = коваріація (x, y) /σx.σy, cov (x, y) = Σxy / n - (Σx / n) (Σy / n), σx & σy - це стандартні відхилення відповідно відповідно x і y, і, - 1 < r 0, then correlation coefficient between x and y = correlation coefficient between u and v.
Коефіцієнт кореляції r - чисте число і не залежить від одиниці вимірювання. Таким чином, якщо x - висота (дюйми), а y - вага (фунти) людей певного регіону, то r не є ні в дюймах, ні в фунтах, а просто число.
Рівняння регресії з’ясовується за такою формулою;
Рівняння регресії y на x (щоб з'ясувати оцінку y) - y - y '= byx (x-x‾), byx називається коефіцієнтом регресії y на x. Рівняння регресії x на y (щоб з'ясувати оцінку x) дорівнює x - x '= bxy (y-y‾), bxy називається коефіцієнтом регресії x на y.
Кореляційний аналіз не передбачає залежності будь-якої змінної від іншої змінної, а також не намагається з'ясувати зв’язок між ними. Він просто оцінює ступінь асоціації між змінними. Іншими словами, кореляційний аналіз перевіряє взаємозалежність змінних. Регресійний аналіз, з іншого боку, описує залежність залежної змінної чи змінної відповіді від незалежної або пояснювальної змінної / с. Регресійний аналіз передбачає, що існує односторонній причинно-наслідковий зв’язок між пояснювальною та змінною відповіді, і не враховує, чи є цей причинно-наслідковий зв’язок позитивним чи негативним. Для кореляції і значення залежних, і незалежних змінних є випадковими, але для регресії значення незалежних змінних не повинні бути випадковими.
1. Кореляційний аналіз - це тест взаємозалежності між двома змінними. Регресійний аналіз дає математичну формулу для визначення значення залежної змінної щодо значення незалежної змінної / с.
2. Коефіцієнт кореляції не залежить від вибору походження та масштабу, але коефіцієнт регресії не такий.
Для кореляції значення обох змінних повинні бути випадковими, але це не так для коефіцієнта регресії.
1. Дас, Н. Г., (1998), Статистичні методи, Калькутта
2. Кореляція та регресія, доступні на веб-сайті www.le.ac.uk/bl/gat/virtualfc/stats/regression
3. Регресія та кореляція, доступні на веб-сайті www.abyss.uoregon.edu