Різниця між класифікацією та регресією

The ключова різниця між класифікаційним і регресійним деревом є те в класифікації залежні змінні є категоричними і не упорядкованими, тоді як в регресії залежні змінні є безперервними або впорядкованими цілими значеннями.

Класифікація та регресія - це методи навчання для створення моделей прогнозування зібраних даних. Обидві методи графічно представлені як дерева класифікації та регресії, а точніші блок-схеми з поділами даних після кожного кроку, а точніше, «гілка» в дереві. Цей процес називається рекурсивним розділенням. Такі галузі, як майнінг, використовують ці методи класифікації та регресії. Ця стаття присвячена дереву класифікації та дереву регресії.

ЗМІСТ

1. Огляд та ключові відмінності
2. Що таке класифікація
3. Що таке регресія
4. Порівняльне порівняння - класифікація проти регресії у табличній формі
5. Підсумок

Що таке класифікація?

Класифікація - це метод, який використовується для досягнення схеми, яка показує організацію даних, починаючи зі змінної попередника. Залежні змінні - це те, що класифікує дані.

Рисунок 01: Майнінг даних

Дерево класифікації починається з незалежної змінної, яка розбивається на дві групи відповідно до існуючих залежних змінних. Він призначений для з'ясування відповідей у ​​формі категоризації, викликаної залежними змінними.

Що таке регресія

Регресія - це метод прогнозування, який базується на передбачуваному або відомому числовому значенні виводу. Це вихідне значення є результатом серії рекурсивного розподілу, при цьому кожен крок має одне числове значення та іншу групу залежних змінних, які розгалужуються на іншу пару, наприклад, цю.

Дерево регресії починається з однієї або декількох змінних попередників і закінчується однією кінцевою змінною виводу. Залежні змінні є або безперервними, або дискретними числовими змінними.

У чому різниця між класифікацією та регресією?

 Класифікація проти регресії

Деревова модель, де цільова змінна може приймати дискретний набір значень. Деревова модель, де цільова змінна може приймати безперервні значення, як правило, реальні числа.
Залежна змінна
Для дерева класифікації залежні змінні є категоричними. Для дерева регресії залежні змінні є числовими.
Цінності
Має встановлену кількість не упорядкованих значень. Має або дискретні ще впорядковані значення, або недіскретні значення.
Мета будівництва
Мета побудови дерева регресії полягає в приєднанні системи регресії до кожної детермінантної гілки таким чином, щоб очікуване значення виходу. Дерево класифікації розгалужується, як визначено залежною змінною, отриманою з попереднього вузла.

Підсумок - Класифікація проти регресії

Дерева регресії та класифікації є корисними методами для відображення процесу, який вказує на досліджуваний результат, будь то класифікація чи одне числове значення. Різниця між класифікаційним деревом та деревом регресії є їх залежною змінною. Дерева класифікації мають залежні змінні, які є категоричними та не упорядкованими. Дерева регресії мають залежні змінні, які є суцільними значеннями або впорядкованими цілими значеннями.

Довідка:

1. «Навчання на дереві рішень». Вікіпедія, Фонд Вікімедіа, 13 травня 2018 р. Доступний тут 

Надано зображення:

1.'Data Mining'By Arbeck - Власна робота, (CC BY 3.0) через Wikimedia Commons