Контрольоване навчання та непідконтрольне навчання - це дві основні концепції машинного навчання. Контрольоване навчання - це завдання машинного навчання, щоб вивчити функцію, яка відображає вхід на вихід на основі прикладів пар введення-виведення. Непідконтрольне навчання - це завдання машинного навчання, щоб вивести функцію для опису прихованої структури з немаркованих даних. The ключова різниця між контрольованим та непідконтрольним машинним навчанням є це контрольоване навчання використовує мічені дані, тоді як непідконтрольне навчання використовує немечені дані.
Машинне навчання - це поле в галузі інформатики, яке дає можливість комп'ютерній системі вчитися на основі даних, не будучи явно запрограмованими. Це дозволяє проаналізувати дані та передбачити закономірності в них. Існує багато застосувань машинного навчання. Деякі з них - це розпізнавання обличчя, розпізнавання жестів і розпізнавання мови. Існують різні алгоритми, пов'язані з машинним навчанням. Деякі з них - регресія, класифікація та кластеризація. Найпоширеніші мови програмування для розробки програм на основі машинного навчання - це R та Python. Також можуть використовуватися інші мови, такі як Java, C ++ та Matlab.
1. Огляд та ключові відмінності
2. Що таке контрольоване навчання
3. Що таке непідконтрольне навчання
4. Подібність між контрольованим та непідконтрольним машинним навчанням
5. Поплечне порівняння - Супровід машинного навчання без нагляду в табличній формі
6. Підсумок
У системах на основі машинного навчання модель працює за алгоритмом. У навчанні під керівництвом модель контролюється. По-перше, потрібно тренувати модель. З отриманими знаннями він може передбачити відповіді для майбутніх примірників. Модель тренується за допомогою мічених даних. Якщо в систему даються вибірні дані, вона може передбачити результат. Далі йде невеликий витяг з популярного набору даних IRIS.
Згідно з наведеною вище таблицею атрибути називають довжину Сепала, ширину Сепала, довжину Пателя, ширину Пателла та Види. Стовпці відомі як функції. В одному рядку є дані про всі атрибути. Тому один ряд називається спостереженням. Дані можуть бути чисельними, або категоричними. Моделі надаються спостереження з відповідною назвою видів як вихідними. Коли дається нове спостереження, модель повинна передбачити тип видів, до якого він належить.
У контрольованому навчанні існують алгоритми класифікації та регресії. Класифікація - це процес класифікації мічених даних. Модель створила межі, які розділяли категорії даних. Коли нові дані надаються моделі, вона може бути класифікована на основі місця, де існує точка. K-Найближчі сусіди (KNN) - класифікаційна модель. Залежно від k значення визначається категорія. Наприклад, коли k дорівнює 5, якщо певна точка даних знаходиться поблизу восьми точок даних категорії A і шести точок даних категорії B, то точка даних буде класифікована як A.
Регресія - це процес прогнозування тенденції попередніх даних для прогнозування результату нових даних. При регресії вихід може складатися з однієї або декількох безперервних змінних. Прогнозування здійснюється за допомогою лінії, яка охоплює більшість точок даних. Найпростіша модель регресії - це лінійна регресія. Це швидко і не вимагає настройки параметрів, таких як у KNN. Якщо дані показують параболічну тенденцію, то модель лінійної регресії не підходить.
Це кілька прикладів керованих алгоритмів навчання. Як правило, результати, отримані від контрольованих методів навчання, є більш точними та надійними, оскільки вхідні дані добре відомі та марковані. Тому машина повинна аналізувати лише приховані закономірності.
У навчанні без нагляду модель не контролюється. Модель працює самостійно, щоб передбачити результати. Він використовує алгоритми машинного навчання, щоб прийти до висновків щодо немечених даних. Як правило, алгоритми навчання без нагляду є складнішими, ніж алгоритми, що контролюються, оскільки інформації мало. Кластеризація - це тип непідконтрольного навчання. Його можна використовувати для групування невідомих даних за допомогою алгоритмів. K-середнє та кластеризація на основі щільності - два алгоритми кластеризації.
k-середній алгоритм, розміщує k центроїд випадковим чином для кожного кластера. Потім кожна точка даних присвоюється найближчому центроїду. Евклідова відстань використовується для обчислення відстані від точки даних до центру. Точки даних класифікуються на групи. Позиції для k центроїдів обчислюються заново. Нова центральна позиція визначається середнім значенням усіх точок у групі. Знову кожну точку даних присвоюють найближчому центроїду. Цей процес повторюється, поки центроїди більше не змінюються. k-середній алгоритм швидкого кластеризації, але немає визначеної ініціалізації точок кластеризації. Крім того, існує велика різниця моделей кластеризації на основі ініціалізації точок кластера.
Інший алгоритм кластеризації є Кластеризація на основі щільності. Він також відомий як Програми просторової кластеризації на основі щільності із шумом. Він працює, визначаючи кластер як максимальний набір точок з'єднання щільності. Вони є двома параметрами, які використовуються для кластеризації на основі щільності. Вони Ɛ (епсілон) і мінімальні бали. Ɛ - максимальний радіус мікрорайону. Мінімальна кількість балів - це мінімальна кількість балів у районі to для визначення кластеру. Це кілька прикладів кластеризації, які потрапляють у непідвладне навчання.
Як правило, результати, отримані від алгоритмів навчання без нагляду, не дуже точні та надійні, оскільки машина повинна визначати та маркувати вхідні дані перед визначенням прихованих шаблонів та функцій..
Контрольовано проти непідконтрольного машинного навчання | |
Контрольоване навчання - це завдання машинного навчання вивчити функцію, яка відображає вхід на вихід на основі прикладів пар введення-виведення. | Непідконтрольне навчання - це завдання машинного навчання, що визначає функцію опису прихованої структури з немечених даних. |
Основна функціональність | |
При контрольованому навчанні модель прогнозує результат на основі мічених вхідних даних. | При навчанні без нагляду модель прогнозує результат без маркованих даних, визначаючи закономірності самостійно. |
Точність результатів | |
Результати, отримані від контрольованих методів навчання, більш точні та достовірні. | Результати, отримані в результаті непідконтрольних методів навчання, не дуже точні та достовірні. |
Основні алгоритми | |
Існують алгоритми регресії та класифікації в контрольованому навчанні. | Існують алгоритми кластеризації в навчанні без нагляду. |
Контрольоване навчання та непідконтрольне навчання - це два види машинного навчання. Контрольоване навчання - це завдання машинного навчання вивчити функцію, яка відображає вхід на вихід на основі прикладів пар введення-виведення. Непідконтрольне навчання - це завдання машинного навчання, щоб вивести функцію для опису прихованої структури з немаркованих даних. Різниця між контрольованим та непідконтрольним машинним навчанням полягає в тому, що контрольоване навчання використовує мічені дані, тоді як непідконтрольне нахилу використовує немечені дані.
1.БігДатаУніверситет. Машинне навчання - під наглядом VS Непідконтрольне навчання, когнітивний клас, 13 березня 2017. Доступно тут
2. «Навчання без нагляду». Вікіпедія, Фонд Вікімедіа, 20 березня 2018 року. Доступний тут
3. «Навчальне навчання». Wikipedia, Фонд Вікімедіа, 15 березня 2018. Доступний тут
1.'2729781 'від GDJ (Public Domain) через pixabay