Машинне навчання - це сукупність методів, що використовуються для створення комп'ютерних програм, які можуть вчитися на спостереженнях і робити прогнози. Машинне навчання використовує алгоритми, регресії та суміжні науки для розуміння даних. Зазвичай ці алгоритми можна розглядати як статистичні моделі та мережі.
Глибоке навчання - це підмножина машинних методів навчання. Дані аналізуються через декілька шарів глибокої навчальної мережі, щоб мережа могла робити висновки та приймати рішення щодо даних. Методи глибокого навчання дозволяють досягти великої точності на великих наборах даних, але ці функції роблять глибоке навчання набагато більш ресурсомістким, ніж класичне машинне навчання.
Протягом декількох десятиліть машинне навчання використовується як метод досягнення штучного інтелекту в машинах. По суті, сфера машинного навчання орієнтована на створення комп'ютерів, які можуть навчатися та приймати рішення, завдяки чому машинне навчання добре підходить до досліджень штучного інтелекту. Однак не всі моделі машинного навчання мають на меті розвивати «справжній» штучний інтелект, який ідеально відповідає або перевершує людський інтелект. Натомість моделі часто призначені для дослідження конкретних, обмежених проблем.
Поглиблене навчання пропонувалося на ранніх стадіях дискусій машинного навчання, проте мало хто з дослідників дотримувався методів глибокого навчання, оскільки обчислювальні вимоги до глибокого навчання значно більші, ніж у класичному машинному навчанні. Однак обчислювальна потужність комп'ютерів зросла експоненціально з 2000 року, що дозволило дослідникам зробити величезні вдосконалення в машинному навчанні та побудові штучного інтелекту. Оскільки моделі глибокого навчання добре масштабуються із збільшенням даних, глибоке навчання має потенціал для подолання значних перешкод для створення справжнього штучного інтелекту.
Машинне навчання та глибоке навчання є алгоритмічними. У класичному машинному навчанні дослідники використовують порівняно невеликий обсяг даних і вирішують, які найважливіші особливості полягають у даних, необхідних алгоритму для того, щоб робити прогнози. Цей метод називається функціональною інженерією. Наприклад, якщо в програмі машинного навчання навчали розпізнавати зображення літака, його програмісти склали алгоритми, що дозволяють програмі розпізнавати типові форми, кольори та розміри комерційних літаків. Маючи цю інформацію, програма машинного навчання зробила б передбачення того, чи будуть зображення представлені з включеними літаками.
Глибоке навчання, як правило, відрізняється від класичного машинного навчання багатьма шарами прийняття рішень. Мережі глибокого навчання часто вважаються «чорними скриньками», оскільки дані аналізуються через декілька мережевих шарів, які проводять спостереження. Це може зробити результати важче зрозуміти, ніж результати класичного машинного навчання. Точна кількість шарів або етапів у прийнятті рішень залежить від типу та складності обраної моделі.
Машинне навчання традиційно використовує невеликі набори даних, з яких можна вчитися та робити прогнози. Маючи невелику кількість даних, дослідники можуть визначити точні функції, які допоможуть програмі машинного навчання зрозуміти та засвоїти дані. Однак якщо програма наштовхується на інформацію, яку вона не може класифікувати на основі своїх раніше існуючих алгоритмів, дослідникам, як правило, потрібно буде вручну проаналізувати проблемні дані та створити нову функцію. Через це класичне машинне навчання зазвичай не масштабується з великою кількістю даних, але може мінімізувати помилки на менших наборах даних.
Глибоке навчання особливо підходить для великих наборів даних, і для моделей часто потрібні великі набори даних. Через складність мережі глибокого навчання мережі потрібна значна кількість навчальних даних та додаткових даних для тестування мережі після навчання. В даний час дослідники вдосконалюють мережі глибокого навчання, які можуть бути більш ефективними та використовувати менші набори даних.
Машинне навчання має різні вимоги до продуктивності комп'ютера. Існує безліч моделей, які можна запустити на середньому персональному комп’ютері. Чим досконаліші статистичні та математичні методи отримують, тим важче комп'ютер швидко обробляти дані.
Поглиблене навчання, як правило, дуже трудомістке. Розбір великого обсягу інформації за допомогою декількох шарів прийняття рішень вимагає великої кількості обчислювальної потужності. Оскільки комп'ютери стають швидшими, глибше навчання стає все доступнішим.
Традиційно машинне навчання має кілька загальних та значних обмежень. Перевищення - це статистична проблема, яка може впливати на алгоритм машинного навчання. Алгоритм машинного навчання містить певну кількість «помилок» при аналізі та прогнозуванні даних. Алгоритм повинен показувати взаємозв'язок між відповідними змінними, але при надмірному розмірі він також починає фіксувати помилку, що призводить до "шумнішої" або неточної моделі. Моделі машинного навчання також можуть стати упередженими щодо ідіосинкразії даних, з якими вони пройшли навчання, проблема, яка особливо очевидна, коли дослідники навчають алгоритми для всього доступного набору даних, а не для збереження частини даних для перевірки алгоритму на.
Глибоке навчання має ті самі статистичні підводні камені, що і класичне машинне навчання, а також кілька унікальних питань. Для багатьох проблем недостатньо доступних даних для підготовки досить точної мережі глибокого навчання. Збирати більше даних про проблему реального світу часто або неможливо зібрати або неможливо, що обмежує поточний спектр тем, для яких глибоке навчання може бути використане.
Машинне навчання та глибоке навчання описують методи навчання комп’ютерам навчатися та приймати рішення. Глибоке навчання - це підмножина класичного машинного навчання, і деякі важливі відмінності роблять глибоке навчання та машинне навчання кожним підходящим для різних застосувань.