Майнінг даних проти OLAP
Як обробка даних, так і OLAP - це дві загальні технології бізнес-аналітики (BI). Ділова розвідка відноситься до комп'ютерних методів ідентифікації та вилучення корисної інформації з бізнес-даних. Обмін даними - це галузь інформатики, яка займається вилученням цікавих зразків з великих наборів даних. Він поєднує в собі багато методів штучного інтелекту, статистики та управління базами даних. OLAP (аналітична обробка в Інтернеті), як випливає з назви, - це компіляція способів запиту багатовимірних баз даних.
Обмін даними також відомий як Відкриття знань у даних (KDD). Як було сказано вище, це сфера інформатики, яка займається вилученням раніше невідомої та цікавої інформації із необроблених даних. Через експоненціальний ріст даних, особливо у таких сферах, як бізнес, видобуток даних став дуже важливим інструментом для перетворення цього великого багатства даних у бізнес-аналітику, оскільки ручне вилучення шаблонів стало, здавалося б, неможливим за останні кілька десятиліть. Наприклад, він зараз використовується для різних застосувань, таких як аналіз соціальних мереж, виявлення шахрайства та маркетинг. Обмін даними зазвичай займається такими чотирма завданнями: кластеризація, класифікація, регресія та асоціація. Кластеризація - це виявлення подібних груп з неструктурованих даних. Класифікація - це правила навчання, які можна застосувати до нових даних і, як правило, включатимуть наступні етапи: попередня обробка даних, проектування моделювання, вибір навчальних / функціональних можливостей та оцінка / перевірка. Регресія - це пошук функцій з мінімальною помилкою для моделювання даних. І асоціація шукає зв’язків між змінними. Обмін даними зазвичай використовується для відповіді на такі питання, які основні продукти, які можуть допомогти отримати високий прибуток наступного року в Wal-Mart.
OLAP - це клас систем, який дає відповіді на багатовимірні запити. Зазвичай OLAP використовується для маркетингу, складання бюджету, прогнозування та подібних програм. Само собою зрозуміло, що бази даних, що використовуються для OLAP, налаштовані на складні та спеціальні запити з швидкою ефективністю. Зазвичай матриця використовується для відображення виводу OLAP. Рядки та стовпці формуються за розмірами запиту. Вони часто використовують способи агрегації на кількох таблицях для отримання резюме. Наприклад, з його допомогою можна дізнатися про продажі цього року в Wal-Mart порівняно з минулим роком? Який прогноз продажів у наступному кварталі? Що можна сказати про тенденцію, дивлячись на зміну відсотків?
Хоча очевидно, що обробка даних та OLAP схожі, оскільки вони працюють над даними для отримання інтелекту, головна відмінність полягає в тому, як вони працюють над даними. Інструменти OLAP забезпечують багатовимірний аналіз даних, вони надають резюме даних, але, навпаки, обробка даних фокусується на співвідношеннях, закономірностях та впливах у наборі даних. Це угода OLAP з агрегуванням, яка зводиться до роботи даних за допомогою "додавання", але обмін даними відповідає "поділу". Інша помітна відмінність полягає в тому, що, хоча інструменти для видобутку даних моделюють дані та повертають діючі правила, OLAP буде проводити методи порівняння та контрастування за бізнес-виміром у режимі реального часу.