The ключова різниця між RDBMS і Hadoop є те, що RDBMS зберігає структуровані дані, тоді як Hadoop зберігає структуровані, напівструктуровані та неструктуровані дані.
RDBMS - це система управління базами даних, заснована на реляційній моделі. Hadoop - це програмне забезпечення для зберігання даних та запуску програм на кластерах товарного обладнання.
1. Огляд та ключові відмінності
2. Що таке RDBMS
3. Що таке Hadoop
4. Поплечне порівняння - RDBMS проти Hadoop у табличній формі
5. Підсумок
RDBMS розшифровується як система управління реляційними базами даних на основі реляційної моделі. У RDBMS таблиці використовуються для зберігання даних, а ключі та індекси допомагають підключати таблиці. Таблиця - це сукупність елементів даних, і вони є сутностями. Він містить рядки та стовпці. Рядки представляють один запис у таблиці. Стовпці представляють атрибути.
Наприклад, база даних продажів може мати суб'єктів клієнтів та товарів. Клієнт може мати такі атрибути, як customer_id, ім'я, адреса, номер телефону. Елемент може мати такі атрибути, як product_id, ім'я тощо. Первинний ключ таблиці клієнта - customer_id, тоді як основний ключ таблиці продукту - product_id. Розміщення product_id в таблиці клієнтів як іноземний ключ з'єднує ці два об'єкти. Так само таблиці також пов'язані між собою. Вони забезпечують цілісність даних, нормалізацію та багато іншого. Мало поширених RDBMS є MySQL, MSSQL та Oracle. Вони використовують SQL для запитів.
Hadoop - це рамка з відкритим кодом Apache, написана на Java. Це допомагає зберігати та обробляти велику кількість даних у кластерах комп'ютерів за допомогою простих моделей програмування. Основна мета Hadoop - зберігання та обробка великих даних, що стосується великої кількості складних даних. Пропускна здатність Hadoop, яка є здатністю обробляти обсяг даних протягом певного періоду часу, висока.
В архітектурі Hadoop є чотири модулі. Це Hadoop поширений, YARN, Розподілена файлова система Hadoop (HDFS) і Hadoop MapReduce. Загальний модуль містить бібліотеки та утиліти Java. У нього також є файли для запуску Hadoop. Hadoop YARN виконує планування завдань та управління ресурсами кластера.
Крім того, розподілена файлова система Hadoop (HDFS) є системою зберігання Hadoop. У ній використовується архітектура майстер-раб. Головний вузол - це ім'я NameNode, яке керує метаданими файлової системи. Інші комп'ютери є веденими вузлами або DataNodes. Вони зберігають фактичні дані. З іншого боку, Hadoop MapReduce виконує розподілені обчислення. У ньому є алгоритми для обробки даних. У HDFS вузол Master має трекер роботи. Він працює з картою скорочення робочих місць на підлеглому вузлах. Існує програма відстеження завдань для кожного веденого вузла, щоб завершити обробку даних і відправити результат назад в головний вузол. В цілому Hadoop забезпечує масивне зберігання даних з високою потужністю обробки.
RDBMS проти Hadoop | |
RDBMS - це системне програмне забезпечення для створення та управління базами даних, що базується на реляційній моделі. | Hadoop - це сукупність програмного забезпечення з відкритим кодом, що з'єднує багато комп'ютерів для вирішення проблем, пов’язаних з великою кількістю даних та обчисленнями. |
Різноманітність даних | |
RDBMS зберігає структуровані дані. | Hadoop зберігає структуровані, напівструктуровані та неструктуровані дані. |
Зберігання даних | |
RDBMS зберігає середній обсяг даних. | Hadoop зберігає велику кількість даних, ніж RDBMS. |
Швидкість | |
У RDBMS зчитування відбувається швидко. | У Hadoop швидке читання і запис. |
Масштабованість | |
RDBMS має вертикальну масштабованість. | Hadoop має горизонтальну масштабованість. |
Обладнання | |
RDBMS використовують сервери високого класу. | Hadoop використовує товарне обладнання. |
Пропускна здатність | |
Пропускна здатність RDBMS вище. | Пропускна здатність Hadoop нижча. |
У цій статті було обговорено різницю між RDBMS та Hadoop. Ключова відмінність RDBMS від Hadoop полягає в тому, що RDBMS зберігає структуровані дані, тоді як Hadoop зберігає структуровані, напівструктуровані та неструктуровані дані..
1. Навчальний бал. "Концепції SQL RDBMS." , Навчальний посібник, 8 січня 2018 р. Доступний тут
2. Навчальний бал. "Підручник з Hadoop". , Навчальний посібник, 8 січня 2018 р. Доступний тут
1.'8552968000'by Intel Free Press (CC BY-SA 2.0) через Flickr