Складування даних - це система, призначена для зберігання та організації даних у центральних сховищах, включаючи дані з інших джерел. Це основна концепція бізнес-аналітики в реляційних моделях баз даних, яка використовує аналітичні методи інтеграції бізнес-даних у центральну базу даних.
Існують дві загальні архітектурні моделі, що використовуються для зберігання даних:
Обидві є загальними багатовимірними моделями баз даних, що використовуються для задоволення потреб великих баз даних для аналітичних цілей у реальних сховищах даних.
Ми представляємо неупереджене порівняння між двома, щоб краще зрозуміти, який з них кращий за інший.
Це найпоширеніша та широко прийнята архітектурна модель, яка використовується для розробки сховищ даних та маркет даних, в яких дані впорядковані у факти та виміри. Це найпростіша архітектурна модель, в якій одна таблиця фактів використовується для позначення кількох розмірних таблиць, що імітують зоряний малюнок.
Як випливає з назви, діаграма нагадує зірку з таблицею фактів у центрі та кількома таблицями розмірів, що випромінюють від неї, створюючи зразок, подібний до зірки.
Він також відомий як схема приєднання до зірки, і він зберігає всі атрибути виміру в одній денормалізованій таблиці фактів, щоб швидко переміщатися по великих багатовимірних наборах даних, що пояснює швидкий час відповіді на запит..
Це розширення схеми зірки з додатковими функціоналами. На відміну від зіркової схеми, таблиці розмірів у схемі сніжинки нормалізуються у кілька пов'язаних таблиць.
Архітектурна модель являє собою логічне розташування таблиць в ієрархії відносин "багато в одному", де множинні таблиці розмірів нормалізуються в таблиці розмірів, схожі на візерунок сніжинки, звідси і назва.
Це більш складна версія зіркової схеми з більшою кількістю з'єднань між розмірними таблицями, що приводить до повільного часу обробки для отримання даних, що означає повільний час відповіді на запит. Це мінімізує надмірність даних, що, в свою чергу, покращує продуктивність запитів.
У реляційних базах даних зіркова схема - це найпростіша архітектурна модель, що використовується для розробки сховищ даних та багатовимірних графіків даних. Як випливає з назви, модель нагадує зірку з точками, що випромінюються від центру, тобто таблиця фактів - центр, а точки - таблиці розмірів. Як і інші розмірні моделі, вона складається з даних у вигляді фактів та вимірів. Сніжинка схема, з іншого боку, є більш складною архітектурною моделлю, яка стосується багатовимірної бази даних з логічним розташуванням таблиць у вигляді сніжинки.
Схема сніжинки досить схожа на схему зірки, за винятком того, що вона може мати більше однієї розмірної таблиці, яка додатково нормалізується в декілька суміжних таблиць, які називаються таблицями підрозмір. Він представляє кілька рівнів відносин, які розгалужуються на візерунок сніжинки. Однак схема зірок зберігає всі пов'язані атрибути виміру в одній денормалізованій таблиці вимірів, що дозволяє зрозуміти та обробити більш прості запити..
Таблиця вимірів не може містити повторюваних рядків у моделях реляційних баз даних для простого факту, що це може створювати двозначності у пошуку. Кожна таблиця повинна мати стовпчик або комбінацію стовпців, які називаються первинним ключем, що однозначно ідентифікує всі записи таблиці. Зовнішній ключ - це стовпець або група стовпців, що забезпечує зв’язок між двома таблицями. У схемі зірок кожна таблиця розмірів має первинний ключ, який пов'язаний із зовнішнім ключем у таблиці фактів. Ієрархія бізнесу в схемі сніжинки представлена співвідношенням первинного ключа / зовнішнього ключа між розмірними таблицями.
Ключова відмінність між двома моделями реляційних баз даних - це нормалізація. Таблиці розмірів на схемі зірок не нормалізуються, тобто бізнес-модель використовуватиме відносно більше місця для зберігання таблиць розмірів, а більше місця означає більше зайвих записів, що в кінцевому підсумку спричинить непослідовність. Сніжинка схема, з іншого боку, мінімізує надмірність даних, оскільки нормалізовані таблиці розмірів, які припадають на значно менші надмірні записи. Ієрархія бізнесу та його виміри зберігаються через референтну цілісність, тобто відносини можуть бути оновлені незалежно в сховищах даних.
Зіркова схема має меншу кількість з'єднань між розмірною таблицею та таблицею фактів порівняно зі схемою сніжинки, яка має декілька з'єднань, що становить меншу складність запитів. Оскільки розміри в схемі зірки пов'язані через центральну таблицю фактів, вона має чіткі шляхи з'єднання, які означають швидкий час відповіді на запит та швидкий час відповіді, означає кращу ефективність. Схема Сніжинки має більшу кількість приєднань, тому більш тривалий час відповіді на запити, що призводить до складніших запитів, що в кінцевому рахунку погіршує продуктивність.
Обидві є найпоширенішими і широко прийнятими архітектурними моделями, які використовуються для розробки складів баз даних та даних даних. Однак у кожної бізнес-моделі є своя частка плюсів і мінусів. Хоча зіркова схема - це найпростіша багатовимірна модель, що використовується для впорядкування даних у факти та виміри, вона ідеально підходить для розробки полей даних, які передбачають менш складні відносини. Схема Сніжинки - це логічне подання таблиць у багатовимірній базі даних, в яких розміри зберігаються в таблицях під розмірами. Основна відмінність між ними - нормалізація. Таблиці розмірів у схемі сніжинки повністю нормалізуються у декілька таблиць огляду, тоді як у схемі зірок таблиці розмірів денормалізовані в одну центральну таблицю фактів.