Різниця між схемою зірки та сніжинки

Складування даних - це система, призначена для зберігання та організації даних у центральних сховищах, включаючи дані з інших джерел. Це основна концепція бізнес-аналітики в реляційних моделях баз даних, яка використовує аналітичні методи інтеграції бізнес-даних у центральну базу даних.

Існують дві загальні архітектурні моделі, що використовуються для зберігання даних:

  • Схема зірок
  • Сніжинка схема

Обидві є загальними багатовимірними моделями баз даних, що використовуються для задоволення потреб великих баз даних для аналітичних цілей у реальних сховищах даних.

Ми представляємо неупереджене порівняння між двома, щоб краще зрозуміти, який з них кращий за інший.

Що таке схема зірок?

Це найпоширеніша та широко прийнята архітектурна модель, яка використовується для розробки сховищ даних та маркет даних, в яких дані впорядковані у факти та виміри. Це найпростіша архітектурна модель, в якій одна таблиця фактів використовується для позначення кількох розмірних таблиць, що імітують зоряний малюнок.

Як випливає з назви, діаграма нагадує зірку з таблицею фактів у центрі та кількома таблицями розмірів, що випромінюють від неї, створюючи зразок, подібний до зірки.

Він також відомий як схема приєднання до зірки, і він зберігає всі атрибути виміру в одній денормалізованій таблиці фактів, щоб швидко переміщатися по великих багатовимірних наборах даних, що пояснює швидкий час відповіді на запит..

Що таке схема Сніжинки?

Це розширення схеми зірки з додатковими функціоналами. На відміну від зіркової схеми, таблиці розмірів у схемі сніжинки нормалізуються у кілька пов'язаних таблиць.

Архітектурна модель являє собою логічне розташування таблиць в ієрархії відносин "багато в одному", де множинні таблиці розмірів нормалізуються в таблиці розмірів, схожі на візерунок сніжинки, звідси і назва.

Це більш складна версія зіркової схеми з більшою кількістю з'єднань між розмірними таблицями, що приводить до повільного часу обробки для отримання даних, що означає повільний час відповіді на запит. Це мінімізує надмірність даних, що, в свою чергу, покращує продуктивність запитів.

Різниця між схемою зірки та сніжинки

Архітектура схеми зірки та сніжинки

У реляційних базах даних зіркова схема - це найпростіша архітектурна модель, що використовується для розробки сховищ даних та багатовимірних графіків даних. Як випливає з назви, модель нагадує зірку з точками, що випромінюються від центру, тобто таблиця фактів - центр, а точки - таблиці розмірів. Як і інші розмірні моделі, вона складається з даних у вигляді фактів та вимірів. Сніжинка схема, з іншого боку, є більш складною архітектурною моделлю, яка стосується багатовимірної бази даних з логічним розташуванням таблиць у вигляді сніжинки.

Таблиця розмірів

Схема сніжинки досить схожа на схему зірки, за винятком того, що вона може мати більше однієї розмірної таблиці, яка додатково нормалізується в декілька суміжних таблиць, які називаються таблицями підрозмір. Він представляє кілька рівнів відносин, які розгалужуються на візерунок сніжинки. Однак схема зірок зберігає всі пов'язані атрибути виміру в одній денормалізованій таблиці вимірів, що дозволяє зрозуміти та обробити більш прості запити..

Бізнес-модель схеми зірки та сніжинки

Таблиця вимірів не може містити повторюваних рядків у моделях реляційних баз даних для простого факту, що це може створювати двозначності у пошуку. Кожна таблиця повинна мати стовпчик або комбінацію стовпців, які називаються первинним ключем, що однозначно ідентифікує всі записи таблиці. Зовнішній ключ - це стовпець або група стовпців, що забезпечує зв’язок між двома таблицями. У схемі зірок кожна таблиця розмірів має первинний ключ, який пов'язаний із зовнішнім ключем у таблиці фактів. Ієрархія бізнесу в схемі сніжинки представлена ​​співвідношенням первинного ключа / зовнішнього ключа між розмірними таблицями.

Цілісність даних у схемі зірок та сніжинок

Ключова відмінність між двома моделями реляційних баз даних - це нормалізація. Таблиці розмірів на схемі зірок не нормалізуються, тобто бізнес-модель використовуватиме відносно більше місця для зберігання таблиць розмірів, а більше місця означає більше зайвих записів, що в кінцевому підсумку спричинить непослідовність. Сніжинка схема, з іншого боку, мінімізує надмірність даних, оскільки нормалізовані таблиці розмірів, які припадають на значно менші надмірні записи. Ієрархія бізнесу та його виміри зберігаються через референтну цілісність, тобто відносини можуть бути оновлені незалежно в сховищах даних.

Виконання запитів

Зіркова схема має меншу кількість з'єднань між розмірною таблицею та таблицею фактів порівняно зі схемою сніжинки, яка має декілька з'єднань, що становить меншу складність запитів. Оскільки розміри в схемі зірки пов'язані через центральну таблицю фактів, вона має чіткі шляхи з'єднання, які означають швидкий час відповіді на запит та швидкий час відповіді, означає кращу ефективність. Схема Сніжинки має більшу кількість приєднань, тому більш тривалий час відповіді на запити, що призводить до складніших запитів, що в кінцевому рахунку погіршує продуктивність.

Схема зірок проти Сніжинки: Порівняльна діаграма


Короткий зміст схеми зірок віршів Сніжинка

Обидві є найпоширенішими і широко прийнятими архітектурними моделями, які використовуються для розробки складів баз даних та даних даних. Однак у кожної бізнес-моделі є своя частка плюсів і мінусів. Хоча зіркова схема - це найпростіша багатовимірна модель, що використовується для впорядкування даних у факти та виміри, вона ідеально підходить для розробки полей даних, які передбачають менш складні відносини. Схема Сніжинки - це логічне подання таблиць у багатовимірній базі даних, в яких розміри зберігаються в таблицях під розмірами. Основна відмінність між ними - нормалізація. Таблиці розмірів у схемі сніжинки повністю нормалізуються у декілька таблиць огляду, тоді як у схемі зірок таблиці розмірів денормалізовані в одну центральну таблицю фактів.