Різниця між Semi Join і Bloom Join

Semi Join vs Bloom Join

Напівприєднання та приєднання до Блуму - це два способи з'єднання, що використовуються при обробці запитів для розподілених баз даних. Під час обробки запитів у розподілених базах даних потрібно переносити дані між базами даних, розташованими на різних сайтах. Це може бути дорогою операцією залежно від кількості даних, які потрібно передати. Тому при обробці запитів у середовищі розподіленої бази даних важливо оптимізувати запити, щоб мінімізувати кількість даних, переданих між сайтами. Напівприєднання та приєднання до розквіту - це два способи, за допомогою яких можна зменшити кількість передачі даних та виконати ефективну обробку запитів.

Що таке Semi Join?

Semi join - метод, що використовується для ефективної обробки запитів у середовищах розподіленої бази даних. Розглянемо ситуацію, коли база даних працівника (містить інформацію, таку як ім'я працівника, номер відділення, для якої вона працює тощо), що знаходиться на сайті 1 та базу даних департаменту (містить інформацію, таку як номер відділу, назва відділення, місцезнаходження тощо), що знаходиться на сайті 2. Наприклад, якщо ми хочемо отримати ім'я працівника та прізвище, для якого вона працює (лише для відділів, розташованих у "Нью-Йорку"), виконавши запит у процесорі запитів, розміщеному на сайті 3, існує кілька способів дані можуть бути передані між трьома сайтами для досягнення цього завдання. Але при передачі даних важливо зауважити, що не потрібно передавати всю базу даних між сайтами. Тільки деякі атрибути (або кортежі), необхідні для з'єднання, повинні бути передані між сайтами, щоб ефективно виконати запит. Напівприєднання - це метод, який можна використовувати для зменшення кількості даних, що надсилаються між сайтами. При напівпоєднанні тільки стовпець приєднання передається з одного сайту на інший, а потім переданий стовпець використовується для зменшення розміру відправлених відносин між іншими сайтами. Для наведеного вище прикладу, ви можете просто перенести номер відділу та назву відділу кортежів з адресою = "Нью-Йорк" з сайту 2 на сайт 1 та виконати приєднання на сайті 1 та перенести остаточне відношення назад на сайт 3.

Що таке Bloom Join?

Як згадувалося раніше, приєднання до розквіту - це ще один метод, що використовується для уникнення передачі зайвих даних між сайтами при виконанні запитів у середовищах розподіленої бази даних. У процесі розквіту під час розквіту, а не перенесення самого стовпця приєднання, компактне представлення стовпця приєднання передається між сайтами. Bloom join використовує фільтр цвітіння, який використовує трохи вектору для виконання запитів про членство. По-перше, фільтр цвітіння будується за допомогою стовпчика приєднання і передається між місцями, після чого виконуються операції з'єднання.

Яка різниця між Semi Join і Bloom Join?

Навіть незважаючи на те, що методи приєднання як напівприєднання, так і підключення до цвітіння використовуються для мінімізації кількості переданих даних між сайтами при виконанні запитів у середовищі розподіленої бази даних, приєднання до розмноження зменшує кількість даних (кількість кортежів), переданих порівняно з напівз'єднанням, використовуючи концепція фільтрів цвітіння, які використовують бітовий вектор для визначення встановленого складу. Тому використання цвітіння приєднання буде ефективнішим, ніж використання напівчлену.