Класифікація проти табуляції
Як класифікація, так і таблиця - це методи узагальнення даних у статистиці, що робить подальший аналіз даних для отримання висновків із даних. У цій статті ми детально розглянемо два способи узагальнення даних та розмежуємо класифікацію та підрахунок даних.
Що таке класифікація даних?
У статистиці класифікація - це процес поділу даних на кілька класів або груп з використанням властивостей у наборі даних. Наприклад, результати тесту з математики класу можна розділити на дві групи за допомогою статі. Така класифікація конденсує необроблені дані у відповідних формах для статистичного аналізу та видаляє складні структури даних та виділяє основні представники вихідних даних. Після класифікації можна проводити порівняння та робити висновки. Класифіковані дані також можуть забезпечувати взаємозв'язки або співвідносні моделі даних.
Сирі дані класифікуються за чотирма ключовими характеристиками, такими як географічні, хронологічні, якісні та кількісні властивості. Розглянемо набір даних, зібраних для аналізу доходів працівників у всьому світі. Наприклад, дохід середнього працівника можна класифікувати на основі країни працівника, де географічний коефіцієнт є показником для класифікації. Його також можна класифікувати за такими хронологічними властивостями, як вік працівника. Професія кожного працівника також забезпечує якісну базу для класифікації, і діапазони зарплат можуть використовуватися як кількісна база для класифікації.
Що таке табуляція даних?
У статистиці табуляція - це метод узагальнення даних, використовуючи систематичне розташування даних у рядки та стовпці. Таблиця проводиться з наміром провести дослідження, для порівняння, виявити помилки та упущення в даних, вивчити переважаючу тенденцію, спростити необроблені дані, економно використовувати простір і використовувати його в якості майбутнього посилання.
Зазвичай статистична таблиця містить такі компоненти.
Компонент | Опис |
Назва | Назва - це коротке і чітке пояснення вмісту таблиці |
Номер таблиці | Таблиці присвоюється номер для легкої ідентифікації, коли включено багато таблиць. |
Дата | Дата створення таблиці повинна бути вказана |
Позначення рядків | Кожному рядку таблиці присвоєно коротку назву, як правило, у першому стовпчику. Така назва відома як "заглушка", а стовпець відомий як "колона заглушки" |
Заголовки стовпців | Кожному стовпчику надається заголовок для пояснення природи фігур, включених до кожного стовпця. Такі назви відомі як "підписи" або "заголовки". |
Тіло столу | Дані вводяться в основний корпус і повинні бути створені для легкої ідентифікації кожного елемента даних. Числові значення часто впорядковуються у порядку зростання або зменшення. |
Одиниця вимірювання | Потрібно вказати одиницю вимірювання значень у тілі таблиці. |
Джерела | У таблицях повинні міститись первинні та вторинні джерела для даних, розташованих під тілом таблиці. |
Виноски та посилання | Додавання деталей для уточнення змісту таблиці. |
На основі цільових таблиць можна класифікувати на три основні категорії.
У чому різниця між Класифікацією та Таблицею?
• У класифікації дані відокремлюються та групуються на основі властивості даних, загальних для всіх значень.
• У таблиці, дані розташовуються у стовпці та рядки на основі характеристик / властивостей чи показників.
• Таблиця часто наголошує на аспектах подання даних, тоді як класифікація використовується як засіб сортування даних для подальшого аналізу.