Категоричні дані проти числових даних
Дані - це факти або інформація, зібрана з метою посилання чи аналізу. Часто ці дані збираються як атрибут зацікавленої теми. Цей атрибут може змінюватися залежно від одного, отже цей атрибут може змінюватися як змінний. Змінні можуть приймати різні форми значень, і вони є невід'ємними у зібраних даних.
Змінні можуть бути як якісними, так і кількісними; тобто, якщо змінна є кількісною, відповіді - це числа, а величина вимірюваного атрибута може бути визначена з певним ступенем точності. Інший тип, якісні змінні вимірюють якісні атрибути, і значення, припущені змінними, не можуть бути задані за розміром чи величиною. Самі змінні називаються категоричними змінними, а дані, зібрані за допомогою категоріальної змінної, є категоричними даними.
Детальніше про числові дані
Числові дані - це в основному кількісні дані, отримані від змінної, і значення має відчуття розміру / величини. Отримані чисельні дані далі поділяються на ще три категорії на основі теорії, розробленої Стенлі Смітом Стівенсом. Числові дані можуть бути порядковими, інтервальними або відносними. Тип даних визначається методом вимірювання значень, а типи відомі як рівні вимірювання.
Вага людини, відстань між двома точками, температура та ціна запасу - приклади числових даних.
У статистиці більшість методів виведені для аналізу числових даних. Основні описові статистичні дані та регресія та інші інфекційні методи в основному використовуються для аналізу числових даних.
Детальніше про категоричні дані
Категоричні дані - це значення якісної змінної, найчастіше числа, слова чи символу. Вони виявляють той факт, що змінна у розглянутому випадку належить до одного з кількох доступних варіантів. Тому вони належать до однієї з категорій; звідси назва категорична.
Політична приналежність людини, національність людини, улюблений колір людини та група крові пацієнта є якісними ознаками. Іноді число можна отримати як категоричне значення, але саме число не представляє величини вимірюваного атрибута. Поштовий код - один із прикладів.
Також будь-які категоричні значення належать до номінального типу даних, що є ще одним типом, заснованим на рівнях вимірювань. Методи, що використовуються для аналізу категоріальних даних, відрізняються від методів чисельних даних, але базовий принцип може бути однаковим.
Яка різниця між категоричними та числовими даними?
• Числові дані - це значення, отримані для кількісної змінної і несуть відчуття величини, пов'язане з контекстом змінної (отже, вони завжди є числами або символами, що несуть числове значення). Категоричні дані - це значення, отримані для якісної змінної; категоричні дані не несуть відчуття величини.
• Числові дані завжди належать або порядкового, відносного чи інтервального типу, тоді як категоричні дані належать до номінального типу.
• Методи, що використовуються для аналізу кількісних даних, відрізняються від методів, що застосовуються для категоричних даних, навіть якщо принципи однакові, принаймні додаток має суттєві відмінності.
• Числові дані аналізуються за допомогою статистичних методів в описовій статистиці, регресії, часових рядах та багато іншого.
• Для категоричних даних зазвичай використовуються описові та графічні методи. Також використовуються деякі непараметричні тести.