logo

Vardiniai vs eiliniai duomenys

Duomenų mokslas sukasi apie duomenų apdorojimą ir analizę, naudojant įvairius įrankius ir metodus. Šiandieniniame duomenimis pagrįstame pasaulyje susiduriame su duomenų tipais, kuriuos reikia tvarkyti ir interpretuoti. Norint tinkamai analizuoti ir statistiškai interpretuoti, svarbu suprasti skirtingus duomenų tipus. Duomenų tipas nustato tinkamus statistinius metodus ir operacijas, kurios turėtų būti naudojamos. Norint padaryti reikšmingas išvadas, skirtingiems duomenų tipams reikalingi skirtingi analizės ir interpretavimo metodai. Šiame straipsnyje mes išnagrinėsime duomenų sąvoką ir jų reikšmę, pateiksime realius pavyzdžius ir parodysime, kaip su jais dirbti.

Matavimo lygiai

Prieš analizuojant duomenų rinkinį, labai svarbu nustatyti jame esančių duomenų tipą. Laimei, visus duomenis galima suskirstyti į vieną iš keturių kategorijų: vardinius, eilės, intervalo arba santykio duomenis. Nors tai dažnai vadinama duomenų tipais, iš tikrųjų tai yra skirtingi matavimo lygiai. Matavimo lygis atspindi tikslumą, kuriuo kintamasis buvo kiekybiškai įvertintas, ir nustato metodus, kuriuos galima naudoti norint gauti įžvalgų iš duomenų.



Keturias duomenų kategorijas ne visada lengva atskirti, o jos priklauso hierarchijai, o kiekvienas lygis grindžiamas ankstesniu.

1

Yra keturių tipų duomenys: kategoriniai, kuriuos dar galima suskirstyti į vardinius ir eilinius, ir skaitiniai, kurie dar gali būti skirstomi į intervalą ir santykį. Vardinės ir eilės skalės yra gana netikslios, todėl jas lengviau analizuoti, tačiau jos suteikia mažiau tikslių įžvalgų. Kita vertus, intervalų ir santykio skalės yra sudėtingesnės ir sunkiau analizuojamos, tačiau jos gali suteikti daug turtingesnių įžvalgų.



  • Vardiniai duomenys – Vardiniai duomenys yra pagrindinis duomenų tipas, suskirstantis duomenis į kategorijas pagal etiketes arba įvardijant vertes, pvz., lytį, plaukų spalvą arba gyvūnų tipus. Jame nėra jokios hierarchijos.
  • Eiliniai duomenys – Įprasti duomenys apima duomenų klasifikavimą pagal rangą, pvz., socialinę padėtį, į kategorijas, pvz., „turtingas“, „vidutinės pajamos“ arba „vargšas“. Tačiau tarp šių kategorijų nėra nustatytų intervalų.
  • Intervalų duomenys – Intervaliniai duomenys – tai duomenų, apimančių išmatuotus intervalus, sutvarkymo ir palyginimo būdas. Temperatūros skalės, tokios kaip Celsijaus ar Farenheito, yra geri intervalų duomenų pavyzdžiai. Tačiau intervalų duomenys neturi tikrojo nulio, o tai reiškia, kad nulio matavimas vis tiek gali būti kiekybiškai įvertinamas matas (pvz., nulis laipsnių Celsijaus, kuris yra tik dar vienas skalės taškas ir iš tikrųjų nereiškia, kad nėra temperatūros). .
  • Santykio duomenys – Sudėtingiausias matavimo lygis yra santykio duomenys. Panašiai kaip intervalų duomenys, jis skirsto ir tvarko duomenis, naudodamas išmatuotus intervalus. Tačiau, skirtingai nuo intervalų duomenų, santykio duomenys apima tikrą nulį. Kai kintamasis yra nulis, to kintamojo nėra. Geriausias santykio duomenų pavyzdys yra aukščio matavimas, kuris negali būti neigiamas.

Kas yra vardiniai duomenys?

Kategoriniai duomenys, taip pat žinomi kaip vardiniai duomenys, yra labai svarbi informacijos rūšis, naudojama įvairiose srityse, tokiose kaip tyrimai, statistika ir duomenų analizė. Jį sudaro kategorijos arba etiketės, kurios padeda klasifikuoti ir rūšiuoti duomenis. Esminis kategoriškų duomenų bruožas yra tai, kad jie neturi jokios įgimtos eilės ar eilės tarp kategorijų. Vietoj to, šios kategorijos yra atskiros, skirtingos ir viena kitą paneigiančios.

2

Pavyzdžiui, vardiniai duomenys naudojami informacijai suskirstyti į atskiras etiketes arba kategorijas be jokios natūralios tvarkos ar reitingo. Šios etiketės ar kategorijos pateikiamos naudojant pavadinimus arba terminus, ir tarp jų nėra natūralios tvarkos ar eilės. Vardiniai duomenys yra naudingi kokybiniam informacijos klasifikavimui ir organizavimui, todėl mokslininkai ir analitikai gali grupuoti duomenų taškus pagal konkrečius požymius ar charakteristikas, nenurodant jokių skaitinių ryšių.



  • Akių spalvų kategorijos, pvz., mėlyna arba žalia, rodo vardinius duomenis. Kiekviena kategorija yra atskira, be eilės ar reitingo.
  • Išmaniųjų telefonų prekės ženklai, tokie kaip „iPhone“ ar „Samsung“, yra nominalūs duomenys. Tarp prekių ženklų nėra hierarchijos.
  • Transporto būdai, tokie kaip automobilis ar dviratis, yra nominalūs duomenys. Tai yra atskiros kategorijos be įgimtos tvarkos.

Vardinių duomenų charakteristikos

  • Duomenys, klasifikuojami kaip vardiniai, susideda iš kategorijų, kurios yra visiškai atskiros ir skiriasi viena nuo kitos.
  • Duomenys, patenkantys į vardinę kategoriją, išskiriami aprašomosiomis etiketėmis, o ne kokia nors skaitine ar kiekybine verte
  • Vardiniai duomenys negali būti reitinguojami ar rikiuojami hierarchiškai, nes jokia kategorija nėra pranašesnė ar prastesnė už kitą.

Pavyzdys

Štai keli pavyzdžiai, kaip vardiniai duomenys naudojami informacijai klasifikuoti ir suskirstyti į atskiras ir nerūšiuotas kategorijas:

1. Automobilio spalvos: Automobilių spalvos yra vardiniai duomenys, su aiškiomis kategorijomis, bet be būdingos tvarkos ar reitingo. Kiekvienas automobilis patenka į vieną spalvų kategoriją, be jokio loginio ar skaitmeninio spalvų ryšio.

2. Vaisių rūšys: Vaisių kategorijos krepšelyje yra vardinės. Kiekvienas vaisius priklauso tam tikrai kategorijai be hierarchijos ar tvarkos. Visos kategorijos yra skirtingos ir atskiros.

3. Filmo žanrai: Filmų žanrai yra nominalūs duomenys, nes nėra klasifikavimo tarp kategorijų, pvz., veiksmo ar komedijos. Kiekvienas žanras yra unikalus, tačiau remiantis vien šiais duomenimis negalime pasakyti, ar vienas yra geresnis už kitą.

Kas yra eiliniai duomenys?

Eiliniai duomenys yra kokybinių duomenų forma, kuri kintamuosius klasifikuoja į aprašomąsias kategorijas. Jai būdinga tai, kad jame naudojamos kategorijos yra suskirstytos į tam tikrą hierarchinę skalę, pavyzdžiui, nuo aukštos iki žemos. Eiliniai duomenys yra antras pagal sudėtingumą matavimo tipas po vardinių duomenų. Nors jie yra sudėtingesni nei vardiniai duomenys, kuriems nėra būdingos tvarkos, jie vis tiek yra gana supaprastinti.

3

Pavyzdžiui, eiliniai duomenys yra duomenų tipas, naudojamas elementams suskirstyti į kategorijas su reikšminga hierarchija arba tvarka. Šios kategorijos padeda palyginti ir reitinguoti skirtingus mokinių pasiekimus, pozicijas ar rezultatus, net jei intervalai tarp jų nėra vienodi. Eiliniai duomenys yra naudingi norint suprasti sutvarkytus pasirinkimus ar nuostatas ir įvertinti santykinius skirtumus.

  • Mokyklos pažymiai: A, B, C pažymiai yra eiliniai duomenys, suskirstyti pagal pasiekimus, tačiau intervalai tarp jų skiriasi.
  • Išsilavinimo lygis: tokie lygiai kaip vidurinė mokykla, bakalauro, magistro yra eiliniai duomenys, suskirstyti pagal išsilavinimą, tačiau skirtumai tarp lygių skiriasi.
  • Darbo stažas: darbo lygiai, pvz., pradinis, vidutinis, vyresnis, yra eiliniai duomenys, nurodantys hierarchiją, tačiau skirtumas skiriasi priklausomai nuo darbo ir pramonės.

Eilinių duomenų charakteristikos

  • Eiliniai duomenys patenka į neskaitinių ir kategorinių duomenų kategoriją, tačiau jie vis tiek gali naudoti skaitines reikšmes kaip etiketes.
  • Eiliniai duomenys visada reitinguojami pagal hierarchiją (taigi ir pavadinimas 'eilės').
  • Eiliniai duomenys gali būti reitinguojami, tačiau jų reikšmės nėra tolygiai paskirstytos.
  • Naudodami eilinius duomenis galite apskaičiuoti dažnio pasiskirstymą, režimą, medianą ir kintamųjų diapazoną.

Pavyzdys

Štai keli pavyzdžiai, kaip eiliniai duomenys naudojami laukuose ir domenuose:

1. Išsilavinimo lygiai: Įprasti duomenys dažniausiai naudojami išsilavinimo lygiams, pvz., mokyklai, bakalauro laipsniams, magistro laipsniams ir daktaro laipsniams, nurodyti. Šie lygiai turi tvarką.

2. Klientų pasitenkinimo įvertinimai: Kitas duomenų pritaikymas yra klientų pasitenkinimo tyrimai. Šiose apklausose respondentai dažnai prašo įvertinti savo patirtį skalėje nuo prastos iki puikios.

3. Ekonominės klasės: klasės, įskaitant vidurinę klasę ir aukštesnę klasę, gali būti klasifikuojamos kaip eiliniai duomenys, remiantis jų reitingu.

Šie pavyzdžiai parodo, kaip eiliniai duomenys naudojami laukuose ir srityse.

Nominali vs įprasti duomenys

Charakteristikos

Vardiniai duomenys

Eiliniai duomenys

Kategorijų pobūdis

Išskirtinis ir diskretiškas

Diskretus ir išskirtinis

Užsakymas / reitingas

Jokios prigimtinės tvarkos

Turi aiškią eilę arba reitingą

Skaitinės reikšmės

Nėra reikšmingų skaitinių verčių

Nėra reikšmingų skaitinių verčių

Analizės metodai

Dažnių skaičiavimai, procentai, juostos diagramos

Reitingavimas, mediana, neparametriniai testai, sutvarkytos juostinės diagramos, eilės regresija

Pavyzdys

Gyvūnų spalvos, lytis, rūšys

papildiklis pilnas

Mokyklos pažymiai, išsilavinimo lygis, stažo lygis

Interpretacija

Naudojamas klasifikuojant ir grupuojant pagal kategoriją

Naudojama vertinant užsakytas nuostatas, hierarchiją ar reitingus