logo

Dešinysis paskirstymas: ką tai reiškia?

feature_right_skewed_histogram

Studijuoti statistiką? Tada apibūdindami duomenis tikriausiai girdėjote frazę „normalus pasiskirstymas“. Bet kaip su fraze „teisingai iškreipta“? Kaip atrodo į dešinę pakreipta histograma? Ir kas tai sukelia?

Šiame straipsnyje pateikiame į dešinę pakreiptų histogramų pavyzdžius ir paaiškiname, kuo jie skiriasi nuo normalaus pasiskirstymo grafikų.

Funkcijos vaizdas: Monikos vieta /Wikimedia Commons

java eilutę char

Kas yra normalus paskirstymas?

Prieš paaiškindami, ką reiškia, kai duomenys yra iškreipti, peržvelkime normalaus pasiskirstymo apibrėžimą.

Esant normaliam pasiskirstymui, du ar daugiau kintamųjų turi tiesioginį ryšį, kad a simetriškas duomenų rinkinys , ant kurio kairioji pusė atspindi dešiniąją. Šie grafikai vadinami varpelio kreivės dėl aiškiai apibrėžtos, varpą primenančios formos:

kūno_normalus_paskirstymas-300 x 215

java sujungimo eilutės

Normalaus pasiskirstymo grafike vidurkis (vidurkis), mediana ir režimas yra vienodi . Visi šie taškai reiškia duomenų centrą arba grafiko viršūnę.

Ką reiškia pasviręs į dešinę?

Nors normalus pasiskirstymas yra viena iš labiausiai paplitusių paskirstymo formų, ne visi duomenų rinkiniai atitinka šią pagrindinę kreivę. Kitaip tariant, kai kurios histogramos yra pasvirusios į dešinę arba į kairę .

dfa pavyzdžiai

Kai paskirstymas yra į dešinę (taip pat žinomas kaip „teigiamai iškreiptas“), dauguma duomenų patenka į dešinę arba teigiamą diagramos smailės pusę. Taigi, histograma iškreipta taip, kad jos dešinė pusė (arba „uodega“) yra ilgesnė už kairę.

body_right_skewed_histogram

Dešinėn pasvirusios histogramos pavyzdys.

Dešiniąja histogramoje vidurkis, mediana ir režimas skiriasi. Šiuo atveju režimas yra aukščiausias histogramos taškas, o mediana ir vidurkis patenka į dešinę nuo jos (arba, žiūrint, į dešinę nuo smailės). Prisimink tai vidutinė valia visada būti medianos dešinėje .

rūšiuoti masyvų sąrašą java

body_skewed_right_left

Grafikas A yra pasviręs į dešinę, o grafikas B yra iškreiptas į kairę. Naudojant į dešinę pakreiptus grafikus, vidurkis visada būna dešinėje nuo režimo (t. y. piko). ( Asitgoes /Wikimedia Commons) )

Šios savybės galiausiai tai padaro sunku priskirti tipinę vertę nes į dešinę pakreiptame grafike nėra aiškaus centro taško. Priešingai, esant normaliam pasiskirstymui, nes vidurkis, mediana ir režimas yra vienodi ir yra duomenų rinkinio centre, galite lengvai naudoti šią reikšmę, kad tiksliau apibendrintumėte duomenis.

Kas sukelia į dešinę pakreiptą histogramą?

Į dešinę nukreipti duomenys paprastai yra duomenų rinkinio apatinės ribos rezultatas (tuo tarpu į kairę nukreipti duomenys yra aukštesnės ribos rezultatas). Taigi, jei duomenų rinkinio apatinės ribos yra labai žemos, palyginti su likusiais duomenimis, duomenys bus iškreipti.

Kita iškrypimo priežastis yra paleidimo efektai . Pavyzdžiui, jei procedūra iš pradžių buvo sėkminga per ilgą paleidimo laikotarpį, tai gali sukelti teigiamą duomenų iškreipimą. (Priešingai, paleidimo laikotarpis su keliais pradiniais gedimais gali neigiamai iškreipti duomenis.)