logo

Dispersija

Dispersija yra matavimo vertė, naudojama norint nustatyti, kaip paskirstomi duomenys, susiję su duomenų rinkinio vidurkiu arba vidutine verte. Jis naudojamas norint išsiaiškinti, kaip pasiskirsto pasiskirstymo duomenys pagal vidutinę arba vidutinę vertę. Simbolis, naudojamas dispersijai apibrėžti, yra σ2. Tai standartinio nuokrypio kvadratas.

Statistikoje naudojami du dispersijos tipai,



  • Mėginio dispersija
  • Populiacijos dispersija

Visuomenės dispersija naudojama norint nustatyti, kaip kiekvienas duomenų taškas tam tikroje populiacijoje svyruoja arba pasiskirsto, o imties dispersija naudojama kvadratinių nuokrypių nuo vidurkio vidurkiui rasti.

Šiame straipsnyje mes sužinosime apie Dispersija (imtis, populiacija), jų formulės, savybės ir kt.

Turinys



Kas yra dispersija?

Matuojame įvairias duomenų reikšmes ir šios vertės naudojamos įvairiems tikslams. Duomenys gali būti pateikiami dviejų tipų grupiniais duomenimis arba negrupuotais (diskretaisiais) duomenimis. Jei duomenys pateikiami klasių intervalų forma, jie vadinami sugrupuotais duomenimis, o jei duomenys pateikiami vieno duomenų taško forma, jie vadinami atskiru arba negrupuotu duomenų tašku. Sklaida yra duomenų sklaidos matas, susijęs su vidutine duomenų verte. Jame nurodoma, kaip duomenys paskirstomi nurodytoje duomenų vertėje. Galime lengvai apskaičiuoti tiek sugrupuotų, tiek negrupuotų duomenų imties dispersiją ir populiacijos dispersiją.

Variacijos apibrėžimas

Dispersija yra statistinis matas, kuris kiekybiškai įvertina duomenų taškų rinkinio sklaidą arba sklaidą. Tai rodo, kiek atskiri duomenų taškai duomenų rinkinyje skiriasi nuo duomenų rinkinio vidurkio (vidurkio).

Variacijos tipai

Duotų duomenų dispersiją galime apibrėžti dviem tipais,



  • Populiacijos dispersija
  • Mėginio dispersija

Dabar sužinokime apie juos išsamiai.

Populiacijos dispersija

Populiacijos dispersija naudojama tam tikros populiacijos sklaidai nustatyti. Gyventojai apibrėžiami kaip žmonių grupė ir visi tos grupės žmonės yra dalis gyventojų. Tai mums pasakoja apie tai, kaip grupės populiacija skiriasi atsižvelgiant į vidutinį gyventojų skaičių.

Visi grupės nariai yra žinomi kaip gyventojai. Kai norime sužinoti, kaip kiekvienas duomenų taškas tam tikroje populiacijoje skiriasi arba yra paskirstytas, naudojame populiacijos dispersiją. Jis naudojamas kiekvieno duomenų taško atstumo kvadratui nuo populiacijos vidurkio pateikti.

Mėginio dispersija

Jei populiacijos duomenys yra labai dideli, sunku apskaičiuoti duomenų rinkinio populiacijos dispersiją. Tokiu atveju paimame duomenų pavyzdį iš nurodyto duomenų rinkinio ir randame to duomenų rinkinio dispersiją, kuri vadinama imties dispersija. Skaičiuodami imties vidurkį, būtinai apskaičiuojame imties vidurkį, t. y. imties duomenų rinkinio vidurkį, o ne visumos vidurkį. Imties dispersiją galime apibrėžti kaip skirtumo tarp imties duomenų taško ir imties vidurkio kvadrato vidurkį.

Variacijos simbolis

Dispersijos simbolis paprastai vaizduojamas graikiška raide sigma kvadratu (σ²), kai kalbama apie populiacijos dispersiją. Imties dispersija dažnai žymima s².

Variacijos pavyzdys

Dispersijos sąvoką galime suprasti naudodami toliau aptartą pavyzdį.

Raskite duomenų populiacijos dispersiją {4,6,8,10}

Sprendimas:

Vidurkis = (4+6+8+10)/4 = 7

4 (4–7)2 9
6 (6–7)2 1
8 (8-7)2 1
10 (10-7)2 9

Nuokrypis = (9+1+1+9)/4 = 20/4 = 5

Taigi duomenų dispersija yra 5

Variacijos formulė

Duomenų rinkinio dispersija žymima simboliu σ2. Populiacijos duomenims jo formulė yra lygi duomenų įrašų skirtumų kvadratui sumai nuo vidurkio, padalyto iš įrašų skaičiaus. Duomenų pavyzdžiams dalijame skaitiklio reikšmę iš skirtumo tarp įrašų skaičiaus ir vienybės.

Pavyzdinė dispersijos formulė

Jei duomenų rinkinys yra pavyzdys, dispersijos formulė pateikiama taip:

p 2 = ∑ (x i – x̄) 2 /(n – 1)

kur,

  • x yra imties duomenų rinkinio vidurkis
  • n yra bendras stebėjimų skaičius

Populiacijos dispersijos formulė

Jei turime populiacijos duomenų rinkinį, formulė parašyta taip,

p 2 = ∑ (x i – x̄) 2 /n

kur,

  • x yra gyventojų duomenų rinkinio vidurkis
  • n yra bendras stebėjimų skaičius

Taip pat galime apskaičiuoti sugrupuotų ir negrupuotų duomenų rinkinių dispersiją. Įvairios dispersijos formulės yra

cinamonas vs mate

Sugrupuotų duomenų dispersijos formulė

Sugrupuotų duomenų atveju dispersijos formulė aptariama toliau,

Sugrupuotų duomenų pavyzdžio dispersijos formulė (σ 2 ) = ∑ f(m i – x̄) 2 /(n-1)

Sugrupuotų duomenų populiacijos dispersijos formulė (p 2 ) = ∑ f(m i – x̄) 2 /n

kur,

  • f yra kiekvieno intervalo dažnis
  • m i yra i vidurio taškasthintervalas
  • x yra sugrupuotų duomenų vidurkis

Sugrupuotų duomenų vidurkis apskaičiuojamas taip,

Vidurkis = ∑ (f i x i ) / ∑ f i

Nesugrupuotų duomenų dispersijos formulė

Nesugrupuotų duomenų atveju dispersijos formulė aptariama toliau,

  • Nesugrupuotų duomenų dispersijos formulės pavyzdys (p 2 ) = ∑ (x i – x̄) 2 /(n-1)
  • Negrupuotų duomenų populiacijos dispersijos formulė (p 2 ) = ∑ (x i – x̄) 2 /n

kur x yra sugrupuotų duomenų vidurkis

Variacijos skaičiavimo formulė

Nuokrypiui apskaičiuoti naudojama formulė yra aptarta toliau pateiktame paveikslėlyje,

Variacijos formulė

Kaip apskaičiuoti dispersiją?

Apskritai dispersija reiškia populiacijos standartinę dispersiją. Tam tikros reikšmių rinkinio dispersijos apskaičiavimo veiksmai yra tokie:

1 žingsnis: Apskaičiuokite stebėjimo vidurkį pagal formulę (vidurkis = stebėjimų suma / stebėjimų skaičius)

2 žingsnis: Apskaičiuokite duomenų reikšmių skirtumus kvadratu nuo vidurkio. (Duomenų vertė – vidurkis)2

3 veiksmas: Apskaičiuokite duotųjų reikšmių skirtumų kvadratu vidurkį, kuris vadinamas duomenų rinkinio dispersija.

(Nukrypimas = skirtumų kvadratu suma / stebėjimų skaičius)

Dispersija ir standartinis nuokrypis

Variacija ir Standartinis nuokrypis abu yra centrinės tendencijos matai, kurie naudojami mums pasakyti apie tai, kiek duomenų rinkinio reikšmės nukrypsta nuo centrinės arba vidutinės duomenų rinkinio reikšmės.

Tarp bet kurio duomenų rinkinio dispersijos ir standartinio nuokrypio yra aiškus ryšys.

Nuokrypis = (standartinis nuokrypis) 2

Nuokrypis apibrėžiamas kaip standartinio nuokrypio kvadratas, t. y., paėmus bet kurios duomenų grupės standartinio nuokrypio kvadratą, gauname to duomenų rinkinio dispersiją. dispersija apibrėžiama naudojant simbolį p 2 kadangi p naudojamas duomenų rinkinio standartiniam nuokrypiui apibrėžti. Duomenų rinkinio dispersija išreiškiama kvadratiniais vienetais, o standartinis duomenų rinkinio nuokrypis išreiškiamas vienetu, panašiu į duomenų rinkinio vidurkį.

Sužinokite daugiau: Dispersija ir standartinis nuokrypis

Binomialinio skirstinio dispersija

Binominis pasiskirstymas yra diskrečiųjų tikimybių skirstinys, nurodantis teigiamų rezultatų skaičių binominiame eksperimente, atliktame n kartų. Binominio eksperimento rezultatas yra 0 arba 1, t. y. teigiamas arba neigiamas.

Atliekant binominį eksperimentą n bandymus ir kur pateikiama kiekvieno bandymo tikimybė p , tada dvinario skirstinio dispersija pateikiama naudojant

p 2 = np (1 – p)

kur 'pvz.' apibrėžiamas kaip dvinario skirstinio reikšmių vidurkis.

Puasono pasiskirstymo dispersija

Nuodų platinimas apibrėžiamas kaip diskretusis tikimybių skirstinys, naudojamas apibrėžti „n“ įvykių, įvyksiančių per „x“ laikotarpį, tikimybę. Vidurkis Puasono skirstinyje apibrėžiamas simboliu l.

Puasono skirstinyje nurodytos duomenų rinkinio vidurkis ir dispersija yra lygūs. Puasono skirstinio dispersija pateikiama naudojant formulę,

p 2 = λ

Vienodo pasiskirstymo dispersija

Esant vienodai pasiskirstymui, tikimybių pasiskirstymo duomenys yra ištisiniai. Šių eksperimentų rezultatas yra intervale tarp konkrečios viršutinės ribos ir konkrečios apatinės ribos, todėl šie skirstiniai taip pat vadinami stačiakampiais pasiskirstymais. Jei viršutinė riba arba maksimali riba yra b o apatinė arba minimali riba yra a, tada vienodo skirstinio dispersija apskaičiuojama naudojant formulę,

p 2 = (1/12) (b – a) 2

Vienodo pasiskirstymo vidurkis pateikiamas naudojant formulę,

Vidurkis = (b + a) / 2

kur,

  • b yra viršutinė vienodo pasiskirstymo riba
  • a yra tolygaus pasiskirstymo apatinė riba

Dispersija ir kovariacija

Duomenų rinkinio dispersija apibrėžia visų duomenų rinkinio reikšmių nepastovumą duomenų rinkinio vidutinės vertės atžvilgiu. Kovariacija nurodo, kaip atsitiktiniai dydžiai yra susiję vienas su kitu, ir nurodo, kaip vieno kintamojo pokytis veikia kitų kintamųjų pokytį.

Kovariacija gali būti teigiama arba neigiama, teigiama kovariacija reiškia, kad abu kintamieji juda ta pačia kryptimi vidutinės vertės atžvilgiu, o neigiama kovariacija reiškia, kad abu kintamieji juda priešingomis kryptimis vidutinės vertės atžvilgiu.

Dviejų atsitiktinių dydžių x ir y atveju, kur x yra priklausomasis kintamasis, o y yra nepriklausomas kintamasis, kovariacija apskaičiuojama naudojant formulę, nurodytą toliau pateiktame paveikslėlyje.

Kovariacijos formulė

latekso sąrašai

Sklaidos ypatybės

Variantas plačiai naudojamas matematikoje, statistikoje ir kitose mokslo šakose įvairiems tikslams. Dispersija turi įvairių savybių, kurios plačiai naudojamos sprendžiant įvairias problemas. Kai kurios pagrindinės dispersijos savybės yra

  • Duomenų rinkinio dispersija yra neneigiamas dydis, o nulinė dispersijos reikšmė reiškia, kad visos duomenų rinkinio reikšmės yra lygios.
  • Didesnė dispersijos reikšmė rodo, kad visos duomenų rinkinio duomenų reikšmės yra plačiai išsklaidytos, t. y. jos yra toli nuo duomenų rinkinio vidutinės reikšmės.
  • Mažesnė dispersijos reikšmė rodo, kad visos duomenų rinkinio duomenų reikšmės yra arti viena kitos, t. y. jos yra labai artimos vidutinei duomenų rinkinio vertei.

Bet kokiai pastoviai „c“

  • Var(x + c) = Var(x)

kur x yra atsitiktinis kintamasis

  • Var(cx) = c2

kur x yra atsitiktinis kintamasis

Taip pat, jei a ir b yra pastovioji vertė ir x tada yra atsitiktinis kintamasis,

  • Var(ax + b) = a2

Nepriklausomiems kintamiesiems x1, x2, x3…,xnMes tai žinome,

  • Kur (x1+ x2+……+ xn) = Var(x1) + Kur(x2) +……..+Kur(xn)

Žmonės taip pat skaito:

  • Vidutiniškai
  • Režimas
  • Skirtumas tarp dispersijos ir standartinio nuokrypio

Variacijos formulės pavyzdžiai

1 pavyzdys: Apskaičiuokite imties duomenų dispersiją: 7, 11, 15, 19, 24.

Sprendimas:

Turime duomenis 7, 11, 15, 19, 24

Raskite duomenų vidurkį.

x̄ = (7 + 11 + 15 + 19 + 24)/5
= 76/5
= 15,2

Naudodami dispersijos formulę gauname,

p2= ∑ (xi– x̄)2/(n – 1)
= (67,24 + 17,64 + 0,04 + 14,44 + 77,44) / (5 – 1)
= 176,8/4
= 44,2

2 pavyzdys: Apskaičiuokite stebėjimų skaičių, jei duomenų dispersija yra 12, o duomenų skirtumų kvadratu suma nuo vidurkio yra 156.

Sprendimas:

Mes turime,

(xi– x̄)2= 156

p2= 12

Naudodami dispersijos formulę gauname,

p2= ∑ (xi– x̄)2/n

12 = 156/n

n = 156/12

n = 13

3 pavyzdys: Apskaičiuokite pateiktų duomenų dispersiją

xi

fi

10 1
4 3
6 5
8 1

Sprendimas:

Vidurkis (x̄) = ∑(fixi)/∑(fi)

= (10 × 1 + 4 × 3 + 6 × 5 + 8 × 1) / (1 + 3 + 5 + 1)
= 60/10 = 6

n = ∑(fi) = 1+3+5+1 = 10

xi

fi

fixi

(xi– x̄)

(xi– x̄)2

fi(xi– x̄)2

10 1 10 4 16 16
4 3 12 -2 4 12
6 5 30 0 0 0
8 1 8 2 4 8

Dabar

p 2 = (∑ i n f i (x i – x̄) 2 /n)

= [(16 + 12 + 0 +8)/10]
= 3,6

Dispersija (σ2) = 3,6

4 pavyzdys: Raskite šios duomenų lentelės dispersiją

Klasė

Dažnis

0-10 3
10-20 6
20-30 4
30-40 2
40-50 1

Sprendimas:

Klasė

Xi

fi

f × Xi

Xi – μ

(Xi – μ)2

f×(Xi – μ)2

0-10

5

3

penkiolika

- penkiolika

225

675

10-20

penkiolika

6

90

-5

25

150

20-30

25

4

100

5

25

100

30-40

35

2

70

penkiolika

225

450

40-50

Keturi

1

Keturi

25

625

625

Iš viso

16

320

2000 m

Vidurkis (μ) = ∑(fi xi)/∑(fi)
= 320/16 = 20

p 2 = (∑ i n f i (x i – m) 2 /n)

= [(2000)/(16)]
= (125)

Pateikto duomenų rinkinio dispersija yra 125.

Santrauka – dispersija

Dispersija yra statistinis matas, parodantis, kiek duomenų rinkinio reikšmės skiriasi nuo vidurkio. Tai padeda mums suprasti duomenų taškų sklaidą arba sklaidą. Yra du pagrindiniai dispersijos tipai: populiacijos dispersija, kuri matuoja, kaip duomenų taškai pasiskirsto visoje populiacijoje, ir imties dispersija, kuri matuoja, kaip duomenų taškai pasiskirsto imtyje. Variacija žymima σ² ir yra standartinio nuokrypio kvadratas. Norėdami apskaičiuoti dispersiją, suraskite duomenų vidurkį, atimkite vidurkį iš kiekvieno duomenų taško, padalykite skirtumus kvadratu ir suvidurkite šiuos kvadratinius skirtumus. Skirtumas yra svarbus, nes padeda suprasti duomenų rinkinio kintamumą. Didelė dispersija rodo, kad duomenų taškai pasiskirstę plačiai, o maža dispersija rodo, kad jie artimi vidurkiui. Variacija visada yra neneigiama, nes ji apima skirtumus kvadratu.

DUK apie dispersiją

Kas yra statistikos dispersija?

Dispersija apibrėžiama kaip duomenų rinkinio reikšmių sklaida duomenų rinkinio vidutinės vertės atžvilgiu. Duomenų rinkinio dispersija nurodo, kiek tam tikro duomenų rinkinio reikšmės skiriasi nuo vidutinės vertės.

Kas yra dispersijos simbolis?

Mes naudojame simbolius σ2, s2 ir Var(x), kad reikštų duomenų rinkinio dispersiją.

Kas yra dispersijos formulė?

Duomenų rinkinio dispersija apskaičiuojama pagal formulę,

p 2 = E[( X – m ) 2 ]

enum tostring java

Ką sako „Variance“?

Sklaida naudojama norint nustatyti duomenų sklaidos mastą, t. y. ji nurodo, kaip duomenų rinkinio reikšmės pasiskirsto vidutinės vertės atžvilgiu. Didesnės dispersijos vertės reikšmės yra plačiai paskirstytos vidutinės vertės atžvilgiu, o mažesnės dispersijos vertės reikšmės yra labai paskirstytos vidutinės vertės atžvilgiu.

Koks yra dispersijos ir standartinio nuokrypio santykis?

Pateiktam duomenų rinkiniui duomenų rinkinio dispersija yra to duomenų rinkinio standartinio nuokrypio kvadratas. Šis santykis išreiškiamas kaip

Nuokrypis = (standartinis nuokrypis) 2

Kaip apskaičiuoti dispersiją?

Norėdami apskaičiuoti dispersiją, pirmiausia turite rasti duomenų rinkinio vidurkį (vidurkį). Tada iš kiekvieno duomenų taško atimkite vidurkį ir rezultatą kvadratuokite. Galiausiai, vidutinis šių skirtumų kvadratas.

Kodėl dispersija yra svarbi?

Skirtumas yra labai svarbus norint suprasti duomenų pasiskirstymą duomenų rinkinyje. Tai padeda nustatyti, kaip duomenų taškai pasiskirsto iš vidutinės vertės, nurodant duomenų kintamumą arba nuoseklumą.

Koks skirtumas tarp dispersijos ir standartinio nuokrypio?

Nors ir dispersija, ir standartinis nuokrypis matuoja duomenų sklaidą, standartinis nuokrypis yra kvadratinė dispersijos šaknis. Standartinis nuokrypis išreiškiamas tais pačiais vienetais kaip ir duomenys, todėl jį lengviau interpretuoti nurodant skirtumą.

Ar dispersija gali būti neigiama?

Ne, dispersija negali būti neigiama. Kadangi ji apskaičiuojama kaip kvadratinių skirtumų vidurkis nuo vidurkio, gauta vertė visada yra neneigiama.