Dispersija yra matavimo vertė, naudojama norint nustatyti, kaip paskirstomi duomenys, susiję su duomenų rinkinio vidurkiu arba vidutine verte. Jis naudojamas norint išsiaiškinti, kaip pasiskirsto pasiskirstymo duomenys pagal vidutinę arba vidutinę vertę. Simbolis, naudojamas dispersijai apibrėžti, yra σ2. Tai standartinio nuokrypio kvadratas.
Statistikoje naudojami du dispersijos tipai,
- Mėginio dispersija
- Populiacijos dispersija
Visuomenės dispersija naudojama norint nustatyti, kaip kiekvienas duomenų taškas tam tikroje populiacijoje svyruoja arba pasiskirsto, o imties dispersija naudojama kvadratinių nuokrypių nuo vidurkio vidurkiui rasti.
Šiame straipsnyje mes sužinosime apie Dispersija (imtis, populiacija), jų formulės, savybės ir kt.
Turinys
- Kas yra dispersija?
- Variacijos tipai
- Variacijos simbolis
- Variacijos pavyzdys
- Variacijos formulė
- Pavyzdinė dispersijos formulė
- Populiacijos dispersijos formulė
- Sugrupuotų duomenų dispersijos formulė
- Nesugrupuotų duomenų dispersijos formulė
- Variacijos skaičiavimo formulė
- Kaip apskaičiuoti dispersiją?
- Dispersija ir standartinis nuokrypis
- Dispersija ir kovariacija
- Variacijos savybės
- Variacijos formulės pavyzdžiai
- Santrauka – dispersija
- DUK apie dispersiją
Kas yra dispersija?
Matuojame įvairias duomenų reikšmes ir šios vertės naudojamos įvairiems tikslams. Duomenys gali būti pateikiami dviejų tipų grupiniais duomenimis arba negrupuotais (diskretaisiais) duomenimis. Jei duomenys pateikiami klasių intervalų forma, jie vadinami sugrupuotais duomenimis, o jei duomenys pateikiami vieno duomenų taško forma, jie vadinami atskiru arba negrupuotu duomenų tašku. Sklaida yra duomenų sklaidos matas, susijęs su vidutine duomenų verte. Jame nurodoma, kaip duomenys paskirstomi nurodytoje duomenų vertėje. Galime lengvai apskaičiuoti tiek sugrupuotų, tiek negrupuotų duomenų imties dispersiją ir populiacijos dispersiją.
Variacijos apibrėžimas
Dispersija yra statistinis matas, kuris kiekybiškai įvertina duomenų taškų rinkinio sklaidą arba sklaidą. Tai rodo, kiek atskiri duomenų taškai duomenų rinkinyje skiriasi nuo duomenų rinkinio vidurkio (vidurkio).
Variacijos tipai
Duotų duomenų dispersiją galime apibrėžti dviem tipais,
- Populiacijos dispersija
- Mėginio dispersija
Dabar sužinokime apie juos išsamiai.
Populiacijos dispersija
Populiacijos dispersija naudojama tam tikros populiacijos sklaidai nustatyti. Gyventojai apibrėžiami kaip žmonių grupė ir visi tos grupės žmonės yra dalis gyventojų. Tai mums pasakoja apie tai, kaip grupės populiacija skiriasi atsižvelgiant į vidutinį gyventojų skaičių.
Visi grupės nariai yra žinomi kaip gyventojai. Kai norime sužinoti, kaip kiekvienas duomenų taškas tam tikroje populiacijoje skiriasi arba yra paskirstytas, naudojame populiacijos dispersiją. Jis naudojamas kiekvieno duomenų taško atstumo kvadratui nuo populiacijos vidurkio pateikti.
Mėginio dispersija
Jei populiacijos duomenys yra labai dideli, sunku apskaičiuoti duomenų rinkinio populiacijos dispersiją. Tokiu atveju paimame duomenų pavyzdį iš nurodyto duomenų rinkinio ir randame to duomenų rinkinio dispersiją, kuri vadinama imties dispersija. Skaičiuodami imties vidurkį, būtinai apskaičiuojame imties vidurkį, t. y. imties duomenų rinkinio vidurkį, o ne visumos vidurkį. Imties dispersiją galime apibrėžti kaip skirtumo tarp imties duomenų taško ir imties vidurkio kvadrato vidurkį.
Variacijos simbolis
Dispersijos simbolis paprastai vaizduojamas graikiška raide sigma kvadratu (σ²), kai kalbama apie populiacijos dispersiją. Imties dispersija dažnai žymima s².
Variacijos pavyzdys
Dispersijos sąvoką galime suprasti naudodami toliau aptartą pavyzdį.
Raskite duomenų populiacijos dispersiją {4,6,8,10}
Sprendimas:
Vidurkis = (4+6+8+10)/4 = 7
4 (4–7)2 9 6 (6–7)2 1 8 (8-7)2 1 10 (10-7)2 9 Nuokrypis = (9+1+1+9)/4 = 20/4 = 5
Taigi duomenų dispersija yra 5
Variacijos formulė
Duomenų rinkinio dispersija žymima simboliu σ2. Populiacijos duomenims jo formulė yra lygi duomenų įrašų skirtumų kvadratui sumai nuo vidurkio, padalyto iš įrašų skaičiaus. Duomenų pavyzdžiams dalijame skaitiklio reikšmę iš skirtumo tarp įrašų skaičiaus ir vienybės.
Pavyzdinė dispersijos formulė
Jei duomenų rinkinys yra pavyzdys, dispersijos formulė pateikiama taip:
p 2 = ∑ (x i – x̄) 2 /(n – 1)
kur,
- x yra imties duomenų rinkinio vidurkis
- n yra bendras stebėjimų skaičius
Populiacijos dispersijos formulė
Jei turime populiacijos duomenų rinkinį, formulė parašyta taip,
p 2 = ∑ (x i – x̄) 2 /n
kur,
- x yra gyventojų duomenų rinkinio vidurkis
- n yra bendras stebėjimų skaičius
Taip pat galime apskaičiuoti sugrupuotų ir negrupuotų duomenų rinkinių dispersiją. Įvairios dispersijos formulės yra
cinamonas vs mate
Sugrupuotų duomenų dispersijos formulė
Sugrupuotų duomenų atveju dispersijos formulė aptariama toliau,
Sugrupuotų duomenų pavyzdžio dispersijos formulė (σ 2 ) = ∑ f(m i – x̄) 2 /(n-1)
Sugrupuotų duomenų populiacijos dispersijos formulė (p 2 ) = ∑ f(m i – x̄) 2 /n
kur,
- f yra kiekvieno intervalo dažnis
- m i yra i vidurio taškasthintervalas
- x yra sugrupuotų duomenų vidurkis
Sugrupuotų duomenų vidurkis apskaičiuojamas taip,
Vidurkis = ∑ (f i x i ) / ∑ f i
Nesugrupuotų duomenų dispersijos formulė
Nesugrupuotų duomenų atveju dispersijos formulė aptariama toliau,
- Nesugrupuotų duomenų dispersijos formulės pavyzdys (p 2 ) = ∑ (x i – x̄) 2 /(n-1)
- Negrupuotų duomenų populiacijos dispersijos formulė (p 2 ) = ∑ (x i – x̄) 2 /n
kur x yra sugrupuotų duomenų vidurkis
Variacijos skaičiavimo formulė
Nuokrypiui apskaičiuoti naudojama formulė yra aptarta toliau pateiktame paveikslėlyje,

Kaip apskaičiuoti dispersiją?
Apskritai dispersija reiškia populiacijos standartinę dispersiją. Tam tikros reikšmių rinkinio dispersijos apskaičiavimo veiksmai yra tokie:
1 žingsnis: Apskaičiuokite stebėjimo vidurkį pagal formulę (vidurkis = stebėjimų suma / stebėjimų skaičius)
2 žingsnis: Apskaičiuokite duomenų reikšmių skirtumus kvadratu nuo vidurkio. (Duomenų vertė – vidurkis)2
3 veiksmas: Apskaičiuokite duotųjų reikšmių skirtumų kvadratu vidurkį, kuris vadinamas duomenų rinkinio dispersija.
(Nukrypimas = skirtumų kvadratu suma / stebėjimų skaičius)
Dispersija ir standartinis nuokrypis
Variacija ir Standartinis nuokrypis abu yra centrinės tendencijos matai, kurie naudojami mums pasakyti apie tai, kiek duomenų rinkinio reikšmės nukrypsta nuo centrinės arba vidutinės duomenų rinkinio reikšmės.
Tarp bet kurio duomenų rinkinio dispersijos ir standartinio nuokrypio yra aiškus ryšys.
Nuokrypis = (standartinis nuokrypis) 2
Nuokrypis apibrėžiamas kaip standartinio nuokrypio kvadratas, t. y., paėmus bet kurios duomenų grupės standartinio nuokrypio kvadratą, gauname to duomenų rinkinio dispersiją. dispersija apibrėžiama naudojant simbolį p 2 kadangi p naudojamas duomenų rinkinio standartiniam nuokrypiui apibrėžti. Duomenų rinkinio dispersija išreiškiama kvadratiniais vienetais, o standartinis duomenų rinkinio nuokrypis išreiškiamas vienetu, panašiu į duomenų rinkinio vidurkį.
Sužinokite daugiau: Dispersija ir standartinis nuokrypis
Binomialinio skirstinio dispersija
Binominis pasiskirstymas yra diskrečiųjų tikimybių skirstinys, nurodantis teigiamų rezultatų skaičių binominiame eksperimente, atliktame n kartų. Binominio eksperimento rezultatas yra 0 arba 1, t. y. teigiamas arba neigiamas.
Atliekant binominį eksperimentą n bandymus ir kur pateikiama kiekvieno bandymo tikimybė p , tada dvinario skirstinio dispersija pateikiama naudojant
p 2 = np (1 – p)
kur 'pvz.' apibrėžiamas kaip dvinario skirstinio reikšmių vidurkis.
Puasono pasiskirstymo dispersija
Nuodų platinimas apibrėžiamas kaip diskretusis tikimybių skirstinys, naudojamas apibrėžti „n“ įvykių, įvyksiančių per „x“ laikotarpį, tikimybę. Vidurkis Puasono skirstinyje apibrėžiamas simboliu l.
Puasono skirstinyje nurodytos duomenų rinkinio vidurkis ir dispersija yra lygūs. Puasono skirstinio dispersija pateikiama naudojant formulę,
p 2 = λ
Vienodo pasiskirstymo dispersija
Esant vienodai pasiskirstymui, tikimybių pasiskirstymo duomenys yra ištisiniai. Šių eksperimentų rezultatas yra intervale tarp konkrečios viršutinės ribos ir konkrečios apatinės ribos, todėl šie skirstiniai taip pat vadinami stačiakampiais pasiskirstymais. Jei viršutinė riba arba maksimali riba yra b o apatinė arba minimali riba yra a, tada vienodo skirstinio dispersija apskaičiuojama naudojant formulę,
p 2 = (1/12) (b – a) 2
Vienodo pasiskirstymo vidurkis pateikiamas naudojant formulę,
Vidurkis = (b + a) / 2
kur,
- b yra viršutinė vienodo pasiskirstymo riba
- a yra tolygaus pasiskirstymo apatinė riba
Dispersija ir kovariacija
Duomenų rinkinio dispersija apibrėžia visų duomenų rinkinio reikšmių nepastovumą duomenų rinkinio vidutinės vertės atžvilgiu. Kovariacija nurodo, kaip atsitiktiniai dydžiai yra susiję vienas su kitu, ir nurodo, kaip vieno kintamojo pokytis veikia kitų kintamųjų pokytį.
Kovariacija gali būti teigiama arba neigiama, teigiama kovariacija reiškia, kad abu kintamieji juda ta pačia kryptimi vidutinės vertės atžvilgiu, o neigiama kovariacija reiškia, kad abu kintamieji juda priešingomis kryptimis vidutinės vertės atžvilgiu.
Dviejų atsitiktinių dydžių x ir y atveju, kur x yra priklausomasis kintamasis, o y yra nepriklausomas kintamasis, kovariacija apskaičiuojama naudojant formulę, nurodytą toliau pateiktame paveikslėlyje.

latekso sąrašai
Sklaidos ypatybės
Variantas plačiai naudojamas matematikoje, statistikoje ir kitose mokslo šakose įvairiems tikslams. Dispersija turi įvairių savybių, kurios plačiai naudojamos sprendžiant įvairias problemas. Kai kurios pagrindinės dispersijos savybės yra
- Duomenų rinkinio dispersija yra neneigiamas dydis, o nulinė dispersijos reikšmė reiškia, kad visos duomenų rinkinio reikšmės yra lygios.
- Didesnė dispersijos reikšmė rodo, kad visos duomenų rinkinio duomenų reikšmės yra plačiai išsklaidytos, t. y. jos yra toli nuo duomenų rinkinio vidutinės reikšmės.
- Mažesnė dispersijos reikšmė rodo, kad visos duomenų rinkinio duomenų reikšmės yra arti viena kitos, t. y. jos yra labai artimos vidutinei duomenų rinkinio vertei.
Bet kokiai pastoviai „c“
- Var(x + c) = Var(x)
kur x yra atsitiktinis kintamasis
- Var(cx) = c2
kur x yra atsitiktinis kintamasis
Taip pat, jei a ir b yra pastovioji vertė ir x tada yra atsitiktinis kintamasis,
- Var(ax + b) = a2
Nepriklausomiems kintamiesiems x1, x2, x3…,xnMes tai žinome,
- Kur (x1+ x2+……+ xn) = Var(x1) + Kur(x2) +……..+Kur(xn)
Žmonės taip pat skaito:
- Vidutiniškai
- Režimas
- Skirtumas tarp dispersijos ir standartinio nuokrypio
Variacijos formulės pavyzdžiai
1 pavyzdys: Apskaičiuokite imties duomenų dispersiją: 7, 11, 15, 19, 24.
Sprendimas:
Turime duomenis 7, 11, 15, 19, 24
Raskite duomenų vidurkį.
x̄ = (7 + 11 + 15 + 19 + 24)/5
= 76/5
= 15,2Naudodami dispersijos formulę gauname,
p2= ∑ (xi– x̄)2/(n – 1)
= (67,24 + 17,64 + 0,04 + 14,44 + 77,44) / (5 – 1)
= 176,8/4
= 44,2
2 pavyzdys: Apskaičiuokite stebėjimų skaičių, jei duomenų dispersija yra 12, o duomenų skirtumų kvadratu suma nuo vidurkio yra 156.
Sprendimas:
Mes turime,
(xi– x̄)2= 156
p2= 12
Naudodami dispersijos formulę gauname,
p2= ∑ (xi– x̄)2/n
12 = 156/n
n = 156/12
n = 13
3 pavyzdys: Apskaičiuokite pateiktų duomenų dispersiją
| xi | fi |
|---|---|
| 10 | 1 |
| 4 | 3 |
| 6 | 5 |
| 8 | 1 |
Sprendimas:
Vidurkis (x̄) = ∑(fixi)/∑(fi)
= (10 × 1 + 4 × 3 + 6 × 5 + 8 × 1) / (1 + 3 + 5 + 1)
= 60/10 = 6n = ∑(fi) = 1+3+5+1 = 10
xi
fi
fixi
(xi– x̄)
(xi– x̄)2
fi(xi– x̄)2
10 1 10 4 16 16 4 3 12 -2 4 12 6 5 30 0 0 0 8 1 8 2 4 8 Dabar
p 2 = (∑ i n f i (x i – x̄) 2 /n)
= [(16 + 12 + 0 +8)/10]
= 3,6Dispersija (σ2) = 3,6
4 pavyzdys: Raskite šios duomenų lentelės dispersiją
| Klasė | Dažnis |
|---|---|
| 0-10 | 3 |
| 10-20 | 6 |
| 20-30 | 4 |
| 30-40 | 2 |
| 40-50 | 1 |
Sprendimas:
Klasė
Xi
fi
f × Xi
Xi – μ
(Xi – μ)2
f×(Xi – μ)2
0-10
5
3
penkiolika
- penkiolika
225
675
10-20
penkiolika
6
90
-5
25
150
20-30
25
4
100
5
25
100
30-40
35
2
70
penkiolika
225
450
40-50
Keturi
1
Keturi
25
625
625
Iš viso
16
320
2000 m
Vidurkis (μ) = ∑(fi xi)/∑(fi)
= 320/16 = 20p 2 = (∑ i n f i (x i – m) 2 /n)
= [(2000)/(16)]
= (125)Pateikto duomenų rinkinio dispersija yra 125.
Santrauka – dispersija
Dispersija yra statistinis matas, parodantis, kiek duomenų rinkinio reikšmės skiriasi nuo vidurkio. Tai padeda mums suprasti duomenų taškų sklaidą arba sklaidą. Yra du pagrindiniai dispersijos tipai: populiacijos dispersija, kuri matuoja, kaip duomenų taškai pasiskirsto visoje populiacijoje, ir imties dispersija, kuri matuoja, kaip duomenų taškai pasiskirsto imtyje. Variacija žymima σ² ir yra standartinio nuokrypio kvadratas. Norėdami apskaičiuoti dispersiją, suraskite duomenų vidurkį, atimkite vidurkį iš kiekvieno duomenų taško, padalykite skirtumus kvadratu ir suvidurkite šiuos kvadratinius skirtumus. Skirtumas yra svarbus, nes padeda suprasti duomenų rinkinio kintamumą. Didelė dispersija rodo, kad duomenų taškai pasiskirstę plačiai, o maža dispersija rodo, kad jie artimi vidurkiui. Variacija visada yra neneigiama, nes ji apima skirtumus kvadratu.
DUK apie dispersiją
Kas yra statistikos dispersija?
Dispersija apibrėžiama kaip duomenų rinkinio reikšmių sklaida duomenų rinkinio vidutinės vertės atžvilgiu. Duomenų rinkinio dispersija nurodo, kiek tam tikro duomenų rinkinio reikšmės skiriasi nuo vidutinės vertės.
Kas yra dispersijos simbolis?
Mes naudojame simbolius σ2, s2 ir Var(x), kad reikštų duomenų rinkinio dispersiją.
Kas yra dispersijos formulė?
Duomenų rinkinio dispersija apskaičiuojama pagal formulę,
p 2 = E[( X – m ) 2 ]
enum tostring java
Ką sako „Variance“?
Sklaida naudojama norint nustatyti duomenų sklaidos mastą, t. y. ji nurodo, kaip duomenų rinkinio reikšmės pasiskirsto vidutinės vertės atžvilgiu. Didesnės dispersijos vertės reikšmės yra plačiai paskirstytos vidutinės vertės atžvilgiu, o mažesnės dispersijos vertės reikšmės yra labai paskirstytos vidutinės vertės atžvilgiu.
Koks yra dispersijos ir standartinio nuokrypio santykis?
Pateiktam duomenų rinkiniui duomenų rinkinio dispersija yra to duomenų rinkinio standartinio nuokrypio kvadratas. Šis santykis išreiškiamas kaip
Nuokrypis = (standartinis nuokrypis) 2
Kaip apskaičiuoti dispersiją?
Norėdami apskaičiuoti dispersiją, pirmiausia turite rasti duomenų rinkinio vidurkį (vidurkį). Tada iš kiekvieno duomenų taško atimkite vidurkį ir rezultatą kvadratuokite. Galiausiai, vidutinis šių skirtumų kvadratas.
Kodėl dispersija yra svarbi?
Skirtumas yra labai svarbus norint suprasti duomenų pasiskirstymą duomenų rinkinyje. Tai padeda nustatyti, kaip duomenų taškai pasiskirsto iš vidutinės vertės, nurodant duomenų kintamumą arba nuoseklumą.
Koks skirtumas tarp dispersijos ir standartinio nuokrypio?
Nors ir dispersija, ir standartinis nuokrypis matuoja duomenų sklaidą, standartinis nuokrypis yra kvadratinė dispersijos šaknis. Standartinis nuokrypis išreiškiamas tais pačiais vienetais kaip ir duomenys, todėl jį lengviau interpretuoti nurodant skirtumą.
Ar dispersija gali būti neigiama?
Ne, dispersija negali būti neigiama. Kadangi ji apskaičiuojama kaip kvadratinių skirtumų vidurkis nuo vidurkio, gauta vertė visada yra neneigiama.