logo

Chi kvadrato testas R

The chi kvadrato testas nepriklausomumo įvertinimas, ar yra ryšys tarp dviejų kintamųjų kategorijų. Iš esmės yra dviejų tipų atsitiktiniai dydžiai ir jie suteikia dviejų tipų duomenis: skaitinius ir kategorinius. Į R programavimo kalba Chi kvadrato statistika naudojama norint ištirti, ar kategorinių kintamųjų skirstiniai skiriasi vienas nuo kito. Chi kvadrato testas taip pat naudingas lyginant dviejų (ar daugiau) nepriklausomų grupių kategoriškų atsakymų sutapimus arba skaičių.

R programavimo kalboje chi kvadrato testui atlikti naudojama funkcija chisq.test()> .



Sintaksė:

chisq.test(duomenys)

automatų teorija

Parametrai:



duomenis : duomenys yra lentelė, kurioje yra lentelės kintamųjų skaičiaus reikšmės.

Apklausos duomenis paimsime į MASS> biblioteka, kurioje pateikiami studentų apklausos duomenys.

R






# load the MASS package> library>(MASS)> print>(>str>(survey))>

>

eilė ir prioritetinė eilė Java

>

Išvestis:

'data.frame': 237 obs. of 12 variables:  $ Sex : Factor w/ 2 levels 'Female','Male': 1 2 2 2 2 1 2 1 2 2 ...  $ Wr.Hnd: num 18.5 19.5 18 18.8 20 18 17.7 17 20 18.5 ...  $ NW.Hnd: num 18 20.5 13.3 18.9 20 17.7 17.7 17.3 19.5 18.5 ...  $ W.Hnd : Factor w/ 2 levels 'Left','Right': 2 1 2 2 2 2 2 2 2 2 ...  $ Fold : Factor w/ 3 levels 'L on R','Neither',..: 3 3 1 3 2 1 1 3 3 3 ...  $ Pulse : int 92 104 87 NA 35 64 83 74 72 90 ...  $ Clap : Factor w/ 3 levels 'Left','Neither',..: 1 1 2 2 3 3 3 3 3 3 ...  $ Exer : Factor w/ 3 levels 'Freq','None',..: 3 2 2 2 3 3 1 1 3 3 ...  $ Smoke : Factor w/ 4 levels 'Heavy','Never',..: 2 4 3 2 2 2 2 2 2 2 ...  $ Height: num 173 178 NA 160 165 ...  $ M.I : Factor w/ 2 levels 'Imperial','Metric': 2 1 NA 2 2 1 1 2 2 2 ...  $ Age : num 18.2 17.6 16.9 20.3 23.7 ... NULL>

Aukščiau pateiktas rezultatas rodo, kad duomenų rinkinys turi daug faktorių kintamųjų, kurie gali būti laikomi kategoriniais kintamaisiais. Savo modelyje mes atsižvelgsime į kintamuosius Exer ir Rūkyti .Stulpelyje Smoke įrašomi mokinių rūkymo įpročiai, o stulpelyje Exer – jų mankštos lygis. Mūsų tikslas yra patikrinti hipotezę, ar studentų rūkymo įpročiai nepriklauso nuo jų mankštos lygio esant 0,05 reikšmingumo lygiui.

R




# Create a data frame from the main data set.> stu_data =>data.frame>(survey$Smoke,survey$Exer)> # Create a contingency table with the needed variables.> stu_data =>table>(survey$Smoke,survey$Exer)> > print>(stu_data)>

>

>

Išvestis:

 Freq None Some  Heavy 7 1 3  Never 87 18 84  Occas 12 3 4  Regul 9 1 7>

Ir galiausiai taikome chisq.test()> funkciją į nenumatytų atvejų lentelę stu_data.

R




python likusios dalies operatorius
# applying chisq.test() function> print>(>chisq.test>(stu_data))>

>

>

Išvestis:

 Pearson's Chi-squared test  data: stu_data X-squared = 5.4885, df = 6, p-value = 0.4828>

Kadangi p reikšmė 0,4828 yra didesnė už 0,05, darome išvadą, kad rūkymo įprotis nepriklauso nuo mokinio fizinio krūvio lygio, todėl tarp dviejų kintamųjų yra silpnas ryšys arba jo nėra. Visas R kodas pateikiamas žemiau.

lentynų šunys

Taigi, apibendrinant galima teigti, kad Chi kvadrato testą atlikti naudojant R yra labai paprasta. Šią užduotį galima atlikti naudojant chisq.test()> funkcija R.

Vizualizuokite Chi kvadrato testo duomenis

R




# Load required library> library>(MASS)> # Print structure of the survey dataset> print>(>str>(survey))> # Create a data frame for smoking and exercise columns> stu_data <->data.frame>(survey$Smoke, survey$Exer)> stu_data <->table>(survey$Smoke, survey$Exer)> # Print the table> print>(stu_data)> # Perform the Chi-Square Test> chi_result <->chisq.test>(stu_data)> print>(chi_result)> # Visualize the data with a bar plot> barplot>(stu_data, beside =>TRUE>, col =>c>(>'lightblue'>,>'lightgreen'>),> >main =>'Smoking Habits vs Exercise Levels'>,> >xlab =>'Exercise Level'>, ylab =>'Number of Students'>)> # Add legend separately> legend>(>'center'>, legend =>rownames>(stu_data), fill =>c>(>'lightblue'>,>'lightgreen'>))>

>

>

Išvestis:

gh

Chi kvadrato testas R

Šiame kode mes naudojameMASS>biblioteka, kad atliktų „apklausos“ duomenų rinkinio Chi kvadrato testą, sutelkiant dėmesį į ryšį tarp rūkymo įpročių ir fizinio krūvio.

Jis sukuria nenumatytų atvejų lentelę, atlieka statistinį testą ir vizualizuoja duomenis naudodamas juostos diagramą. Legenda pridedama atskirai viršutiniame kairiajame kampe, išskiriant skirtingus rūkymo įpročius skirtingomis spalvomis.

Kodeksu siekiama ištirti ir perduoti duomenų rinkinio rūkymo elgesio ir mankštos praktikos sąsajas.