KAIP NAUDOTI LM() FUNKCIJĄ R, KAD ATITIKTŲ TIESINIUS MODELIUS?

Šiame straipsnyje sužinosime, kaip naudoti funkciją lm() norint pritaikyti linijinius modelius R programavimo kalboje.

Nežinomo kintamojo vertei numatyti, remiantis nepriklausomais kintamaisiais, naudojamas tiesinis modelis. Jis dažniausiai naudojamas norint išsiaiškinti ryšį tarp kintamųjų ir prognozavimo. Funkcija lm() naudojama linijiniams modeliams pritaikyti duomenų rėmams R kalboje. Jis gali būti naudojamas atliekant regresiją, vieno sluoksnio dispersijos analizę ir kovariacijos analizę, kad būtų galima numatyti vertę, atitinkančią duomenis, kurių nėra duomenų rėmelyje. Tai labai padeda nuspėti nekilnojamojo turto kainą, prognozuoti orus ir pan.

Norėdami pritaikyti linijinį modelį R kalboje, naudodami lm() funkcija, pirmiausia naudojame funkciją data.frame(), kad sukurtume pavyzdinį duomenų rėmelį, kuriame būtų verčių, kurios turi būti pritaikytos tiesiniam modeliui naudojant regresijos funkciją. Tada mes naudojame funkciją lm(), kad pritaikytume tam tikrą funkciją tam tikram duomenų rėmui.

Sintaksė:

lm(fiting_formula, dataframe )

Parametras:

fitting_formula: nustato tiesinio modelio formulę. dataframe: nustato duomenų rėmelio, kuriame yra duomenys, pavadinimą.

Tada galime naudoti funkciją summary() norėdami peržiūrėti linijinio modelio santrauką. Funkcija summary() interpretuoja svarbiausias statistines reikšmes tiesinio modelio analizei.

mini įrankių juosta Excel

Sintaksė:

santrauka (tiesinis_modelis)

Santraukoje yra ši pagrindinė informacija:

Likutinė standartinė klaida: nustato standartinį paklaidos nuokrypį, kai kvadratinė dispersijos šaknis atima n atėmus 1 + # susijusių kintamųjų, o ne dalija iš n-1. Keli R kvadratai: nustato, kaip jūsų modelis atitinka duomenis. Koreguotas R kvadratas: normalizuoja kelis R kvadratus, atsižvelgdami į tai, kiek pavyzdžių turite ir kiek kintamųjų naudojate. F-Statistic: yra visuotinis testas, kuris patikrina, ar bent vienas iš jūsų koeficientų yra nulis.

Pavyzdys: Pavyzdys, rodantis funkcijos lm() naudojimą.

R

# sample data frame> df <->data.frame>( x=>c>(1,2,3,4,5),> >y=>c>(1,5,8,15,26))> > # fit linear model> linear_model <->lm>(y ~ x^2, data=df)> > # view summary of linear model> summary>(linear_model)>

Išvestis:

Skambinti:

lm(formulė = y ~ x^2, duomenys = df)

Likučiai:

1 2 3 4 5

2.000e+00 5.329e-15 -3.000e+00 -2.000e+00 3.000e+00

Koeficientai:

Įvertinti Std. Klaidos t reikšmė Pr(>|t|)

(Pertrauka) -7,0000 3,0876 -2,267 0,10821

x 6,0000 0,9309 6,445 0,00757 **

—

Signif. kodai: 0 ‘***’ 0,001 ‘**’ 0,01 ‘*’ 0,05 ‘.’ 0,1 ‘’ 1

Likutinė standartinė paklaida: 2,944 esant 3 laisvės laipsniams

Keletas R kvadratas: 0,9326, pakoreguotas R kvadratas: 0,9102

F statistika: 41,54 1 ir 3 DF, p reikšmė: 0,007575

Diagnostiniai sklypai

Diagnostinės diagramos padeda mums pamatyti ryšį tarp skirtingų modelio statistinių reikšmių. Tai padeda mums analizuoti nuokrypių mastą ir pritaikyto modelio efektyvumą. Norėdami peržiūrėti linijinio modelio diagnostinius grafikus, naudojame funkciją plot() R kalboje.

Sintaksė:

sklypas (tiesinis_modelis)

Pavyzdys: Aukščiau pateikto linijinio modelio diagnostikos diagramos.

R

# sample data frame> df <->data.frame>( x=>c>(1,2,3,4,5),> >y=>c>(1,5,8,15,26))> > # fit linear model> linear_model <->lm>(y ~ x^2, data=df)> > # view diagnostic plot> plot>(linear_model)>

Išvestis:

Ploting Linijinis modelis

Galime nubraižyti aukščiau pateiktą linijinį modelį, kad jį gerai vizualizuotume naudodami abline () metodą. Pirmiausia nubraižome duomenų taškų sklaidos diagramą, o tada perdengiame ją tiesinio modelio abline diagrama, naudodami funkciją abline().

Sintaksė:

sklypas (df$x, df$y)
datų skirtumas Excel

abline (tiesinis_modelis)

Pavyzdys: Braižymo tiesinis modelis

R

eilutė į tarpt

# sample data frame> df <->data.frame>( x=>c>(1,2,3,4,5),> >y=>c>(1,5,8,15,26))> > # fit linear model> linear_model <->lm>(y ~ x^2, data=df)> > # Plot abline plot> plot>( df$x, df$y )> abline>( linear_model)>

Išvestis:

Numatykite nežinomų duomenų taškų reikšmes naudodami pritaikytą modelį

Norėdami numatyti naujų įvesties vertes, naudodami aukščiau pateiktą linijinį modelį, naudojame prognozės () funkciją. Funkcija numatyti () paima modelį ir duomenų rėmelį su nežinomais duomenų taškais ir numato kiekvieno duomenų taško vertę pagal pritaikytą modelį.

Sintaksė:

numatyti (modelis, duomenys)

Parametras:

modelis: nustato tiesinį modelį. duomenys: nustato duomenų rėmelį su nežinomais duomenų taškais.

Pavyzdys: Naujų įvesties numatymas

R

# sample data frame> df <->data.frame>( x=>c>(1,2,3,4,5),> >y=>c>(1,5,8,15,26))> > # fit linear model> linear_model <->lm>(y ~ x^2, data=df)> > # Predict values> predict>( linear_model, newdata =>data.frame>(x=>c>(15,16,17)) )>

Išvestis:

1 2 3 83 89 95>

TechCodeview

R

Diagnostiniai sklypai

R

Ploting Linijinis modelis

R

Numatykite nežinomų duomenų taškų reikšmes naudodami pritaikytą modelį

R