logo

Suprasti hipotezių testavimą

Hipotezių tikrinimas apima prielaidų apie populiacijos parametrų formulavimą remiantis imties statistika ir griežtą šių prielaidų įvertinimą remiantis empiriniais įrodymais. Šiame straipsnyje paaiškinama hipotezių tikrinimo reikšmė ir svarbiausi proceso žingsniai.

Kas yra hipotezės tikrinimas?

Hipotezių tikrinimas yra statistinis metodas, naudojamas statistiniam sprendimui priimti naudojant eksperimentinius duomenis. Hipotezių tikrinimas iš esmės yra prielaida, kurią darome apie populiacijos parametrą. Jis įvertina du vienas kitą paneigiančius teiginius apie populiaciją, kad nustatytų, kurį teiginį geriausiai patvirtina imties duomenys.



Pavyzdys: Sakote, kad vidutinis ūgis klasėje yra 30 arba berniukas yra aukštesnis už mergaitę. Visa tai yra prielaida, kurią darome, ir mums reikia tam tikro statistinio būdo tai įrodyti. Mums reikia tam tikros matematinės išvados, kad ir ką manytume, kad tai tiesa.

Hipotezių apibrėžimas

  • Nulinė hipotezė (H 0 ): Statistikoje nulinė hipotezė yra bendras teiginys arba numatytoji pozicija, kad nėra ryšio tarp dviejų išmatuotų atvejų arba ryšio tarp grupių. Kitaip tariant, tai yra pagrindinė prielaida arba padaryta remiantis žiniomis apie problemą.
    Pavyzdys : Vidutinė įmonės produkcija yra 50 vienetų per dieną H0: mu= 50.
  • Alternatyvi hipotezė (H 1 ): Alternatyvi hipotezė yra hipotezė, naudojama hipotezės tikrinimui, kuri prieštarauja nulinei hipotezei.
    Pavyzdys: įmonės produkcija nėra lygi 50 vienetų per dieną, ty H1: mu 
penkiasdešimt.

Pagrindinės hipotezių tikrinimo sąlygos

  • Reikšmingumo lygis : Tai reiškia reikšmingumo laipsnį, kuriuo mes priimame arba atmetame nulinę hipotezę. 100% tikslumo hipotezei priimti neįmanoma, todėl mes pasirenkame reikšmingumo lygį, kuris paprastai yra 5%. Paprastai tai žymima alphair paprastai tai yra 0,05 arba 5 %, o tai reiškia, kad jūsų išvestis turėtų būti 95 % įsitikinusi, kad kiekviename mėginyje gautumėte panašų rezultatą.
  • P vertė: The P reikšmė , arba apskaičiuota tikimybė, yra tikimybė rasti pastebėtus / kraštutinius rezultatus, kai tyrimo pateiktos problemos nulinė hipotezė (H0) yra teisinga. Jei jūsų P reikšmė yra mažesnė už pasirinktą reikšmingumo lygį, tuomet jūs atmetate nulinę hipotezę, t. y. sutinkate, kad jūsų imtis teigia, kad palaiko alternatyvią hipotezę.
  • Bandymų statistika: Testo statistika yra skaitinė vertė, apskaičiuota iš imties duomenų hipotezės testo metu, naudojama norint nustatyti, ar atmesti nulinę hipotezę. Jis lyginamas su kritine reikšme arba p reikšme, kad būtų priimti sprendimai dėl stebimų rezultatų statistinio reikšmingumo.
  • Kritinė vertė : kritinė reikšmė statistikoje yra slenkstis arba ribinis taškas, naudojamas norint nustatyti, ar hipotezės teste atmesti nulinę hipotezę.
  • Laisvės laipsniai: Laisvės laipsniai yra susiję su kintamumu arba laisve, kurią žmogus turi vertindamas parametrą. Laisvės laipsniai yra susiję su imties dydžiu ir nustato formą.

Kodėl mes naudojame hipotezės testavimą?

Hipotezių tikrinimas yra svarbi statistikos procedūra. Hipotezių tikrinimo metu įvertinami du vienas kitą paneigiantys populiacijos teiginiai, siekiant nustatyti, kuris teiginys labiausiai pagrįstas imties duomenimis. Kai sakome, kad išvados yra statistiškai reikšmingos dėl hipotezės tikrinimo.

Vienauodegis ir dviuodegis testas

Vienas ribotas testas sutelkiamas į vieną kryptį, didesnę arba mažesnę nei nurodyta vertė. Naudojame vienpusį testą, kai yra aiškus lūkestis, pagrįstas ankstesnėmis žiniomis ar teorija. Kritinė sritis yra tik vienoje pasiskirstymo kreivės pusėje. Jei mėginys patenka į šią kritinę sritį, nulinė hipotezė atmetama alternatyvios hipotezės naudai.



Vienuodegis testas

Yra dviejų tipų vienpusis testas:

  • Kairiosios pusės (kairiosios pusės) testas: Alternatyvi hipotezė teigia, kad tikroji parametro reikšmė yra mažesnė už nulinę hipotezę. Pavyzdys: H0: mu geq 50ir H1:
  • ir H1: mu>50

Dviejų uodegų testas

Atliekant dviejų krypčių testą atsižvelgiama į abi kryptis, didesnes ir mažesnes už nurodytą vertę. Naudojame dvipusį testą, kai nėra konkrečios krypties lūkesčių ir norime aptikti bet kokį reikšmingą skirtumą.

Pavyzdys: H0: in =50 ir H1: mu 
eq 50



Kas yra 1 ir 2 tipo klaidos atliekant hipotezės testavimą?

Tikrinant hipotezes, I ir II tipo klaidos yra dvi galimos klaidos, kurias mokslininkai gali padaryti darydami išvadas apie populiaciją, pagrįstą duomenų imtimi. Šios klaidos yra susijusios su sprendimais, priimtais dėl nulinės hipotezės ir alternatyvios hipotezės.

  • I tipo klaida: Kai atmetame nulinę hipotezę, nors ta hipotezė buvo teisinga. I tipo klaida žymima alfa( alpha).
  • II tipo klaidos: Kai priimame nulinę hipotezę, bet ji klaidinga. II tipo klaidos žymimos beta ( eta).


Nulinė hipotezė yra teisinga

Nulinė hipotezė yra klaidinga

Nulinė hipotezė yra teisinga (priimti)

Teisingas sprendimas

II tipo klaida (klaidingai neigiamas)

Alternatyvi hipotezė yra teisinga (atmesti)

I tipo klaida (klaidingai teigiama)

Teisingas sprendimas

Kaip veikia hipotezių tikrinimas?

1 veiksmas: apibrėžkite nulinę ir alternatyvią hipotezę

Nurodykite nulinę hipotezę ( H_0), nerodo jokio poveikio, ir alternatyvi hipotezė ( H_1), nurodant poveikį ar skirtumą.

Pirmiausia nustatome problemą, apie kurią norime daryti prielaidą, turėdami omenyje, kad mūsų prielaidos turėtų prieštarauti viena kitai, darant prielaidą, kad Paprastai paskirstomi duomenys.

2 veiksmas – pasirinkite reikšmingumo lygį

Pasirinkite reikšmingumo lygį ( alpha), paprastai 0,05, siekiant nustatyti nulinės hipotezės atmetimo slenkstį. Tai patvirtina mūsų hipotezės testą ir užtikrina, kad turime pakankamai duomenų savo teiginiams pagrįsti. Paprastai savo reikšmingumo lygį nustatome prieš testą. The p reikšmė yra kriterijus, naudojamas mūsų reikšmingumo vertei apskaičiuoti.

3 veiksmas Rinkti ir analizuoti duomenis.

Stebėdami arba eksperimentuodami surinkite atitinkamus duomenis. Išanalizuokite duomenis naudodami tinkamus statistinius metodus, kad gautumėte bandymo statistiką.

4 veiksmas – apskaičiuokite testo statistiką

Šiame etape įvertinami testų duomenys, pagal duomenų charakteristikas ieškome įvairių balų. Testo statistikos pasirinkimas priklauso nuo atliekamo hipotezės testo tipo.

Yra įvairių hipotezių testų, kurių kiekvienas tinka įvairiems tikslams apskaičiuoti mūsų testą. Tai gali būti a Z testas , Chi kvadratas , T testas , ir taip toliau.

  1. Z testas : Jei žinomi populiacijos vidurkiai ir standartiniai nuokrypiai. Paprastai naudojama Z statistika.
  2. t testas : Jei populiacijos standartiniai nuokrypiai nežinomi. ir imties dydis yra mažesnis nei t-testo statistika yra tinkamesnė.
  3. Chi kvadrato testas : Chi kvadrato testas naudojamas kategoriškiems duomenims arba nepriklausomumui tikrinti nenumatytų atvejų lentelėse
  4. F testas : F testas dažnai naudojamas dispersijos analizėje (ANOVA), siekiant palyginti dispersijas arba patikrinti kelių grupių vidurkių lygybę.

Turime mažesnį duomenų rinkinį, todėl T testas yra tinkamesnis mūsų hipotezei patikrinti.

T-statistika yra skirtumo tarp dviejų grupių vidurkių matas, palyginti su kintamumu kiekvienoje grupėje. Jis apskaičiuojamas kaip skirtumas tarp imties vidurkių, padalytas iš skirtumo standartinės paklaidos. Jis taip pat žinomas kaip t vertė arba t balas.

5 veiksmas – testų statistikos palyginimas:

Šiame etape mes nusprendžiame, kur turėtume priimti nulinę hipotezę arba atmesti nulinę hipotezę. Yra du būdai nuspręsti, kur priimti ar atmesti nulinę hipotezę.

A metodas: Kritinių verčių naudojimas

Palyginus testo statistiką ir kritinę vertę, kurią turime lentelėje,

  • Jei testo statistika>kritinė reikšmė: atmeskite nulinę hipotezę.
  • Jei testo statistika ≤ kritinė reikšmė: nepavyksta atmesti nulinės hipotezės.

Pastaba: Kritinės reikšmės yra iš anksto nustatytos slenkstinės vertės, kurios naudojamos priimant sprendimą hipotezės tikrinimo metu. Siekiant nustatyti kritines vertes hipotezės tikrinimui paprastai remiamės statistinio pasiskirstymo lentele , pvz., normaliojo pasiskirstymo arba t pasiskirstymo lentelėmis, pagrįstomis.

B metodas: P reikšmių naudojimas

Taip pat galime padaryti išvadą naudodami p reikšmę,

  • Jei p reikšmė yra mažesnė arba lygi reikšmingumo lygiui, t. y. ( pleqalpha), jūs atmetate nulinę hipotezę. Tai rodo, kad pastebėti rezultatai greičiausiai nebuvo atsitiktinai, o tai rodo alternatyvią hipotezę.
  • Jei p reikšmė yra didesnė už reikšmingumo lygį, t. y. ( pgeq alpha), jums nepavyks atmesti nulinės hipotezės. Tai rodo, kad pastebėti rezultatai atitinka tai, ko būtų galima tikėtis pagal nulinę hipotezę.

Pastaba : p reikšmė yra tikimybė, kad testo statistika bus tokia ekstremali arba ekstremalesnė už tą, kuri buvo stebima imtyje, darant prielaidą, kad nulinė hipotezė yra teisinga. Siekiant nustatyti p reikšmė hipotezės tikrinimui paprastai remiamės statistinio pasiskirstymo lentele , pvz., normaliojo pasiskirstymo arba t pasiskirstymo lentelėmis, pagrįstomis.

7 veiksmas – interpretuokite rezultatus

Galiausiai galime užbaigti savo eksperimentą naudodami A arba B metodą.

Testo statistikos skaičiavimas

Norėdami patvirtinti mūsų hipotezę apie populiacijos parametrą, kurį naudojame statistines funkcijas . Mes naudojame z balą, p reikšmę ir reikšmingumo lygį (alfa), kad patvirtintume savo hipotezę įprastai paskirstytus duomenis .

1. Z statistika:

Kai žinomi populiacijos vidurkiai ir standartiniai nuokrypiai.

z = frac{ar{x} – mu}{frac{sigma}{sqrt{n}}}

kur,

  • ar{x}yra imties vidurkis,
  • μ reiškia gyventojų vidurkį,
  • σ yra standartinis nuokrypis
  • ir n yra imties dydis.

2. T-Statistika

T testas naudojamas, kai n <30,

t-statistinis skaičiavimas pateikiamas taip:

t=frac{x̄-Μ}{s/sqrt{n}}

kur,

  • t = t balas,
  • x̄ = imties vidurkis
  • μ = gyventojų vidurkis,
  • s = mėginio standartinis nuokrypis,
  • n = imties dydis

3. Chi kvadrato testas

Chi kvadrato nepriklausomumo kategorijų duomenų testas (neįprastai paskirstytas), naudojant:

chi^2 = sum frac{(O_{ij} - E_{ij})^2}{E_{ij}}

kur,

  • O_{ij}yra stebimas dažnis ląstelėje {ij}
  • i,j yra atitinkamai eilučių ir stulpelių indeksas.
  • E_{ij}yra numatomas dažnis ląstelėje {ij}, apskaičiuojamas taip:
    frac{{	ext{{Eilutė iš viso}} 	imes 	ext{{Stulpelis iš viso}}}}{{	ext{{Iš viso stebėjimų}}}}

Realaus gyvenimo hipotezės tikrinimo pavyzdys

Panagrinėkime hipotezių tikrinimą naudodami dvi realias gyvenimo situacijas,

A atvejis: D Ar naujas vaistas turi įtakos kraujospūdžiui?

Įsivaizduokite, kad farmacijos įmonė sukūrė naują vaistą, kuris, jų nuomone, gali veiksmingai sumažinti hipertenzija sergančių pacientų kraujospūdį. Prieš pateikdami vaistą į rinką, jie turi atlikti tyrimą, kad įvertintų jo poveikį kraujospūdžiui.

Duomenys:

styginių formatu
  • Prieš gydymą: 120, 122, 118, 130, 125, 128, 115, 121, 123, 119
  • Po gydymo: 115, 120, 112, 128, 122, 125, 110, 117, 119, 114

1 žingsnis : Apibrėžkite hipotezę

  • Nulinė hipotezė : (H0)Naujasis vaistas neturi įtakos kraujospūdžiui.
  • Alternatyvi hipotezė : (H1)Naujasis vaistas turi įtakos kraujospūdžiui.

2 žingsnis: Apibrėžkite reikšmingumo lygį

Apsvarstykite reikšmingumo lygį 0,05, o tai rodo nulinės hipotezės atmetimą.

Jei įrodymai rodo, kad tikimybė, kad rezultatai bus pastebėti dėl atsitiktinių variacijų, yra mažesnė nei 5%.

3 veiksmas : Apskaičiuokite testo statistiką

Naudojant suporuotas T testas analizuokite duomenis, kad gautumėte testo statistiką ir p reikšmę.

Tyrimo statistika (pvz., T-statistika) apskaičiuojama pagal kraujospūdžio matavimų skirtumus prieš ir po gydymo.

t = m/(s/√n)

Kur:

  • m = skirtumo vidurkis t.y X po, X prieš
  • s = standartinis skirtumo nuokrypis (d) t.y d i = X po, i X prieš,
  • n = mėginio dydis,

tada m = -3,9, s = 1,8 ir n = 10

mes apskaičiuojame , T statistiką = -9 pagal porinio t testo formulę

4 veiksmas: suraskite p reikšmę

Apskaičiuota t-statistika yra -9 ir laisvės laipsniai df = 9, p reikšmę galite rasti naudodami statistinę programinę įrangą arba t pasiskirstymo lentelę.

taigi, p vertė = 8,538051223166285e-06

5 veiksmas: rezultatas

  • Jei p reikšmė yra mažesnė arba lygi 0,05, tyrėjai atmeta nulinę hipotezę.
  • Jei p reikšmė yra didesnė nei 0,05, jie negali atmesti nulinės hipotezės.

Išvada: Kadangi p reikšmė (8,538051223166285e-06) yra mažesnė už reikšmingumo lygį (0,05), tyrėjai atmeta nulinę hipotezę. Yra statistiškai reikšmingų įrodymų, kad vidutinis kraujospūdis prieš ir po gydymo nauju vaistu skiriasi.

Python hipotezių tikrinimo įgyvendinimas

Sukurkime hipotezės testavimą su python, kai tikriname, ar naujas vaistas veikia kraujospūdį. Šiame pavyzdyje naudosime suporuotą T testą. Mes naudosime scipy.stats> biblioteka T testui.

Mes įgyvendinsime savo pirmąją realaus gyvenimo problemą per python,

Python3

import> numpy as np> from> scipy>import> stats> # Data> before_treatment>=> np.array([>120>,>122>,>118>,>130>,>125>,>128>,>115>,>121>,>123>,>119>])> after_treatment>=> np.array([>115>,>120>,>112>,>128>,>122>,>125>,>110>,>117>,>119>,>114>])> # Step 1: Null and Alternate Hypotheses> # Null Hypothesis: The new drug has no effect on blood pressure.> # Alternate Hypothesis: The new drug has an effect on blood pressure.> null_hypothesis>=> 'The new drug has no effect on blood pressure.'> alternate_hypothesis>=> 'The new drug has an effect on blood pressure.'> # Step 2: Significance Level> alpha>=> 0.05> # Step 3: Paired T-test> t_statistic, p_value>=> stats.ttest_rel(after_treatment, before_treatment)> # Step 4: Calculate T-statistic manually> m>=> np.mean(after_treatment>-> before_treatment)> s>=> np.std(after_treatment>-> before_treatment, ddof>=>1>)># using ddof=1 for sample standard deviation> n>=> len>(before_treatment)> t_statistic_manual>=> m>/> (s>/> np.sqrt(n))> # Step 5: Decision> if> p_value <>=> alpha:> >decision>=> 'Reject'> else>:> >decision>=> 'Fail to reject'> # Conclusion> if> decision>=>=> 'Reject'>:> >conclusion>=> 'There is statistically significant evidence that the average blood pressure before and after treatment with the new drug is different.'> else>:> >conclusion>=> 'There is insufficient evidence to claim a significant difference in average blood pressure before and after treatment with the new drug.'> # Display results> print>(>'T-statistic (from scipy):'>, t_statistic)> print>(>'P-value (from scipy):'>, p_value)> print>(>'T-statistic (calculated manually):'>, t_statistic_manual)> print>(f>'Decision: {decision} the null hypothesis at alpha={alpha}.'>)> print>(>'Conclusion:'>, conclusion)>
>
>

Išvestis:

T-statistic (from scipy): -9.0 P-value (from scipy): 8.538051223166285e-06 T-statistic (calculated manually): -9.0 Decision: Reject the null hypothesis at alpha=0.05. Conclusion: There is statistically significant evidence that the average blood pressure before and after treatment with the new drug is different.>

Aukščiau pateiktame pavyzdyje, atsižvelgiant į apytiksliai -9 T statistiką ir labai mažą p reikšmę, rezultatai rodo, kad nulinės hipotezės atmetimas yra tvirtas, kai reikšmingumo lygis yra 0,05.

  • Rezultatai rodo, kad naujas vaistas, gydymas ar intervencija turi reikšmingą poveikį kraujospūdžio mažinimui.
  • Neigiama T statistika rodo, kad vidutinis kraujospūdis po gydymo yra žymiai mažesnis nei numanomas populiacijos vidurkis prieš gydymą.

Byla B : Cholesterolio lygis populiacijoje

Duomenys: Paimamas 25 asmenų mėginys, išmatuojamas jų cholesterolio kiekis.

Cholesterolio kiekis (mg/dL): 205, 198, 210, 190, 215, 205, 200, 192, 198, 205, 198, 202, 208, 200, 205, 198, 200, 205, 198, 20, 5, 5, 20, 20 205, 210, 192, 205.

Populiacijų vidurkis = 200

Populiacijos standartinis nuokrypis (σ): 5 mg/dL (duota šiai problemai)

1 žingsnis: Apibrėžkite hipotezę

  • Nulinė hipotezė (H 0 ): Vidutinis cholesterolio kiekis populiacijoje yra 200 mg/dl.
  • Alternatyvi hipotezė (H 1 ): Vidutinis cholesterolio kiekis populiacijoje skiriasi nuo 200 mg/dl.

2 žingsnis: Apibrėžkite reikšmingumo lygį

Kadangi nuokrypio kryptis nenurodyta, darome prielaidą, kad yra dviejų krypčių bandymas ir, remiantis normaliojo pasiskirstymo lentele, kritinės reikšmės 0,05 (dviejų krypčių) reikšmingumo lygiui gali būti apskaičiuotos naudojant z lentelė ir yra maždaug -1,96 ir 1,96.

3 veiksmas : Apskaičiuokite testo statistiką

Testo statistika apskaičiuojama naudojant z formulę SU = (203,8–200) / (5 div sqrt{25})ir mes atitinkamai gauname, SU =2.039999999999992.

4 veiksmas: rezultatas

Kadangi absoliuti testo statistikos reikšmė (2,04) yra didesnė už kritinę reikšmę (1,96), nulinę hipotezę atmetame. Ir daryti išvadą, kad yra statistiškai reikšmingų įrodymų, kad vidutinis cholesterolio kiekis populiacijoje skiriasi nuo 200 mg/dl.

Python hipotezių tikrinimo įgyvendinimas

Python3

import> scipy.stats as stats> import> math> import> numpy as np> # Given data> sample_data>=> np.array(> >[>205>,>198>,>210>,>190>,>215>,>205>,>200>,>192>,>198>,>205>,>198>,>202>,>208>,>200>,>205>,>198>,>205>,>210>,>192>,>205>,>198>,>205>,>210>,>192>,>205>])> population_std_dev>=> 5> population_mean>=> 200> sample_size>=> len>(sample_data)> # Step 1: Define the Hypotheses> # Null Hypothesis (H0): The average cholesterol level in a population is 200 mg/dL.> # Alternate Hypothesis (H1): The average cholesterol level in a population is different from 200 mg/dL.> # Step 2: Define the Significance Level> alpha>=> 0.05> # Two-tailed test> # Critical values for a significance level of 0.05 (two-tailed)> critical_value_left>=> stats.norm.ppf(alpha>/>2>)> critical_value_right>=> ->critical_value_left> # Step 3: Compute the test statistic> sample_mean>=> sample_data.mean()> z_score>=> (sample_mean>-> population_mean)>/> > >(population_std_dev>/> math.sqrt(sample_size))> # Step 4: Result> # Check if the absolute value of the test statistic is greater than the critical values> if> abs>(z_score)>>>(>abs>(critical_value_left),>abs>(critical_value_right)):> >print>(>'Reject the null hypothesis.'>)> >print>(>'There is statistically significant evidence that the average cholesterol level in the population is different from 200 mg/dL.'>)> else>:> >print>(>'Fail to reject the null hypothesis.'>)> >print>(>'There is not enough evidence to conclude that the average cholesterol level in the population is different from 200 mg/dL.'>)>
>
>

Išvestis:

Reject the null hypothesis. There is statistically significant evidence that the average cholesterol level in the population is different from 200 mg/dL.>

Hipotezių tikrinimo apribojimai

  • Nors hipotezių tikrinimas yra naudingas metodas, jis nesuteikia išsamaus tiriamos temos suvokimo. Visiškai neatspindėdamas reiškinių sudėtingumo ar viso konteksto, jis koncentruojasi į tam tikras hipotezes ir statistinį reikšmingumą.
  • Hipotezių tikrinimo rezultatų tikslumas priklauso nuo turimų duomenų kokybės ir naudojamų statistinių metodų tinkamumo. Netikslūs duomenys arba blogai suformuluotos hipotezės gali lemti neteisingas išvadas.
  • Pasikliaudami tik hipotezių tikrinimu, analitikai gali nepastebėti reikšmingų duomenų modelių ar ryšių, kurių neapima konkrečios tikrinamos hipotezės. Šis apribojimas pabrėžia hipotezių tikrinimo su kitais analitiniais metodais svarbą.

Išvada

Hipotezių tikrinimas yra kertinis statistinės analizės akmuo, leidžiantis duomenų mokslininkams pereiti prie neapibrėžtumo ir padaryti patikimas išvadas iš imties duomenų. Sistemingai apibrėždami nulines ir alternatyvias hipotezes, pasirinkdami reikšmingumo lygius ir pasitelkę statistinius testus, mokslininkai gali įvertinti savo prielaidų pagrįstumą. Straipsnyje taip pat paaiškinamas esminis skirtumas tarp I ir II tipo klaidų, pateikiant visapusišką supratimą apie niuansuotą sprendimų priėmimo procesą, būdingą hipotezių tikrinimui. Realus pavyzdys, kai tiriamas naujo vaisto poveikis kraujospūdžiui naudojant suporuotą T testą, parodo praktinį šių principų taikymą, pabrėžiant statistinio griežtumo svarbą priimant duomenis pagrįstus sprendimus.

Dažnai užduodami klausimai (DUK)

1. Kokie yra 3 hipotezių tikrinimo tipai?

Yra trijų tipų hipotezių testai: dešinioji, kairioji ir dvipusė. Dešinysis testas įvertina, ar parametras yra didesnis, o kairiojo – jei mažesnis. Dviejų krypčių testai tikrina, ar nėra didesnių ar mažesnių nekrypčių skirtumų.

2. Kokie yra 4 hipotezių tikrinimo komponentai?

Nulinė hipotezė ( H_o): Nėra jokio poveikio ar skirtumo.

Alternatyvi hipotezė ( H_1): Egzistuoja poveikis arba skirtumas.

Reikšmingumo lygis ( alpha): Rizika atmesti nulinę hipotezę, kai ji teisinga (I tipo klaida).

Testo statistika: skaitinė reikšmė, atspindinti pastebėtus įrodymus prieš nulinę hipotezę.

3. Kas yra hipotezių tikrinimas ML?

Statistinis metodas mašininio mokymosi modelių veikimui ir pagrįstumui įvertinti. Tikrina konkrečias hipotezes apie modelio elgesį, pvz., ar savybės turi įtakos prognozėms, ar modelis gerai apibendrina nematomus duomenis.

4. Kuo skiriasi Pytest ir Python hipotezė?

„Pytest“ skirta bendrajai „Python“ kodo testavimo sistemai, o „Hypothesis“ yra nuosavybe pagrįsta „Python“ testavimo sistema, daugiausia dėmesio skiriant bandymų atvejų generavimui pagal nurodytas kodo savybes.