Mašininio mokymosi hiperparametrai yra tie parametrai, kuriuos aiškiai apibrėžia vartotojas, norėdamas valdyti mokymosi procesą. Šie hiperparametrai naudojami modelio mokymuisi tobulinti, o jų reikšmės nustatomos prieš pradedant modelio mokymosi procesą.
Šioje temoje aptarsime vieną iš svarbiausių mašininio mokymosi sąvokų, ty hiperparametrus, jų pavyzdžius, hiperparametrų derinimą, hiperparametrų kategorijas, kuo hiperparametras skiriasi nuo mašininio mokymosi parametro? Tačiau prieš pradėdami pirmiausia supraskime hiperparametrą.
Kas yra hiperparametrai?
Mašininio mokymosi / giluminio mokymosi sistemoje modelis pavaizduotas jo parametrais. Priešingai, mokymo procesas apima geriausių / optimalių hiperparametrų, kuriuos naudoja mokymosi algoritmai, kad būtų pasiektas geriausias rezultatas. Taigi, kas yra šie hiperparametrai? Atsakymas yra, ' Hiperparametrai apibrėžiami kaip parametrai, kuriuos vartotojas aiškiai apibrėžia, kad galėtų valdyti mokymosi procesą.
Čia priešdėlis „hiper“ rodo, kad parametrai yra aukščiausio lygio parametrai, naudojami mokymosi procesui valdyti. Hiperparametro reikšmę pasirenka ir nustato mašininio mokymosi inžinierius, prieš mokymosi algoritmui pradėdamas treniruoti modelį. Vadinasi, jie yra išoriniai modeliui ir jų reikšmės negali būti keičiamos mokymo proceso metu .
laikotarpio raktas
Keletas mašininio mokymosi hiperparametrų pavyzdžių
- K kNN arba K artimiausio kaimyno algoritmas
- Neuroninio tinklo mokymosi greitis
- Traukinio ir bandymo padalijimo santykis
- Partijos dydis
- Epochų skaičius
- Filialai sprendimų medyje
- Klasterių skaičius klasterizacijos algoritme
Skirtumas tarp parametro ir hiperparametro?
Visada yra didelė painiava tarp parametrų ir hiperparametrų arba modelio hiperparametrų. Taigi, norėdami išspręsti šią painiavą, supraskime, kuo jie abu skiriasi ir kaip jie yra susiję vienas su kitu.
Modelio parametrai:
Modelio parametrai yra konfigūracijos kintamieji, kurie yra modelio viduje, ir modelis juos išmoksta pats. Pavyzdžiui , W Nepriklausomų kintamųjų svoriai arba koeficientai tiesinės regresijos modelyje . arba Nepriklausomų SVM kintamųjų svoriai arba koeficientai, neuroninio tinklo svoris ir poslinkiai, klasterio centroidas klasterizuojant. Kai kurie pagrindiniai modelio parametrų punktai yra šie:
- Modelis juos naudoja prognozėms sudaryti.
- Juos modelis išmoksta iš pačių duomenų
- Paprastai jie nenustatomi rankiniu būdu.
- Tai yra modelio dalis ir mašininio mokymosi algoritmo raktas.
Modelio hiperparametrai:
Hiperparametrai yra tie parametrai, kuriuos vartotojas aiškiai apibrėžia mokymosi procesui valdyti. Kai kurie pagrindiniai modelio parametrų punktai yra šie:
- Paprastai juos rankiniu būdu nustato mašininio mokymosi inžinierius.
- Negalima žinoti tikslios geriausios hiperparametrų reikšmės duotai problemai. Geriausia vertė gali būti nustatyta pagal nykščio taisyklę arba bandymų ir klaidų būdu.
- Kai kurie hiperparametrų pavyzdžiai yra mokymosi greitis lavinant neuroninį tinklą, K pagal KNN algoritmą,
Hiperparametrų kategorijos
Apskritai hiperparametrus galima suskirstyti į dvi kategorijas, kurios pateikiamos toliau:
Hiperparametras optimizavimui
Geriausių naudotinų hiperparametrų parinkimo procesas yra žinomas kaip hiperparametrų derinimas, o derinimo procesas taip pat žinomas kaip hiperparametrų optimizavimas. Optimizavimo parametrai naudojami modelio optimizavimui.
Toliau pateikiami kai kurie populiarūs optimizavimo parametrai:
Pastaba: Mokymosi greitis yra esminis hiperparametras optimizuojant modelį, todėl, jei reikia derinti tik vieną hiperparametrą, siūloma sureguliuoti mokymosi greitį.
Hiperparametras konkretiems modeliams
Hiperparametrai, dalyvaujantys modelio struktūroje, yra žinomi kaip specifinių modelių hiperparametrai. Jie pateikiami žemiau:
Svarbu nurodyti neuroninio tinklo paslėptų vienetų hiperparametrų skaičių. Jis turėtų būti tarp įvesties sluoksnio dydžio ir išvesties sluoksnio dydžio. Tiksliau, paslėptų vienetų skaičius turėtų būti 2/3 įvesties sluoksnio dydžio, pridėjus išvesties sluoksnio dydį.
Sudėtingoms funkcijoms atlikti būtina nurodyti paslėptų vienetų skaičių, tačiau jis neturėtų per daug pritaikyti modeliui.
Išvada
Hiperparametrai yra parametrai, kurie yra aiškiai apibrėžti siekiant valdyti mokymosi procesą prieš taikant mašininio mokymosi algoritmą duomenų rinkiniui. Jie naudojami modelio mokymosi pajėgumams ir sudėtingumui nurodyti. Kai kurie hiperparametrai naudojami modeliams optimizuoti, pvz., partijos dydis, mokymosi greitis ir kt., o kai kurie yra būdingi modeliams, pvz., Paslėptų sluoksnių skaičius ir kt.