logo

Mašininio mokymosi modeliai

Mašininio mokymosi modelis apibrėžiamas kaip matematinis mokymo proceso rezultato vaizdas. Mašinų mokymasis yra įvairių algoritmų, kurie gali automatiškai tobulėti naudojant patirtį ir senus duomenis, ir sukurti modelį, tyrimas. Mašininio mokymosi modelis yra panašus į kompiuterio programinę įrangą, sukurtą atpažinti modelius ar elgseną remiantis ankstesne patirtimi ar duomenimis. Mokymosi algoritmas aptinka mokymo duomenų šablonus ir išveda ML modelį, kuris fiksuoja šiuos modelius ir prognozuoja naujus duomenis.

Mašininio mokymosi modeliai

Supraskime ML modelio pavyzdį, kai kuriame programėlę, skirtą atpažinti vartotojo emocijas pagal veido išraiškas. Taigi, sukurti tokią programėlę galima naudojant mašininio mokymosi modelius, kur modeliuosime pateikdami veidų vaizdus su įvairiomis emocijomis. Kai ši programa naudojama vartotojo nuotaikai nustatyti, ji nuskaito visus pateiktus duomenis, tada nustato bet kurio vartotojo nuotaiką.

Taigi paprastais žodžiais galime pasakyti, kad a mašininio mokymosi modelis yra supaprastintas kažko ar proceso vaizdas. Šioje temoje aptarsime skirtingus mašininio mokymosi modelius ir jų metodikas bei algoritmus .

Kas yra mašininio mokymosi modelis?

Mašininio mokymosi modelius galima suprasti kaip programą, kuri buvo išmokyta rasti naujų duomenų modelius ir numatyti prognozes. Šie modeliai vaizduojami kaip matematinė funkcija, kuri priima užklausas įvesties duomenų pavidalu, numato įvesties duomenis ir tada atsakydama pateikia išvestį. Pirma, šie modeliai apmokomi naudojant duomenų rinkinį, o tada jiems pateikiamas algoritmas, leidžiantis pagrįsti duomenis, išgauti šabloną iš sklaidos kanalo duomenų ir mokytis iš tų duomenų. Kai šie modeliai bus išmokyti, jie gali būti naudojami nuspėti nematomą duomenų rinkinį.

Yra įvairių tipų mašininio mokymosi modelių, pagrįstų skirtingais verslo tikslais ir duomenų rinkiniais.

Mašininio mokymosi modelių klasifikacija:

Remiantis skirtingais verslo tikslais ir duomenų rinkiniais, yra trys algoritmų mokymosi modeliai. Kiekvienas mašininio mokymosi algoritmas yra vienas iš trijų modelių:

  • Prižiūrimas mokymasis
  • Mokymasis be priežiūros
  • Sustiprinimo mokymasis
Mašininio mokymosi modeliai

Prižiūrimas mokymasis dar skirstomas į dvi kategorijas:

  • klasifikacija
  • Regresija

Mokymasis be priežiūros taip pat skirstomas į šias kategorijas:

  • Klasterizavimas
  • Asociacijos taisyklė
  • Matmenų mažinimas

1. Prižiūrimi mašininio mokymosi modeliai

Prižiūrimas mokymasis yra paprasčiausias mašininio mokymosi modelis, leidžiantis suprasti, kurie įvesties duomenys vadinami mokymo duomenimis ir turi žinomą etiketę arba rezultatą kaip išvestį. Taigi, jis veikia įvesties-išvesties porų principu. Tam reikia sukurti funkciją, kurią būtų galima išmokyti naudojant mokymo duomenų rinkinį, tada ji taikoma nežinomiems duomenims ir nuspėjama. Prižiūrimas mokymasis yra pagrįstas užduotimis ir išbandomas naudojant pažymėtus duomenų rinkinius.

Galime įgyvendinti prižiūrimą mokymosi modelį paprastoms realaus gyvenimo problemoms spręsti. Pavyzdžiui, turime duomenų rinkinį, kurį sudaro amžius ir ūgis; tada galime sukurti prižiūrimą mokymosi modelį, kad pagal amžių būtų galima numatyti asmens ūgį.

Prižiūrimo mokymosi modeliai toliau skirstomi į dvi kategorijas:

Regresija

Regresijos uždaviniuose išvestis yra nuolatinis kintamasis. Kai kurie dažniausiai naudojami regresijos modeliai yra tokie:

a) Tiesinė regresija

Tiesinė regresija yra paprasčiausias mašininio mokymosi modelis, kuriame mes bandome numatyti vieną išvesties kintamąjį naudodami vieną ar daugiau įvesties kintamųjų. Tiesinės regresijos vaizdavimas yra tiesinė lygtis, sujungianti tų įvesties reikšmių rinkinį įvesties verčių (x) ir numatomą išvestį (y). Jis pavaizduotas linijos forma:

Y = bx + c.

Mašininio mokymosi modeliai

Pagrindinis tiesinės regresijos modelio tikslas yra rasti geriausiai tinkančią liniją, kuri geriausiai atitinka duomenų taškus.

Tiesinė regresija išplečiama iki daugialypės tiesinės regresijos (raskite geriausiai tinkančią plokštumą) ir polinominę regresiją (raskite geriausiai tinkančią kreivę).

b) Sprendimų medis

kas yra awt

Sprendimų medžiai yra populiarūs mašininio mokymosi modeliai, kurie gali būti naudojami tiek regresijos, tiek klasifikavimo problemoms spręsti.

Sprendimų medyje naudojama į medį panaši sprendimų struktūra kartu su galimomis jų pasekmėmis ir rezultatais. Čia kiekvienas vidinis mazgas naudojamas atributo testui pateikti; kiekviena šaka naudojama testo rezultatams pavaizduoti. Kuo daugiau mazgų sprendimų medyje, tuo tikslesnis bus rezultatas.

Sprendimų medžių pranašumas yra tas, kad jie yra intuityvūs ir lengvai įgyvendinami, tačiau jiems trūksta tikslumo.

Sprendimų medžiai yra plačiai naudojami operacijų tyrimai, ypač sprendimų analizė, strateginis planavimas ir daugiausia mašininio mokymosi srityje.

c) Atsitiktinis miškas

Atsitiktinis miškas yra ansamblinis mokymosi metodas, kurį sudaro daugybė sprendimų medžių. Kiekvienas atsitiktinio miško sprendimų medis numato rezultatą, o prognozė, surinkusi daugiausia balsų, laikoma rezultatu.

Atsitiktinis miško modelis gali būti naudojamas tiek regresijos, tiek klasifikavimo problemoms spręsti.

Klasifikavimo užduočiai atsitiktinio miško rezultatas paimamas iš daugumos balsų. Tuo tarpu regresijos užduotyje rezultatas paimamas iš kiekvieno medžio sukurtų prognozių vidurkio arba vidurkio.

d) Neuroniniai tinklai

Neuroniniai tinklai yra mašininio mokymosi pogrupis ir taip pat žinomi kaip dirbtiniai neuroniniai tinklai. Neuroniniai tinklai yra sudaryti iš dirbtinių neuronų ir suprojektuoti taip, kad jie būtų panašūs į žmogaus smegenų struktūrą ir darbą. Kiekvienas dirbtinis neuronas jungiasi su daugeliu kitų neuronų neuroniniame tinkle, ir tokie milijonai sujungtų neuronų sukuria sudėtingą pažinimo struktūrą.

Mašininio mokymosi modeliai

Neuroniniai tinklai susideda iš daugiasluoksnės struktūros, kurią sudaro vienas įvesties sluoksnis, vienas ar daugiau paslėptų sluoksnių ir vienas išvesties sluoksnis. Kadangi kiekvienas neuronas yra sujungtas su kitu neuronu, jis perduoda duomenis iš vieno sluoksnio į kitą kitų sluoksnių neuroną. Galiausiai duomenys pasiekia paskutinį neuroninio tinklo sluoksnį arba išvesties sluoksnį ir generuoja išvestį.

Neuroniniai tinklai priklauso nuo mokymo duomenų, kad išmoktų ir pagerintų jų tikslumą. Tačiau puikiai parengtas ir tikslus neuroninis tinklas gali greitai sugrupuoti duomenis ir tapti galingu mašininio mokymosi ir AI įrankiu. Vienas žinomiausių neuroninių tinklų yra Google paieškos algoritmas.

klasifikacija

Klasifikavimo modeliai yra antrasis prižiūrimo mokymosi metodų tipas, naudojamas išvadoms iš stebimų verčių kategorine forma generuoti. Pavyzdžiui, klasifikavimo modelis gali nustatyti, ar el. laiškas yra šlamštas, ar ne; pirkėjas pirks prekę ar ne ir tt Klasifikavimo algoritmai naudojami nuspėti dvi klases ir suskirstyti produkciją į skirtingas grupes.

Klasifikuojant sukurtas klasifikatoriaus modelis, kuris suskirsto duomenų rinkinį į skirtingas kategorijas, o kiekvienai kategorijai priskiriama etiketė.

Yra dviejų tipų mašininio mokymosi klasifikacijos:

    Dvejetainė klasifikacija: Jei problema turi tik dvi galimas klases, vadinamas dvejetainiu klasifikatoriumi. Pavyzdžiui, katė arba šuo, taip arba ne,Kelių klasių klasifikacija: Jei problema turi daugiau nei dvi galimas klases, tai yra kelių klasių klasifikatorius.

Kai kurie populiarūs klasifikavimo algoritmai yra tokie:

a) Logistinė regresija

Logistinė regresija naudojama mašininio mokymosi klasifikavimo problemoms spręsti. Jie yra panašūs į tiesinę regresiją, tačiau naudojami kategoriškiems kintamiesiems prognozuoti. Jis gali numatyti išvestį „Taip“ arba „Ne“, „0 arba 1“, „Tiesa“ arba „Netiesa“ ir kt. Tačiau, užuot pateikęs tikslias reikšmes, jis pateikia tikimybines reikšmes tarp 0 ir 1.

b) Palaikykite vektorinę mašiną

Paramos vektoriaus mašina arba SVM yra populiarus mašininio mokymosi algoritmas, plačiai naudojamas klasifikavimo ir regresijos užduotims atlikti. Tačiau konkrečiai jis naudojamas klasifikavimo problemoms spręsti. Pagrindinis SVM tikslas yra rasti geriausias sprendimų ribas N matmenų erdvėje, kuri gali atskirti duomenų taškus į klases, o geriausia sprendimo riba yra žinoma kaip hiperplokštuma. SVM pasirenka kraštutinį vektorių, kad surastų hiperplokštumą, ir šie vektoriai yra žinomi kaip paramos vektoriai.

Mašininio mokymosi modeliai

c) Naivus Bayesas

Naive Bayes yra dar vienas populiarus klasifikavimo algoritmas, naudojamas mašininiam mokymuisi. Jis vadinamas taip, nes remiasi Bayes teorema ir vadovaujasi naivia (nepriklausoma) prielaida tarp bruožų, kurie pateikiami taip:

Mašininio mokymosi modeliai

Kiekvienas naivus Bayes klasifikatorius daro prielaidą, kad konkretaus kintamojo reikšmė nepriklauso nuo bet kokio kito kintamojo/ypatybės. Pavyzdžiui, jei vaisius reikia klasifikuoti pagal spalvą, formą ir skonį. Taigi geltonas, ovalus ir saldus bus pripažintas mangu. Čia kiekviena savybė nepriklauso nuo kitų savybių.

2. Neprižiūrimi mašininio mokymosi modeliai

Neprižiūrimi mašininio mokymosi modeliai įgyvendina mokymosi procesą, priešingą prižiūrimam mokymuisi, o tai reiškia, kad tai leidžia modeliui mokytis iš nepažymėto mokymo duomenų rinkinio. Remiantis nepažymėtu duomenų rinkiniu, modelis numato išvestį. Naudodamas neprižiūrimą mokymąsi, modelis pats išmoksta paslėptus šablonus iš duomenų rinkinio be jokios priežiūros.

Neprižiūrimi mokymosi modeliai dažniausiai naudojami atliekant tris užduotis, kurios yra šios:

    Klasterizavimas
    Klasterizavimas yra neprižiūrimas mokymosi metodas, apimantis duomenų taškų grupavimą arba apčiuopimą į skirtingas grupes, remiantis panašumais ir skirtumais. Objektai, turintys daugiausiai panašumų, lieka toje pačioje grupėje ir neturi arba turi labai mažai panašumų iš kitų grupių.
    Klasterizacijos algoritmai gali būti plačiai naudojami atliekant įvairias užduotis, pvz Vaizdo segmentavimas, Statistinių duomenų analizė, Rinkos segmentavimas ir kt.
    Kai kurie dažniausiai naudojami klasterizacijos algoritmai K reiškia klasterizavimą, hierarchinį klasterizavimą, DBSCAN ir kt.
    Mašininio mokymosi modeliai Asociacijos taisyklių mokymasis
    Asociacijos taisyklių mokymasis yra neprižiūrimas mokymosi metodas, kuris randa įdomius ryšius tarp kintamųjų dideliame duomenų rinkinyje. Pagrindinis šio mokymosi algoritmo tikslas yra rasti vieno duomenų elemento priklausomybę nuo kito duomenų elemento ir atitinkamai susieti tuos kintamuosius, kad būtų galima gauti didžiausią pelną. Šis algoritmas daugiausia taikomas Rinkos krepšelio analizė, interneto naudojimo kasyba, nuolatinė gamyba ir kt.
    Kai kurie populiarūs asociacijos taisyklių mokymosi algoritmai Apriori Algorithm, Eclat, FP augimo algoritmas. Matmenų mažinimas
    Duomenų rinkinyje esančių ypatybių / kintamųjų skaičius vadinamas duomenų rinkinio matmeniu, o matmenų mažinimo metodas yra žinomas kaip matmenų mažinimo technika.
    Nors daugiau duomenų suteikia tikslesnius rezultatus, jie taip pat gali turėti įtakos modelio/algoritmo veikimui, pvz., permontavimo problemoms. Tokiais atvejais naudojami matmenų mažinimo būdai.
    ' Tai didesnių matmenų duomenų rinkinio konvertavimo į mažesnių matmenų duomenų rinkinį procesas, užtikrinantis, kad jame būtų pateikta panaši informacija .'
    Įvairūs matmenų mažinimo metodai, pvz kaip PCA (pagrindinio komponento analizė), vienetinės vertės skaidymas ir kt.

Sustiprinimo mokymasis

Sustiprinimo mokymosi metu algoritmas išmoksta tam tikros būsenos rinkinio veiksmus, kurie veda į tikslo būseną. Tai grįžtamuoju ryšiu pagrįstas mokymosi modelis, kuris, sąveikaujant su aplinka, po kiekvienos būsenos ar veiksmo priima grįžtamojo ryšio signalus. Šis atsiliepimas veikia kaip atlygis (teigiamas už kiekvieną gerą veiksmą ir neigiamas už kiekvieną blogą veiksmą), o agento tikslas yra maksimaliai padidinti teigiamą atlygį, kad pagerintų savo veiklą.

Modelio elgesys stiprinant mokymąsi yra panašus į žmogaus mokymąsi, nes žmonės dalykų išmoksta iš patirties kaip grįžtamojo ryšio ir sąveikauja su aplinka.

Toliau pateikiami keli populiarūs algoritmai, kuriems taikomas sustiprinimo mokymasis:

    Q mokymasis:Q-learning yra vienas iš populiariausių tobulinimo mokymosi algoritmų be modelių, pagrįstas Bellmano lygtimi.

Juo siekiama išmokti politiką, kuri gali padėti dirbtinio intelekto agentui imtis geriausių veiksmų siekiant maksimaliai padidinti atlygį konkrečiomis aplinkybėmis. Ji apima kiekvienos būsenos ir veiksmo poros Q vertes, kurios rodo atlygį už tam tikrą būsenos kelią, ir bando maksimaliai padidinti Q reikšmę.

    State-Action-Reward-State-Action (SARSA):SARSA yra politikos algoritmas, pagrįstas Markovo sprendimų procesu. Ji naudoja dabartinės politikos atliekamą veiksmą, kad sužinotų Q reikšmę. SARSA algoritmas stovi už valstybės veiksmą Apdovanojimas valstybės veiksmu, kuris simbolizuoja eilutę (s, a, r, s', a'). Deep Q tinklas:DQN arba Deep Q neuroninis tinklas yra Q mokymasis neuroniniame tinkle. Iš esmės jis naudojamas didelės būsenos erdvės aplinkoje, kur Q lentelės apibrėžimas būtų sudėtinga užduotis. Taigi tokiu atveju, užuot naudojęs Q lentelę, neuroninis tinklas naudoja Q reikšmes kiekvienam veiksmui pagal būseną.

Mokymo mašinų mokymosi modeliai

Sukūrus mašininio mokymosi modelį, jis apmokomas, kad būtų gauti tinkami rezultatai. Norint išmokyti mašininio mokymosi modelį, reikia didžiulio kiekio iš anksto apdorotų duomenų. Čia iš anksto apdoroti duomenys reiškia duomenis struktūrizuota forma su sumažintomis nulinėmis reikšmėmis ir pan. Jei nepateiksime iš anksto apdorotų duomenų, yra didžiulė tikimybė, kad mūsų modelis gali veikti siaubingai.

Kaip išsirinkti geriausią modelį?

Aukščiau pateiktame skyriuje aptarėme skirtingus mašininio mokymosi modelius ir algoritmus. Bet vienas labiausiai klaidinantis klausimas, kuris gali kilti kiekvienam pradedančiajam: „kurį modelį turėčiau pasirinkti?“. Taigi atsakymas yra toks, kad tai daugiausia priklauso nuo verslo poreikio ar projekto reikalavimo. Be to, tai taip pat priklauso nuo susijusių atributų, turimo duomenų rinkinio apimties, funkcijų skaičiaus, sudėtingumo ir kt. Tačiau praktikoje visada rekomenduojama pradėti nuo paprasčiausio modelio, kurį galima pritaikyti konkrečiam konkrečiam modeliui. problema, tada palaipsniui didinkite sudėtingumą ir patikrinkite tikslumą naudodami parametrų derinimą ir kryžminį patvirtinimą.

Skirtumas tarp mašininio mokymosi modelio ir algoritmų

Vienas painiausių klausimų pradedantiesiems yra tai, ar mašininio mokymosi modeliai ir algoritmai yra vienodi? Kadangi įvairiais mašininio mokymosi ir duomenų mokslo atvejais šie du terminai vartojami pakaitomis.

Atsakymas į šį klausimą yra ne, o mašininio mokymosi modelis nėra tas pats, kas algoritmas. Paprastu būdu an ML algoritmas yra tarsi procedūra ar metodas, kuris veikia naudojant duomenis, kad iš jų atrastų modelius ir sukurti modelį. Tuo pačiu metu a mašininio mokymosi modelis yra tarsi kompiuterinė programa, kuri generuoja išvestį arba prognozuoja . Tiksliau, kai apmokome algoritmą su duomenimis, jis tampa modeliu.

 Machine Learning Model = Model Data + Prediction Algorithm