logo

Mokymasis prižiūrimas ir neprižiūrimas

Mašinų mokymasis yra kompiuterių mokslo sritis, suteikianti kompiuteriams galimybę mokytis be aiškiai užprogramuotų. Prižiūrimas mokymasis ir neprižiūrimas mokymasis yra du pagrindiniai mokymosi tipai mašininis mokymasis .

Į prižiūrimas mokymasis , mašina apmokoma naudoti pažymėtų duomenų rinkinį, o tai reiškia, kad įvesties duomenys yra susieti su norima išvestimi. Tada mašina išmoksta numatyti naujų įvesties duomenų išvestį. Prižiūrimas mokymasis dažnai naudojamas atliekant tokias užduotis kaip klasifikavimas, regresija ir objektų aptikimas.

Neprižiūrimo mokymosi metu mašina apmokoma naudoti nepažymėtų duomenų rinkinį, o tai reiškia, kad įvesties duomenys nėra susieti su norima išvestimi. Tada mašina išmoksta rasti duomenų šablonus ir ryšius. Mokymasis be priežiūros dažnai naudojamas tokioms užduotims kaip grupavimas , matmenų mažinimas ir anomalijų aptikimas.



Kas yra prižiūrimas mokymasis?

Prižiūrimas mokymasis yra tam tikra rūšis mašininio mokymosi algoritmas kad mokosi iš pažymėtų duomenų. Pažymėti duomenys – tai duomenys, pažymėti teisingu atsakymu arba klasifikacija.

Vadovaujantis mokymasis, kaip rodo pavadinimas, turi vadovo, kaip mokytojo, buvimą. Prižiūrimas mokymasis yra tada, kai mokome arba mokome mašiną naudodami duomenis, kurie yra gerai pažymėti. Tai reiškia, kad kai kurie duomenys jau pažymėti teisingu atsakymu. Po to mašinai pateikiamas naujas pavyzdžių (duomenų) rinkinys, kad prižiūrimas mokymosi algoritmas analizuotų mokymo duomenis (mokymo pavyzdžių rinkinį) ir iš pažymėtų duomenų pateiktų teisingą rezultatą.

Pavyzdžiui, pažymėtame dramblio, kupranugario ir karvės vaizdų duomenų rinkinyje kiekvienas vaizdas būtų pažymėtas arba dramblys , ir kupranugarių karvė.

Prižiūrimas-mokymasis

Pagrindiniai klausimai:

  • Prižiūrimas mokymasis apima mašinos mokymą iš pažymėtų duomenų.
  • Pažymėti duomenys susideda iš pavyzdžių su teisingu atsakymu arba klasifikacija.
  • Mašina išmoksta ryšį tarp įvesties (vaisių atvaizdų) ir išvesties (vaisių etikečių).
  • Tada apmokyta mašina gali numatyti naujus, nepaženklintus duomenis.

Pavyzdys:

Tarkime, kad turite vaisių krepšelį, kurį norite identifikuoti. Aparatas pirmiausia analizuos vaizdą, kad išskirtų tokias savybes kaip forma, spalva ir tekstūra. Tada jis palygintų šias savybes su vaisių, apie kuriuos jau sužinojo, savybėmis. Jei naujojo vaizdo savybės yra labiausiai panašios į obuolio savybes, mašina numatytų, kad vaisius yra obuolys.

eilutė char java

Pavyzdžiui , tarkime, kad jums duodamas krepšelis, užpildytas įvairių rūšių vaisiais. Dabar pirmas žingsnis yra treniruoti mašiną su visais skirtingais vaisiais po vieną taip:

  • Jei objekto forma yra suapvalinta ir viršuje yra įdubimas, raudonos spalvos, tada jis bus pažymėtas kaip – Apple .
  • Jei objekto forma yra ilgas lenktas cilindras, turintis žaliai geltoną spalvą, tada jis bus pažymėtas kaip - Bananas .

Dabar tarkime, kad išmokę duomenis davėte naują atskirą vaisių, tarkime, Bananą iš krepšelio, ir paprašėte jį identifikuoti.

Kadangi mašina jau išmoko dalykų iš ankstesnių duomenų ir šį kartą turi juos naudoti protingai. Pirmiausia jis suskirstys vaisius pagal formą ir spalvą, patvirtins vaisių pavadinimą kaip BANANAS ir įtrauks jį į bananų kategoriją. Taigi mašina išmoksta dalykų iš mokymo duomenų (krepšelio, kuriame yra vaisiai) ir tada taiko žinias bandymo duomenims (nauji vaisiai).

Prižiūrimo mokymosi tipai

Prižiūrimas mokymasis skirstomas į dvi algoritmų kategorijas:

  • Regresija : Regresijos problema yra tada, kai išvesties kintamasis yra tikroji vertė, pvz., doleriai arba svoris.
  • klasifikacija : Klasifikavimo problema kyla, kai išvesties kintamasis yra kategorija, pvz., Raudona arba mėlyna , liga arba jos nėra.

Prižiūrimas mokymasis susijęs su pažymėtais duomenimis arba mokosi iš jų. Tai reiškia, kad kai kurie duomenys jau pažymėti teisingu atsakymu.

1 – Regresija

Regresija yra prižiūrimo mokymosi tipas, naudojamas nuspėti nuolatines vertes, pvz., būsto kainas, akcijų kainas ar klientų atsitraukimą. Regresijos algoritmai išmoksta funkciją, kuri susieja iš įvesties ypatybių į išvesties vertę.

Kai kurie bendri regresijos algoritmai apima:

  • Tiesinė regresija
  • Polinominė regresija
  • Palaikykite vektorinės mašinos regresiją
  • Sprendimų medžio regresija
  • Atsitiktinė miško regresija

2- Klasifikacija

Klasifikacija yra prižiūrimo mokymosi tipas, kuris naudojamas nuspėti kategoriškas reikšmes, pvz., ar klientas atsilieps, ar ne, ar el. laiškas yra šlamštas, ar medicininiame vaizde matomas auglys, ar ne. Klasifikavimo algoritmai išmoksta funkciją, kuri susieja iš įvesties ypatybių į tikimybių pasiskirstymą pagal išvesties klases.

js pasaulinis kintamasis

Kai kurie bendri klasifikavimo algoritmai apima:

  • Logistinė regresija
  • Palaikykite vektorines mašinas
  • Sprendimų medžiai
  • Atsitiktiniai miškai
  • Naivi Baye

Prižiūrimų mokymosi modelių vertinimas

Prižiūrimų mokymosi modelių įvertinimas yra svarbus žingsnis siekiant užtikrinti, kad modelis būtų tikslus ir apibendrinamas. Yra keletas skirtingų metrikos kuriuos galima naudoti prižiūrimo mokymosi modeliams įvertinti, tačiau kai kurie iš dažniausiai pasitaikančių yra:

Dėl regresijos

  • Vidutinė kvadrato klaida (MSE): MSE matuoja vidutinį kvadratinį skirtumą tarp numatomų ir faktinių verčių. Mažesnės MSE reikšmės rodo geresnį modelio veikimą.
  • Šaknies vidurkio kvadrato klaida (RMSE): RMSE yra kvadratinė šaknis iš MSE, parodanti standartinį prognozavimo klaidų nuokrypį. Panašiai kaip MSE, mažesnės RMSE reikšmės rodo geresnį modelio veikimą.
  • Vidutinė absoliuti klaida (MAE): MAE matuoja vidutinį absoliutų skirtumą tarp numatytų ir faktinių verčių. Jis yra mažiau jautrus nuokrypiams, palyginti su MSE ar RMSE.
  • R kvadratas (nustatymo koeficientas): R kvadratas matuoja modeliu paaiškintą tikslinio kintamojo dispersijos dalį. Didesnės R kvadrato reikšmės rodo geresnį modelio tinkamumą.

Dėl klasifikavimo

  • Tikslumas: Tikslumas yra prognozių, kurias modelis pateikia teisingai, procentas. Jis apskaičiuojamas teisingų prognozių skaičių padalijus iš bendro prognozių skaičiaus.
  • Tikslumas: Tikslumas yra teigiamų prognozių, kurias modelis pateikia ir kurios iš tikrųjų yra teisingos, procentas. Jis apskaičiuojamas padalijus tikrųjų teigiamų skaičių iš bendro teigiamų prognozių skaičiaus.
  • Prisiminkite: Prisiminimas yra visų teigiamų pavyzdžių, kuriuos modelis teisingai nustato, procentas. Jis apskaičiuojamas padalijus tikrų teigiamų skaičių iš bendro teigiamų pavyzdžių skaičiaus.
  • F1 rezultatas: F1 balas yra tikslumo ir prisiminimo svertinis vidurkis. Jis apskaičiuojamas imant tikslumo ir atšaukimo harmoninį vidurkį.
  • Sumišimo matrica: Sumaišties matrica yra lentelė, kurioje rodomas kiekvienos klasės numatymo skaičius kartu su tikrosiomis klasių etiketėmis. Jis gali būti naudojamas vizualizuoti modelio veikimą ir nustatyti sritis, kuriose modeliui sunku.

Prižiūrimo mokymosi taikymai

Prižiūrimas mokymasis gali būti naudojamas sprendžiant įvairias problemas, įskaitant:

eilutę į datą
  • Šlamšto filtravimas: Prižiūrimi mokymosi algoritmai gali būti išmokyti atpažinti ir klasifikuoti el. laiškus pagal jų turinį ir padėti vartotojams išvengti nepageidaujamų pranešimų.
  • Vaizdo klasifikacija: Prižiūrimas mokymasis gali automatiškai suskirstyti vaizdus į skirtingas kategorijas, pvz., gyvūnus, objektus ar scenas, palengvindamas užduotis, pvz., vaizdų paiešką, turinio moderavimą ir vaizdais pagrįstų produktų rekomendacijas.
  • Medicininė diagnozė: Prižiūrimas mokymasis gali padėti atlikti medicininę diagnozę, analizuojant paciento duomenis, pvz., medicininius vaizdus, ​​tyrimų rezultatus ir paciento istoriją, kad būtų galima nustatyti konkrečias ligas ar sąlygas rodančius modelius.
  • Sukčiavimo aptikimas: Prižiūrimi mokymosi modeliai gali analizuoti finansines operacijas ir nustatyti modelius, rodančius nesąžiningą veiklą, padedant finansų įstaigoms užkirsti kelią sukčiavimui ir apsaugoti savo klientus.
  • Natūralios kalbos apdorojimas (NLP): Prižiūrimas mokymasis atlieka lemiamą vaidmenį atliekant NLP užduotis, įskaitant nuotaikų analizę, mašininį vertimą ir teksto apibendrinimą, leidžiantį mašinoms suprasti ir efektyviai apdoroti žmonių kalbą.

Prižiūrimo mokymosi privalumai

  • Prižiūrimas mokymasis leidžia rinkti duomenis ir išvesti duomenis iš ankstesnės patirties.
  • Patirties pagalba padeda optimizuoti veiklos kriterijus.
  • Prižiūrimas mašinų mokymasis padeda išspręsti įvairių tipų realaus pasaulio skaičiavimo problemas.
  • Ji atlieka klasifikavimo ir regresijos užduotis.
  • Tai leidžia įvertinti arba susieti rezultatą su nauja imtimi.
  • Mes visiškai kontroliuojame, kaip pasirinkti norimą užsiėmimų skaičių mokymo duomenyse.

Prižiūrėto mokymosi trūkumai

  • Didelių duomenų klasifikavimas gali būti sudėtingas.
  • Mokymosi prižiūrimam mokymui reikia daug skaičiavimo laiko. Taigi, tam reikia daug laiko.
  • Prižiūrimas mokymasis negali atlikti visų sudėtingų mašininio mokymosi užduočių.
  • Skaičiavimo laikas yra didžiulis prižiūrimam mokymuisi.
  • Tam reikalingas pažymėtas duomenų rinkinys.
  • Tam reikia mokymo proceso.

Kas yra mokymasis be priežiūros?

Neprižiūrimas mokymasis yra mašininio mokymosi tipas, kuris mokosi iš nepažymėtų duomenų. Tai reiškia, kad duomenys neturi jokių iš anksto nustatytų etikečių ar kategorijų. Neprižiūrimo mokymosi tikslas yra atrasti duomenų modelius ir ryšius be jokių aiškių nurodymų.

Neprižiūrimas mokymasis yra mašinos mokymas naudojant informaciją, kuri nėra nei įslaptinta, nei paženklinta, ir leidžia algoritmui veikti pagal šią informaciją be nurodymų. Čia mašinos užduotis yra sugrupuoti nerūšiuotą informaciją pagal panašumus, modelius ir skirtumus be išankstinio duomenų mokymo.

Skirtingai nuo prižiūrimo mokymosi, mokytojas neteikiamas, o tai reiškia, kad mašina nebus mokoma. Todėl mašina gali pati rasti paslėptą struktūrą nepažymėtuose duomenyse.

Galite naudoti mokymąsi be priežiūros, norėdami ištirti surinktus duomenis apie gyvūnus ir atskirti kelias grupes pagal gyvūnų savybes ir veiksmus. Šios grupės gali atitikti įvairias gyvūnų rūšis, todėl būtybes galite suskirstyti į kategorijas neatsižvelgdami į jau egzistuojančias etiketes.

Neprižiūrimas-mokymasis

Pagrindiniai klausimai

  • Neprižiūrimas mokymasis leidžia modeliui atrasti nepažymėtų duomenų modelius ir ryšius.
  • Klasterizacijos algoritmai sugrupuoja panašius duomenų taškus pagal jiems būdingas savybes.
  • Funkcijų išskyrimas fiksuoja esminę informaciją iš duomenų, todėl modelis gali reikšmingai atskirti.
  • Etikečių susiejimas priskiria kategorijas klasteriams pagal išgautus modelius ir charakteristikas.

Pavyzdys

Įsivaizduokite, kad turite mašininio mokymosi modelį, parengtą naudojant didelį nepažymėtų vaizdų duomenų rinkinį, kuriame yra ir šunų, ir kačių. Šis modelis niekada anksčiau nematė šuns ar katės atvaizdo, be to, jame nėra iš anksto nustatytų šių gyvūnų etikečių ar kategorijų. Jūsų užduotis yra naudoti neprižiūrimą mokymąsi, kad atpažintumėte šunis ir kates naujame, nematytame vaizde.

Pavyzdžiui , tarkime, kad jam pateikiamas vaizdas, kuriame yra ir šunų, ir kačių, kurių jis niekada nematė.

Taigi mašina neturi supratimo apie šunų ir kačių ypatybes, todėl negalime jos priskirti prie „šunų ir kačių“. Tačiau jis gali juos suskirstyti į kategorijas pagal panašumus, modelius ir skirtumus, t. y. galime lengvai suskirstyti aukščiau pateiktą paveikslėlį į dvi dalis. Pirmajame gali būti visos nuotraukos šunys juose ir antroje dalyje gali būti visos nuotraukos, turinčios katės juose. Čia jūs anksčiau nieko neišmokote, o tai reiškia, kad nėra mokymo duomenų ar pavyzdžių.

Tai leidžia modeliui dirbti savarankiškai, kad būtų atrasti anksčiau neaptikti modeliai ir informacija. Ji daugiausia susijusi su nepažymėtais duomenimis.

Neprižiūrimo mokymosi tipai

Neprižiūrimas mokymasis skirstomas į dvi algoritmų kategorijas:

  • Klasterizavimas : Klasterizacijos problema yra ta, kai norite atrasti būdingas duomenų grupes, pvz., sugrupuoti klientus pagal pirkimo elgseną.
  • asociacija : Asociacijos taisyklių mokymosi problema yra ta, kai norite atrasti taisykles, apibūdinančias didelę jūsų duomenų dalį, pvz., žmonės, kurie perka X, taip pat linkę pirkti Y.

Klasterizavimas

Klasterizavimas yra neprižiūrimo mokymosi tipas, naudojamas panašiems duomenų taškams grupuoti. Klasterizacijos algoritmai dirbti pakartotinai perkeldami duomenų taškus arčiau jų grupių centrų ir toliau nuo kitų grupių duomenų taškų.

  1. Išskirtinis (atskyrimas)
  2. Aglomeracinis
  3. Persidengimas
  4. Tikimybinis

Klasterizacijos tipai: -

žiniatinklio tvarkyklės
  1. Hierarchinis klasterizavimas
  2. K reiškia klasterizavimą
  3. Pagrindinių komponentų analizė
  4. Vienaskaitos reikšmės skaidymas
  5. Nepriklausomų komponentų analizė
  6. Gauso mišinio modeliai (GMM)
  7. Tankiu pagrįstas erdvinis programų su triukšmu grupavimas (DBSCAN)

Asociacijos taisyklių mokymasis

Asociacijos taisyklių mokymasis yra neprižiūrimo mokymosi tipas, naudojamas duomenų šablonams nustatyti. Asociacijos taisyklė mokymosi algoritmai veikia ieškodami ryšių tarp skirtingų duomenų rinkinio elementų.

Kai kurie bendri asociacijos taisyklių mokymosi algoritmai:

  • Apriori algoritmas
  • Eclat algoritmas
  • FP augimo algoritmas

Neprižiūrimų mokymosi modelių vertinimas

Neprižiūrimų mokymosi modelių įvertinimas yra svarbus žingsnis siekiant užtikrinti, kad modelis būtų veiksmingas ir naudingas. Tačiau tai gali būti sudėtingesnė nei prižiūrimų mokymosi modelių vertinimas, nes nėra pagrindinio tiesos duomenų, su kuriais būtų galima palyginti modelio prognozes.

Yra daug skirtingų metrikų, kurias galima naudoti vertinant neprižiūrimo mokymosi modelius, tačiau kai kurie iš dažniausiai pasitaikančių yra:

  • Silueto balas: Silueto balas matuoja, kaip gerai kiekvienas duomenų taškas yra sugrupuotas su savo klasterio nariais ir atskirtas nuo kitų grupių. Jis svyruoja nuo -1 iki 1, o aukštesni balai rodo geresnį grupavimą.
  • Calinski-Harabasz rezultatas: Calinski-Harabasz balas matuoja santykį tarp klasterių ir klasterių dispersijos. Jis svyruoja nuo 0 iki begalybės, o aukštesni balai rodo geresnį grupavimą.
  • Koreguotas Rand indeksas: Koreguotas Rand indeksas matuoja dviejų grupių panašumą. Jis svyruoja nuo -1 iki 1, o aukštesni balai rodo daugiau panašių grupių.
  • Davieso-Bouldino indeksas: Davieso-Bouldino indeksas matuoja vidutinį klasterių panašumą. Jis svyruoja nuo 0 iki begalybės, o mažesni balai rodo geresnį grupavimą.
  • F1 rezultatas: F1 balas yra svertinis tikslumo ir prisiminimo vidurkis. Tai dvi metrikos, kurios dažniausiai naudojamos prižiūrimo mokymosi metu klasifikavimo modeliams įvertinti. Tačiau F1 balas taip pat gali būti naudojamas vertinant neprižiūrimus mokymosi modelius, pvz., grupavimo modelius.

Taikymas mokymosi be priežiūros

Neprižiūrimas mokymasis gali būti naudojamas sprendžiant daugybę problemų, įskaitant:

  • Anomalijų aptikimas: Neprižiūrimas mokymasis gali nustatyti neįprastus duomenų modelius arba nukrypimus nuo įprastos elgsenos, kad būtų galima aptikti sukčiavimą, įsibrovimą ar sistemos gedimus.
  • Mokslinis atradimas: Neprižiūrimas mokymasis gali atskleisti paslėptus ryšius ir mokslinių duomenų modelius, todėl atsiranda naujų hipotezių ir įžvalgų įvairiose mokslo srityse.
  • Rekomendacijų sistemos: be priežiūros mokantis galima nustatyti vartotojų elgsenos modelius ir panašumus bei pageidavimus rekomenduoti produktus, filmus ar muziką, atitinkančius jų pomėgius.
  • Klientų segmentavimas: Neprižiūrimas mokymasis gali identifikuoti klientų grupes, turinčias panašių savybių, o tai leidžia įmonėms nukreipti rinkodaros kampanijas ir veiksmingiau pagerinti klientų aptarnavimą.
  • Vaizdo analizė: be priežiūros mokantis galima grupuoti vaizdus pagal jų turinį, palengvinant užduotis, tokias kaip vaizdų klasifikavimas, objektų aptikimas ir vaizdo gavimas.

Privalumai mokymosi be priežiūros

  • Nereikalaujama, kad mokymo duomenys būtų pažymėti.
  • Matmenų mažinimas gali būti lengvai atliktas naudojant neprižiūrimą mokymąsi.
  • Gali aptikti anksčiau nežinomus duomenų modelius.
  • Neprižiūrimas mokymasis gali padėti įgyti įžvalgų iš nepažymėtų duomenų, kurių galbūt negalėtumėte gauti kitu atveju.
  • Neprižiūrimas mokymasis yra geras ieškant duomenų modelių ir ryšių, nenurodant, ko ieškoti. Tai gali padėti sužinoti naujų dalykų apie savo duomenis.

Trūkumai mokymosi be priežiūros

  • Sunku išmatuoti tikslumą ar efektyvumą, nes mokymų metu trūksta iš anksto nustatytų atsakymų.
  • Rezultatai dažnai būna mažesni.
  • Vartotojas turi skirti laiko interpretuoti ir pažymėti klases, kurios atitinka tą klasifikaciją.
  • Neprižiūrimas mokymasis gali būti jautrus duomenų kokybei, įskaitant trūkstamas vertes, nuokrypius ir triukšmingus duomenis.
  • Be pažymėtų duomenų gali būti sunku įvertinti neprižiūrimų mokymosi modelių našumą, todėl sunku įvertinti jų efektyvumą.

Prižiūrimas ir neprižiūrimas mašininis mokymasis

Parametrai Prižiūrimas mašininis mokymasis Neprižiūrimas mašininis mokymasis
Įvesties duomenys Algoritmai mokomi naudojant pažymėtus duomenis. Algoritmai naudojami prieš duomenis, kurie nėra pažymėti
Skaičiavimo sudėtingumas Paprastesnis metodas Skaičiuojant sudėtingas
Tikslumas Labai tikslus Mažiau tikslūs
Klasių skaičius Klasių skaičius žinomas Klasių skaičius nežinomas
Duomenų analizė Naudoja analizę neprisijungus Naudoja duomenų analizę realiuoju laiku
Naudojami algoritmai

Tiesinė ir logistinė regresija, atsitiktinis miškas, kelių klasių klasifikacija, sprendimų medis, palaikymo vektorių mašina, neuroninis tinklas ir kt.

K-Means klasterizavimas, hierarchinis klasterizavimas, KNN, Apriori algoritmas ir kt.

Išvestis Pateikiama pageidaujama produkcija. Norima išvestis nepateikiama.
Treniruočių duomenys Naudokite mokymo duomenis, kad padarytumėte išvadą apie modelį. Treniruočių duomenys nenaudojami.
Sudėtingas modelis Neįmanoma išmokti didesnių ir sudėtingesnių modelių nei mokantis prižiūrint. Galima mokytis didesnių ir sudėtingesnių modelių be priežiūros.
Modelis Galime išbandyti savo modelį. Negalime išbandyti savo modelio.
Vadinamas kaip Prižiūrimas mokymasis dar vadinamas klasifikavimu. Neprižiūrimas mokymasis taip pat vadinamas klasterizavimu.
Pavyzdys Pavyzdys: optinis simbolių atpažinimas. Pavyzdys: raskite veidą vaizde.

Priežiūra

prižiūrimam mokymuisi reikia priežiūros, kad būtų galima parengti modelį.

Mokymuisi be priežiūros nereikia jokios priežiūros, kad būtų galima išmokyti modelį.

Išvada

Prižiūrimas ir neprižiūrimas mokymasis yra du galingi įrankiai, kuriuos galima naudoti sprendžiant įvairias problemas. Prižiūrimas mokymasis puikiai tinka užduotims, kurių norimas rezultatas yra žinomas, o neprižiūrimas mokymasis puikiai tinka užduotims, kai norimas rezultatas nežinomas.

Dažnai užduodami klausimai (DUK)

1. Kuo skiriasi prižiūrima ir neprižiūrima mašinų kalba?

Mokymasis prižiūrimas ir neprižiūrimas yra du pagrindiniai mašininio mokymosi būdai, kurie skiriasi mokymo duomenimis ir mokymosi tikslais.

  • Prižiūrimas mokymasis apima mašininio mokymosi modelio mokymą pažymėtame duomenų rinkinyje, kur kiekvienas duomenų taškas turi atitinkamą etiketę arba išvesties reikšmę. Algoritmas išmoksta susieti įvesties duomenis su norima išvestimi, kad galėtų numatyti naujus, nematytus duomenis.
  • Mokymasis be priežiūros Kita vertus, susijęs su nepažymėtais duomenų rinkiniais, kai duomenų taškai neturi susijusių etikečių ar išvesties reikšmių.

2. Kas yra prižiūrimas mokymasis?

Prižiūrimas mokymasis yra mašininio mokymosi tipas, kai algoritmas mokomas naudojant pažymėtą duomenų rinkinį, kur kiekvienas duomenų taškas turi atitinkamą etiketę arba išvesties reikšmę. Algoritmas išmoksta susieti įvesties duomenis su norima išvestimi, kad galėtų numatyti naujus, nematytus duomenis.

3. Kokie yra įprasti prižiūrimo mokymosi algoritmai?

Įprasti prižiūrimi mokymosi algoritmai apima:

  • Klasifikacija: Naudojamas kategorijoms priskirti duomenų taškams. Pavyzdžiai: paramos vektorių mašinos (SVM), logistinė regresija ir sprendimų medžiai.
  • Regresija: Naudojamas nuolatinėms skaitinėms reikšmėms numatyti. Pavyzdžiui, tiesinė regresija, polinominė regresija ir keteros regresija.

4. Kokie yra įprasti neprižiūrimo mokymosi algoritmai?

Įprasti neprižiūrimo mokymosi algoritmai apima:

  • Klasterizavimas: Duomenų taškų grupavimas į grupes pagal jų panašumą. Pavyzdžiai apima k-means klasterizavimą ir hierarchinį grupavimą.
  • Matmenų sumažinimas: Sumažinti funkcijų skaičių duomenų rinkinyje išsaugant svarbiausią informaciją. Pavyzdžiui, pagrindinių komponentų analizė (PCA) ir automatiniai kodavimo įrenginiai.

5. Kas yra mokymasis be priežiūros?

Neprižiūrimas mokymasis yra mašininio mokymosi tipas, kai algoritmas mokomas naudojant nepažymėtą duomenų rinkinį, kai duomenų taškai neturi atitinkamų etikečių ar išvesties verčių. Algoritmas išmoksta atpažinti duomenų šablonus ir struktūras be aiškių nurodymų.

java poeilutės pavyzdys

6. Kada naudoti prižiūrimą mokymąsi, palyginti su neprižiūrimu mokymusi?

Naudokite prižiūrimą mokymąsi, kai turite pažymėtą duomenų rinkinį ir norite numatyti naujų duomenų. Naudokite neprižiūrimą mokymąsi, kai turite nepažymėtą duomenų rinkinį ir norite nustatyti duomenų šablonus ar struktūras.