logo

Mašininio mokymosi algoritmai

Mašininio mokymosi algoritmai yra skaičiavimo modeliai, leidžiantys kompiuteriams suprasti modelius ir prognozuoti arba priimti sprendimus remiantis duomenimis, nereikalaujant aiškaus programavimo. Šie algoritmai sudaro šiuolaikinio dirbtinio intelekto pagrindą ir yra naudojami įvairiose srityse, įskaitant vaizdo ir kalbos atpažinimą, natūralios kalbos apdorojimą, rekomendacijų sistemas, sukčiavimo aptikimą, autonominius automobilius ir kt.



Tai Mašininio mokymosi algoritmai Straipsnis apims visus esminius mašininio mokymosi algoritmus Palaiko vektorinę mašiną, sprendimų priėmimą, logistikos regresiją, naivųjį „bayees“ klasifikatorių, atsitiktinį mišką, k-mean klasterizavimą, sustiprinimo mokymąsi, vektorių, hierarchinį klasterizavimą, xgboost, adaboost, logistiką ir kt.

Mašininio mokymosi algoritmų tipai

Yra trijų tipų mašininio mokymosi algoritmai.

  1. Prižiūrimas mokymasis
    • Regresija
    • klasifikacija
  2. Mokymasis be priežiūros
  3. Sustiprinimo mokymasis

Mašininio mokymosi algoritmų tipai



1. Prižiūrimo mokymosi algoritmas

Prižiūrimas mokymasis yra mašininio mokymosi algoritmų tipas, kuriame modeliui ar algoritmams mokyti naudojome pažymėtą duomenų rinkinį. Algoritmo tikslas yra išmokti susieti įvesties duomenis ir išvesties etiketes, kad būtų galima numatyti arba klasifikuoti naujus, nematytus duomenis.

Prižiūrimi mašininio mokymosi algoritmai

  1. Linijinis modelis:
    • Regresija
      • Įprasta mažiausio kvadrato regresija
      • Paprasta tiesinė regresija
      • Daugkartinė tiesinė regresija
      • Polinominė regresija
      • Stačiakampio atitikimo siekimas (OMP)
      • Bajeso regresija
      • Kvantilė regresija
      • Izotoninė regresija
      • Laipsniška regresija
      • Mažiausio kampo regresija (LARS)
    • Klasifikacija:
    • Reguliavimas :
      • Lasso (L1 reguliavimas)
      • Ridge (L2 reguliavimas)
        • Ridge regresija
        • Ridge klasifikatorius
      • Elastinis tinklelis
      • LARS Lasso
  2. K-Artimiausi kaimynai (KNN):
    • Brute Force algoritmai
    • Rutulinio medžio ir KD medžio algoritmai
    • K-Artimiausių kaimynų (KNN) klasifikatorius
    • K-Artimiausių kaimynų (KNN) regresorius
  3. Palaikykite vektorines mašinas:
    • Palaikykite vektorinių mašinų regresorių
    • Įvairios branduolio funkcijos SVM
  4. Stochastinis gradiento nusileidimas
    • Stochastinis gradiento nusileidimo klasifikatorius
    • Stochastinio gradiento nusileidimo regresorius
    • Skirtingos SGD praradimo funkcijos
  5. Sprendimų medis:
    • Sprendimų medžio algoritmai
      • Iteraciniai dichotomiserio 3 (ID3) algoritmai
      • C5. Algoritmai
      • Klasifikavimo ir regresijos medžių algoritmai
    • Sprendimų medžio klasifikatorius
    • Sprendimų medžio regresorius
  6. Ansamblio mokymasis:
    • Įkrovimas į maišus (įkrovos kaupimas)
    • Skatinimas
      • AdaBoost
      • XGBoost
      • CatBoost
      • Gradiento didinimo mašinos (GBM)
      • LightGBM
    • Krovimas
  7. Generatyvus modelis
    • Naivus Bayesas
      • Gauso naivusis Bayesas
      • Daugianomis Naive Bayes
      • Bernoulli Naive Bayes
    • Gauso procesai
      • Gauso proceso regresija (GPR)
      • Gauso proceso klasifikacija (GPC)
    • Gauso diskriminacinė analizė
      • Linijinė diskriminacinė analizė (LDA)
      • Kvadratinė diskriminacinė analizė (QDA)
    • Bajeso tikėjimo tinklai
    • Paslėpti Markovo modeliai (HMM)
  8. Laiko eilučių prognozė:
    • Laiko eilučių vizualizacija ir analizė:
      • Laiko eilutės komponentai: tendencija, sezoniškumas ir triukšmas
      • Laiko eilučių skaidymo metodai
      • Sezoninis derinimas ir skirtumai
      • Autokoreliacija ir dalinės autokoreliacijos funkcijos
      • Papildytas Dickey-Fuller testas
      • Laiko eilučių sezoninis skaidymas (STL išskaidymas)
      • Box-Jenkins metodika ARIMA modeliams
    • Laiko eilučių prognozavimo algoritmai:
      • Slenkamasis vidurkis (MA) ir svertinis slenkamasis vidurkis
      • Eksponentinio išlyginimo metodai (paprasti, dvigubi ir trigubi)
      • Autoregresyvūs (AR) modeliai
      • Slankiojo vidurkio (MA) modeliai
      • Autoregresyvūs integruoto slankiojo vidurkio (ARIMA) modeliai
      • Laiko eilučių sezoninis skaidymas pagal lotą (STL)
      • Sezoniniai autoregresyvūs integruoto slankiojo vidurkio (SARIMA) modeliai
      • ARIMAX ir SARIMAX modeliai
  9. Prižiūrėtas matmenų mažinimo metodas:
    • Linijinė diskriminacinė analizė (LDA)

Kai kurie prižiūrimi mašininio mokymosi algoritmai gali būti naudojami tiek klasifikavimui, tiek regresijai, šiek tiek modifikuojant



  • Kelių klasių ir kelių išėjimų algoritmai:
    • Daugiaklasių klasifikacija
      • OneVsRest klasifikatorius
    • Kelių etikečių klasifikacija
    • Kelių išėjimų regresija

Klasifikavimo ir regresijos algoritmų metrika:

  • Regresijos metrika:
    • Vidutinė kvadrato paklaida (MSE)
    • Vidutinė kvadrato paklaida (RMSE)
    • Vidutinė absoliuti paklaida (MAE)
    • R kvadratas
    • Pakoreguotas R kvadratas
  • Klasifikavimo metrika:
  • Tikimybių kalibravimas
    • Kalibravimo kreivės
    • Klasifikatoriaus kalibravimas

Kryžminio patvirtinimo metodas:

  • K-karto kryžminis patvirtinimas
  • Stratifikuotas k-Fold kryžminis patvirtinimas
  • Palikite kryžminį patvirtinimą
  • Shuffle Split kryžminis patvirtinimas
  • Kryžminis laiko eilučių patvirtinimas

Optimizavimo technika:

  • Gradiento nusileidimas
    • Stochastinis gradiento nusileidimas
    • Mini-partinis gradiento nusileidimas
    • Momentu pagrįstas gradiento nusileidimas
  • Niutono optimizavimo metodai
    • Niutono algoritmas
    • Kvaziniutono metodai (BFGS, L-BFGS)
    • Konjuguotas gradientas
  • Vietinės paieškos optimizavimo metodai
    • Kopimas į kalną
    • Tabu paieška

2. Neprižiūrimas mokymosi algoritmas

Mokymasis be priežiūros yra mašininio mokymosi algoritmų tipas, kai algoritmai naudojami duomenų rinkinio šablonams, struktūrai ar ryšiui rasti naudojant neįvardytą duomenų rinkinį. Ji tiria būdingą duomenų struktūrą be iš anksto nustatytų kategorijų ar etikečių.

smtp interneto protokolas

Neprižiūrimi mašininio mokymosi algoritmai

  • Klasterizavimas
    • Centroidiniai metodai
    • Platinimu pagrįsti metodai
    • Sujungimu pagrįsti metodai
      • Hierarchinis klasterizavimas
        • Aglomeracinis klasterizavimas
        • Skiriamasis klasterizavimas
      • Afiniteto plitimas
    • Tankiu pagrįsti metodai
      • DBSCAN (tankiu pagrįstas erdvinis programų su triukšmu grupavimas)
      • OPTIKA (taškų užsakymas grupavimo struktūrai identifikuoti)
  • Asociacijos taisyklių kasyba
    • Apriori algoritmas
    • FP augimas (dažnas augimas)
    • ECLAT (ekvivalentiškumo klasės klasterizavimas ir tinklelio judėjimas iš apačios į viršų)
  • Anomalijų aptikimas:
    • Z balas
    • Vietinis išorinis faktorius (LOF)
    • Izoliacijos miškas
  • Matmenų mažinimo technika:
    • Pagrindinių komponentų analizė (PCA)
    • t paskirstytas stochastinis kaimynų įterpimas (t-SNE)
    • Neneigiamas matricos faktoriavimas (NMF)
    • Nepriklausoma komponentų analizė (ICA)
    • Faktorių analizė
    • Latentinis Dirichlet paskirstymas (LDA)
    • Isomap
    • Vietinis tiesinis įterpimas (LLE)
    • Latentinė semantinė analizė (LSA)

3. Stiprinamasis mokymasis

Sustiprinimo mokymasis yra mašininio mokymosi algoritmų tipas, kai agentas mokosi priimti nuoseklius sprendimus sąveikaudamas su aplinka. Agentas gauna grįžtamąjį ryšį paskatų ar bausmių forma, pagrįsta jo veiksmais. Agento tikslas yra atrasti optimalią taktiką, kuri laikui bėgant padidintų kaupiamąjį atlygį bandymų ir klaidų būdu. Sustiprinimo mokymasis dažnai naudojamas scenarijuose, kai agentas turi išmokti naršyti aplinkoje, žaisti žaidimus, valdyti robotus arba priimti sprendimus neapibrėžtose situacijose.

Sustiprinimo mokymasis

  • Modeliais pagrįsti metodai:
    • Markovo sprendimų procesai (MDP)
    • Bellmano lygtis
    • Vertės iteracijos algoritmas
    • Monte Karlo medžio paieška
  • Metodai be modelių:
    • Vertė pagrįsti metodai:
      • Q-mokymasis
      • PADAŽAS
      • Monte Karlo metodai
    • Politika pagrįsti metodai:
      • REINFORCE algoritmas
      • Aktoriaus-kritiko algoritmas
    • Aktorių-kritikų metodai
      • Asinchroninio pranašumo aktorius-kritikas (A3C)

Populiaraus mašininio mokymosi algoritmo sąrašas

Čia yra 10 populiariausių mašininio mokymosi algoritmų sąrašas.

1. Tiesinė regresija

Tiesinė regresija yra paprastas algoritmas, naudojamas linijiniam ryšiui tarp įvesties savybių ir nuolatinio tikslinio kintamojo nustatyti. Jis veikia pritaikant liniją prie duomenų ir naudojant eilutę naujoms reikšmėms numatyti.

2. Logistinė regresija

Logistinė regresija yra linijinės regresijos išplėtimas, naudojamas klasifikavimo užduotims atlikti, siekiant įvertinti tikimybę, kad egzempliorius priklauso konkrečiai klasei.

3. SVM (Support Vector Machine)

SVM yra prižiūrimi mokymosi algoritmai, galintys atlikti klasifikavimo ir regresijos užduotis. Jis randa hiperplokštumą, kuri geriausiai atskiria klases funkcijų erdvėje.

4. KNN (K-artimiausias kaimynas)

KNN yra neparametrinė technika, kurią galima naudoti tiek klasifikavimui, tiek regresijai. Jis veikia nustatydamas k labiausiai panašius duomenų taškus į naują duomenų tašką ir numatydamas naujo duomenų taško etiketę, naudodamas tų duomenų taškų etiketes.

5. Sprendimų medis

Sprendimų medžiai yra prižiūrimo mokymosi technikos tipas, kuris gali būti naudojamas klasifikavimui ir regresijai. Jis veikia segmentuodamas duomenis į mažesnes ir mažesnes grupes, kol kiekviena grupė gali būti klasifikuojama arba prognozuojama labai tiksliai.

6. Atsitiktinis miškas

Atsitiktiniai miškai yra ansamblinio mokymosi metodo tipas, kuriame naudojamas sprendimų medžių rinkinys, kad būtų galima prognozuoti, apibendrinant prognozes iš atskirų medžių. Tai pagerina atskirų sprendimų medžių tikslumą ir atsparumą. Jis gali būti naudojamas tiek klasifikavimo, tiek regresijos užduotims atlikti.

7. Naivus Bayesas

Naive Bayes yra tikimybinis klasifikatorius, pagrįstas Bayes teorema, naudojamas klasifikavimo užduotims atlikti. Tai veikia darant prielaidą, kad duomenų taško ypatybės yra nepriklausomos viena nuo kitos.

8. PCA (pagrindinio komponento analizė)

PCA yra matmenų mažinimo metodas, naudojamas duomenims paversti į žemesnių matmenų erdvę, išlaikant kuo daugiau dispersijos. Jis veikia ieškant nurodymų duomenims, kuriuose yra daugiausia variacijų, ir tada projektuojant duomenis į tas nuorodas.

9. Apriori algoritmai

Apriori algoritmas yra tradicinė duomenų gavybos technika, skirta susieti taisyklių gavybai operacijų duomenų bazėse arba duomenų rinkiniuose. Jis skirtas atskleisti ryšius ir modelius tarp dalykų, kurie reguliariai atsiranda kartu atliekant sandorius. Apriori aptinka dažnus elementų rinkinius, tai yra elementų grupės, kurios kartu rodomos operacijose su nurodytu minimaliu palaikymo lygiu.

10. K-Means Clustering

„K-Means“ grupavimas yra neprižiūrimas mokymosi metodas, kurį galima naudoti duomenų taškams grupuoti. Jis veikia ieškant k klasterių duomenyse, kad kiekvieno klasterio duomenų taškai būtų kuo panašesni vienas į kitą ir kuo labiau skiriasi nuo kitų klasterių duomenų taškų.

Atraskite pagrindines mašininio mokymosi koncepcijas mokydamiesi 10 geriausių algoritmų , pavyzdžiui, tiesinė regresija, sprendimų medžiai ir neuroniniai tinklai.

Mašininio mokymosi algoritmas – DUK

1. Kas yra mašininio mokymosi algoritmas?

Mašininio mokymosi algoritmai Tai statistinėmis sąvokomis pagrįsti metodai, leidžiantys kompiuteriams mokytis iš duomenų, atrasti modelius, numatyti arba atlikti užduotis be aiškaus programavimo. Šie algoritmai yra plačiai suskirstyti į tris tipus, t. y. prižiūrimą mokymąsi, neprižiūrimą mokymąsi ir mokymąsi sustiprinant.

2. Kokie yra mašininio mokymosi tipai?

Iš esmės yra trys mašininio mokymosi tipai:

  • Prižiūrimas algoritmas
  • Neprižiūrimas algoritmas
  • Sustiprinimo algoritmas

3. Kuris ML algoritmas yra geriausias prognozavimui?

Idealus mašininio mokymosi metodas numatymui nustatomas pagal a kriterijų skaičius , įskaitant problemos pobūdį, duomenų tipą ir unikalius reikalavimus. Paramos vektorinės mašinos, atsitiktiniai miškai ir gradiento didinimo metodai yra populiarūs prognozuojant darbo krūvius. Kita vertus, algoritmo pasirinkimas turėtų būti pagrįstas konkrečios problemos ir duomenų rinkinio testavimu ir įvertinimu.

4. Kokie yra 10 populiariausių mašinų mokymosi algoritmų?

Žemiau pateikiamas 10 dažniausiai naudojamų mašininio mokymosi (ML) algoritmų sąrašas:

  1. Tiesinė regresija
  2. Logistinė regresija
  3. SVM (Support Vector Machine)
  4. KNN (K-artimiausias kaimynas)
  5. Sprendimų medis
  6. Atsitiktinis miškas
  7. Naivus Bayesas
  8. PCA (pagrindinio komponento analizė)
  9. Apriori algoritmai
  10. K-Means klasterizavimas