logo

Pandas DataFrame corr() Metodas

Pandos dataframe.corr() naudojamas norint rasti porinę visų stulpelių koreliaciją Pandas duomenų rėmelyje Python. Bet koks NaN vertės automatiškai neįtraukiamos. Jei norite nepaisyti jokių neskaitinių reikšmių, naudokite parametrą numeric_only = True. Šiame straipsnyje mes sužinosime apie DataFrame.corr() metodą Python .

Pandas DataFrame corr() Metodo sintaksė

Sintaksė: DataFrame.corr(self, method='pearson', min_periods=1, numeric_only = False)



Parametrai:

  • metodas:
    • Pearsonas: standartinis koreliacijos koeficientas
    • Kendall: Kendall Tau koreliacijos koeficientas
    • spearman: Spearman rango koreliacija
  • min_periods : Minimalus stebėjimų skaičius, reikalingas vienai stulpelių porai, kad rezultatas būtų tinkamas. Šiuo metu galima tik Pearsono ir Spearman koreliacijai
  • numeric_only : ar turi būti naudojamos tik skaitinės reikšmės, ar ne. Pagal numatytuosius nustatymus jis nustatytas į False.

Grąžina: count :y : DataFrame

Pandos duomenų koreliacijos corr() metodas

Gera koreliacija priklauso nuo naudojimo, tačiau galima drąsiai teigti, kad turite bent 0,6 (arba -0,6), kad tai būtų galima vadinti gera koreliacija. Paprastas pavyzdys, rodantis, kaip veikia koreliacija Python .



Python3






import> pandas as pd> df>=> {> >'Array_1'>: [>30>,>70>,>100>],> >'Array_2'>: [>65.1>,>49.50>,>30.7>]> }> data>=> pd.DataFrame(df)> print>(data.corr())>

>

>

Išvestis

 Array_1 Array_2 Array_1 1.000000 -0.990773 Array_2 -0.990773 1.000000>

Pavyzdinio duomenų rėmelio kūrimas

Pirmųjų 10 duomenų rėmelio eilučių spausdinimas.

Pastaba: Kintamojo koreliacija su pačiu savimi yra 1. Norėdami gauti nuorodą į CSV failą, naudojamą kode, spustelėkite čia

Python3




# importing pandas as pd> import> pandas as pd> # Making data frame from the csv file> df>=> pd.read_csv(>'nba.csv'>)> # Printing the first 10 rows of the data frame for visualization> df[:>10>]>

>

>

Išvestis

Pandos duomenų koreliacijos

Python Pandas DataFrame corr() metodo pavyzdžiai

Raskite koreliaciją tarp stulpelių naudodami Pearsono metodą

Čia mes naudojame funkciją corr () norėdami rasti koreliaciją tarp duomenų rėmo stulpelių naudodami „Pearson“ metodą. Duomenų rėmelyje turime tik keturis skaitinius stulpelius. Išvesties duomenų rėmelis gali būti interpretuojamas kaip bet kuriame langelyje, eilutės kintamojo koreliacija su stulpelio kintamuoju yra langelio reikšmė. Kaip minėta anksčiau, kintamojo koreliacija su savimi yra 1. Dėl šios priežasties visos įstrižainės reikšmės yra 1,00.

Python3




# To find the correlation among> # the columns using pearson method> df.corr(method>=>'pearson'>)>

>

>

Išvestis

Pandos duomenų koreliacijos

k artimiausias kaimynas

Raskite koreliaciją tarp stulpelių naudodami Kendall metodą

Naudokite funkciją Pandas df.corr(), kad rastumėte koreliaciją tarp duomenų rėmelio stulpelių, naudodami „kendall“ metodą. Išvesties duomenų rėmelis gali būti interpretuojamas kaip bet kuriame langelyje, eilutės kintamojo koreliacija su stulpelio kintamuoju yra langelio reikšmė. Kaip minėta anksčiau, kintamojo koreliacija su savimi yra 1. Dėl šios priežasties visos įstrižainės reikšmės yra 1,00.

Python3




# importing pandas as pd> import> pandas as pd> # Making data frame from the csv file> df>=> pd.read_csv(>'nba.csv'>)> # To find the correlation among> # the columns using kendall method> df.corr(method>=>'kendall'>)>

>

>

Išvestis

dataframe.corr