PANDAS DATAFRAME CORR() METODAS

Pandos dataframe.corr() naudojamas norint rasti porinę visų stulpelių koreliaciją Pandas duomenų rėmelyje Python. Bet koks NaN vertės automatiškai neįtraukiamos. Jei norite nepaisyti jokių neskaitinių reikšmių, naudokite parametrą numeric_only = True. Šiame straipsnyje mes sužinosime apie DataFrame.corr() metodą Python .

Pandas DataFrame corr() Metodo sintaksė

Sintaksė: DataFrame.corr(self, method='pearson', min_periods=1, numeric_only = False)

Parametrai:

metodas:

Pearsonas: standartinis koreliacijos koeficientas

Kendall: Kendall Tau koreliacijos koeficientas

spearman: Spearman rango koreliacija

min_periods : Minimalus stebėjimų skaičius, reikalingas vienai stulpelių porai, kad rezultatas būtų tinkamas. Šiuo metu galima tik Pearsono ir Spearman koreliacijai

numeric_only : ar turi būti naudojamos tik skaitinės reikšmės, ar ne. Pagal numatytuosius nustatymus jis nustatytas į False.

Grąžina: count :y : DataFrame

Pandos duomenų koreliacijos corr() metodas

Gera koreliacija priklauso nuo naudojimo, tačiau galima drąsiai teigti, kad turite bent 0,6 (arba -0,6), kad tai būtų galima vadinti gera koreliacija. Paprastas pavyzdys, rodantis, kaip veikia koreliacija Python .

Python3

import> pandas as pd> df>=> {> >'Array_1'>: [>30>,>70>,>100>],> >'Array_2'>: [>65.1>,>49.50>,>30.7>]> }> data>=> pd.DataFrame(df)> print>(data.corr())>

Išvestis

 Array_1 Array_2 Array_1 1.000000 -0.990773 Array_2 -0.990773 1.000000>

Pavyzdinio duomenų rėmelio kūrimas

Pirmųjų 10 duomenų rėmelio eilučių spausdinimas.

Pastaba: Kintamojo koreliacija su pačiu savimi yra 1. Norėdami gauti nuorodą į CSV failą, naudojamą kode, spustelėkite čia

Python3

# importing pandas as pd> import> pandas as pd> # Making data frame from the csv file> df>=> pd.read_csv(>'nba.csv'>)> # Printing the first 10 rows of the data frame for visualization> df[:>10>]>

Išvestis

Pandos duomenų koreliacijos

Python Pandas DataFrame corr() metodo pavyzdžiai

Raskite koreliaciją tarp stulpelių naudodami Pearsono metodą

Čia mes naudojame funkciją corr () norėdami rasti koreliaciją tarp duomenų rėmo stulpelių naudodami „Pearson“ metodą. Duomenų rėmelyje turime tik keturis skaitinius stulpelius. Išvesties duomenų rėmelis gali būti interpretuojamas kaip bet kuriame langelyje, eilutės kintamojo koreliacija su stulpelio kintamuoju yra langelio reikšmė. Kaip minėta anksčiau, kintamojo koreliacija su savimi yra 1. Dėl šios priežasties visos įstrižainės reikšmės yra 1,00.

Python3

# To find the correlation among> # the columns using pearson method> df.corr(method>=>'pearson'>)>

Išvestis

Pandos duomenų koreliacijos

k artimiausias kaimynas

Raskite koreliaciją tarp stulpelių naudodami Kendall metodą

Naudokite funkciją Pandas df.corr(), kad rastumėte koreliaciją tarp duomenų rėmelio stulpelių, naudodami „kendall“ metodą. Išvesties duomenų rėmelis gali būti interpretuojamas kaip bet kuriame langelyje, eilutės kintamojo koreliacija su stulpelio kintamuoju yra langelio reikšmė. Kaip minėta anksčiau, kintamojo koreliacija su savimi yra 1. Dėl šios priežasties visos įstrižainės reikšmės yra 1,00.

Python3

# importing pandas as pd> import> pandas as pd> # Making data frame from the csv file> df>=> pd.read_csv(>'nba.csv'>)> # To find the correlation among> # the columns using kendall method> df.corr(method>=>'kendall'>)>

Išvestis

dataframe.corr

TechCodeview

Pandas DataFrame corr() Metodo sintaksė

Pandos duomenų koreliacijos corr() metodas

Python3

Pavyzdinio duomenų rėmelio kūrimas

Python3

Python Pandas DataFrame corr() metodo pavyzdžiai

Raskite koreliaciją tarp stulpelių naudodami Pearsono metodą

Python3

Raskite koreliaciją tarp stulpelių naudodami Kendall metodą

Python3