logo

Pandas DataFrame.describe()

Apskaičiuojant kai kuriuos statistinius duomenis, naudojamas description() metodas procentilė, vidurkis ir std Series arba DataFrame skaitinių reikšmių. Ji analizuoja skaitmenines ir objektų serijas, taip pat mišrių duomenų tipų „DataFrame“ stulpelių rinkinius.

Sintaksė

 DataFrame.describe(percentiles=None, include=None, exclude=None) 

Parametrai

    procentilis:Tai yra pasirenkamas parametras, kuris yra numerių, kurie turėtų būti nuo 0 iki 1, sąrašas, pavyzdžiui, duomenų tipas. Jo numatytoji reikšmė yra [.25, .5, .75], kuri grąžina 25, 50 ir 75 procentilius.apima:Tai taip pat yra pasirenkamas parametras, apimantis duomenų tipų sąrašą aprašant „DataFrame“. Numatytoji jo reikšmė yra None.Neįtraukti:Tai taip pat yra pasirenkamas parametras, kuris neįtraukia duomenų tipų sąrašo aprašant „DataFrame“. Numatytoji jo reikšmė yra None.

Grąžina

Jis pateikia statistinę Series ir DataFrame santrauką.

1 pavyzdys

 import pandas as pd import numpy as np a1 = pd.Series([1, 2, 3]) a1.describe() 

Išvestis

java įvesties eilutė
 count 3.0 mean 2.0 std 1.0 min 1.0 25% 1.5 50% 2.0 75% 2.5 max 3.0 dtype: float64 

2 pavyzdys

 import pandas as pd import numpy as np a1 = pd.Series(['p', 'q', 'q', 'r']) a1.describe() 

Išvestis

 count 4 unique 3 top q freq 2 dtype: object 

3 pavyzdys

 import pandas as pd import numpy as np a1 = pd.Series([1, 2, 3]) a1.describe() a1 = pd.Series(['p', 'q', 'q', 'r']) a1.describe() info = pd.DataFrame({'categorical': pd.Categorical(['s','t','u']), 'numeric': [1, 2, 3], 'object': ['p', 'q', 'r'] }) info.describe(include=[np.number]) info.describe(include=[np.object]) info.describe(include=['category']) 

Išvestis

 categorical count 3 unique 3 top u freq 1 

4 pavyzdys

 import pandas as pd import numpy as np a1 = pd.Series([1, 2, 3]) a1.describe() a1 = pd.Series(['p', 'q', 'q', 'r']) a1.describe() info = pd.DataFrame({'categorical': pd.Categorical(['s','t','u']), 'numeric': [1, 2, 3], 'object': ['p', 'q', 'r'] }) info.describe() info.describe(include='all') info.numeric.describe() info.describe(include=[np.number]) info.describe(include=[np.object]) info.describe(include=['category']) info.describe(exclude=[np.number]) info.describe(exclude=[np.object]) 

Išvestis

 categorical numeric count 3 3.0 unique 3 NaN top u NaN freq 1 NaN mean NaN 2.0 std NaN 1.0 min NaN 1.0 25% NaN 1.5 50% NaN 2.0 75% NaN 2.5 max NaN 3.0