logo

Python Pandas serija

Pandas seriją galima apibrėžti kaip vienmatį masyvą, galintį saugoti įvairių tipų duomenis. Mes galime lengvai konvertuoti sąrašą, eilutę ir žodyną į serijas naudodami „ serija ' metodas. Serijų eilučių etiketės vadinamos indeksu. Serija negali turėti kelių stulpelių. Jis turi tokį parametrą:

    duomenys:Tai gali būti bet koks sąrašas, žodynas arba skaliarinė reikšmė.indeksas:Indekso reikšmė turi būti unikali ir pritaikyta maišytis. Jis turi būti tokio pat ilgio kaip ir duomenys. Jei neperduodame jokio indekso, numatytasis np.arrange(n) Bus panaudota.dtype:Tai nurodo serijos duomenų tipą.kopija:Jis naudojamas duomenims kopijuoti.

Serijos kūrimas:

Mes galime sukurti seriją dviem būdais:

  1. Sukurkite tuščią seriją
  2. Sukurkite seriją naudodami įvestis.

Sukurkite tuščią seriją:

„Pandas“ galime lengvai sukurti tuščią seriją, o tai reiškia, kad ji neturės jokios vertės.

Sintaksė, naudojama kuriant tuščią seriją:

 = pandas.Series() 

Toliau pateiktame pavyzdyje sukuriamas tuščios serijos tipo objektas, kuris neturi reikšmių ir turi numatytąjį duomenų tipą, t. plūdė64 .

Pavyzdys

windows.open javascript
 import pandas as pd x = pd.Series() print (x) 

Išvestis

 Series([], dtype: float64) 

Serijos kūrimas naudojant įvestis:

Mes galime sukurti serijas naudodami įvairius įvestis:

  • Masyvas
  • Dikt
  • Skaliarinė vertė

Serijos kūrimas iš masyvo:

Prieš kurdami seriją, pirmiausia turime importuoti nelygus modulį, tada programoje naudokite funkciją array(). Jei duomenys yra ndarray, tada perduodamas indeksas turi būti tokio pat ilgio.

Jei neperduodame indekso, tada pagal nutylėjimą indeksas diapazonas (n) yra perduodamas, kur n apibrėžia masyvo ilgį, ty [0,1,2,.... diapazonas(len(masyvas))-1 ].

1 milijonas kiek 0

Pavyzdys

 import pandas as pd import numpy as np info = np.array(['P','a','n','d','a','s']) a = pd.Series(info) print(a) 

Išvestis

 0 P 1 a 2 n 3 d 4 a 5 s dtype: object 

Sukurkite seriją iš dikto

Taip pat galime sukurti seriją iš dikto. Jei žodyno objektas perduodamas kaip įvestis, o indeksas nenurodytas, tada žodyno raktai paimami surūšiuota tvarka, kad būtų sudarytas indeksas .

Jei indeksas perduodamas, vertės atitinka tam tikrą indekso etiketę, kuri bus išgauta iš žodynas .

 #import the pandas library import pandas as pd import numpy as np info = {'x' : 0., 'y' : 1., 'z' : 2.} a = pd.Series(info) print (a) 

Išvestis

 x 0.0 y 1.0 z 2.0 dtype: float64 

Sukurkite seriją naudodami skaliarą:

pjaustyti java

Jei imsime skaliarines reikšmes, tada turi būti pateiktas indeksas. Skaliarinė vertė bus pakartota, kad atitiktų indekso ilgį.

 #import pandas library import pandas as pd import numpy as np x = pd.Series(4, index=[0, 1, 2, 3]) print (x) 

Išvestis

 0 4 1 4 2 4 3 4 dtype: int64 

Prieiga prie duomenų iš serijų su pozicija:

Sukūrę serijos tipo objektą, galite pasiekti jo indeksus, duomenis ir net atskirus elementus.

Serijos duomenis galima pasiekti panašiai kaip ir ndarray.

 import pandas as pd x = pd.Series([1,2,3],index = ['a','b','c']) #retrieve the first element print (x[0]) 

Išvestis

 1 

Serijos objektų atributai

Atributas Serija apibrėžiamas kaip bet kokia informacija, susijusi su serijos objektu, pvz., dydis, duomenų tipas. ir tt Žemiau yra keletas atributų, kuriuos galite naudoti norėdami gauti informaciją apie serijos objektą:

Atributai apibūdinimas
Series.index Apibrėžia serijos indeksą.
Serija.forma Jis grąžina duomenų formos eilutę.
Series.dtype Jis grąžina duomenų tipą.
Serija.dydis Jis grąžina duomenų dydį.
Serija.tuščia Jis grąžina True, jei serijos objektas yra tuščias, kitu atveju grąžina false.
Serija.hasnans Jis grąžina True, jei yra kokių nors NaN reikšmių, kitu atveju grąžina false.
Serija.nbaitų Jis grąžina duomenų baitų skaičių.
Serija aš Jis grąžina duomenų matmenų skaičių.
Serija.elementų dydis Jis grąžina elemento duomenų tipo dydį.

Serija objekto indeksų masyvo ir duomenų masyvo gavimas

Mes galime gauti esamo serijos objekto indeksų masyvą ir duomenų masyvą naudodami atributų indeksą ir reikšmes.

 import numpy as np import pandas as pd x=pd.Series(data=[2,4,6,8]) y=pd.Series(data=[11.2,18.6,22.5], index=['a','b','c']) print(x.index) print(x.values) print(y.index) print(y.values) 

Išvestis

 RangeIndex(start=0, stop=4, step=1) [2 4 6 8] Index(['a', 'b', 'c'], dtype='object') [11.2 18.6 22.5] 

Tipų (dtype) ir tipo dydžio (elemento dydis) gavimas

Galite naudoti atributą dtype su serijos objektu kaip dtype, norėdami gauti atskiro serijos objekto elemento duomenų tipą, galite naudoti elementuoti atributas, rodantis kiekvienam duomenų elementui priskirtų baitų skaičių.

Išbandykite duomenų struktūrą
 import numpy as np import pandas as pd a=pd.Series(data=[1,2,3,4]) b=pd.Series(data=[4.9,8.2,5.6], index=['x','y','z']) print(a.dtype) print(a.itemsize) print(b.dtype) print(b.itemsize) 

Išvestis

 int64 8 float64 8 

Formos atkūrimas

Serija objekto forma apibrėžia bendrą elementų skaičių, įskaitant trūkstamas arba tuščias reikšmes (NaN).

 import numpy as np import pandas as pd a=pd.Series(data=[1,2,3,4]) b=pd.Series(data=[4.9,8.2,5.6],index=['x','y','z']) print(a.shape) print(b.shape) 

Išvestis

 (4,) (3,) 

Gaunamas matmuo, dydis ir baitų skaičius:

 import numpy as np import pandas as pd a=pd.Series(data=[1,2,3,4]) b=pd.Series(data=[4.9,8.2,5.6], index=['x','y','z']) print(a.ndim, b.ndim) print(a.size, b.size) print(a.nbytes, b.nbytes) 

Išvestis

 1 1 4 3 32 24 

NaN tuštumos ir buvimo tikrinimas

Norėdami patikrinti, ar serijos objektas tuščias, galite naudoti tuščias atributas . Panašiai, norėdami patikrinti, ar serijos objekte yra kai kurių NaN reikšmių, galite naudoti hassanas atributas.

Pavyzdys

 import numpy as np import pandas as pd a=pd.Series(data=[1,2,3,np.NaN]) b=pd.Series(data=[4.9,8.2,5.6],index=['x','y','z']) c=pd.Series() print(a.empty,b.empty,c.empty) print(a.hasnans,b.hasnans,c.hasnans) print(len(a),len(b)) print(a.count( ),b.count( )) 

Išvestis

 False False True True False False 4 3 3 3 

Serijos funkcijos

Serija naudoja keletą funkcijų, kurios yra šios:

Funkcijos apibūdinimas
Pandos Series.map() Susiekite reikšmes iš dviejų serijų, turinčių bendrą stulpelį.
Pandos Series.std() Apskaičiuokite nurodyto skaičių, duomenų rėmelio, stulpelio ir eilučių rinkinio standartinį nuokrypį.
Pandos Series.to_frame() Konvertuokite serijos objektą į duomenų rėmelį.
Pandos Series.value_counts() Pateikia seriją, kurioje yra unikalių verčių skaičius.