Pandas seriją galima apibrėžti kaip vienmatį masyvą, galintį saugoti įvairių tipų duomenis. Mes galime lengvai konvertuoti sąrašą, eilutę ir žodyną į serijas naudodami „ serija ' metodas. Serijų eilučių etiketės vadinamos indeksu. Serija negali turėti kelių stulpelių. Jis turi tokį parametrą:
Serijos kūrimas:
Mes galime sukurti seriją dviem būdais:
- Sukurkite tuščią seriją
- Sukurkite seriją naudodami įvestis.
Sukurkite tuščią seriją:
„Pandas“ galime lengvai sukurti tuščią seriją, o tai reiškia, kad ji neturės jokios vertės.
Sintaksė, naudojama kuriant tuščią seriją:
= pandas.Series()
Toliau pateiktame pavyzdyje sukuriamas tuščios serijos tipo objektas, kuris neturi reikšmių ir turi numatytąjį duomenų tipą, t. plūdė64 .
Pavyzdys
windows.open javascript
import pandas as pd x = pd.Series() print (x)
Išvestis
Series([], dtype: float64)
Serijos kūrimas naudojant įvestis:
Mes galime sukurti serijas naudodami įvairius įvestis:
- Masyvas
- Dikt
- Skaliarinė vertė
Serijos kūrimas iš masyvo:
Prieš kurdami seriją, pirmiausia turime importuoti nelygus modulį, tada programoje naudokite funkciją array(). Jei duomenys yra ndarray, tada perduodamas indeksas turi būti tokio pat ilgio.
Jei neperduodame indekso, tada pagal nutylėjimą indeksas diapazonas (n) yra perduodamas, kur n apibrėžia masyvo ilgį, ty [0,1,2,.... diapazonas(len(masyvas))-1 ].
1 milijonas kiek 0
Pavyzdys
import pandas as pd import numpy as np info = np.array(['P','a','n','d','a','s']) a = pd.Series(info) print(a)
Išvestis
0 P 1 a 2 n 3 d 4 a 5 s dtype: object
Sukurkite seriją iš dikto
Taip pat galime sukurti seriją iš dikto. Jei žodyno objektas perduodamas kaip įvestis, o indeksas nenurodytas, tada žodyno raktai paimami surūšiuota tvarka, kad būtų sudarytas indeksas .
Jei indeksas perduodamas, vertės atitinka tam tikrą indekso etiketę, kuri bus išgauta iš žodynas .
#import the pandas library import pandas as pd import numpy as np info = {'x' : 0., 'y' : 1., 'z' : 2.} a = pd.Series(info) print (a)
Išvestis
x 0.0 y 1.0 z 2.0 dtype: float64
Sukurkite seriją naudodami skaliarą:
pjaustyti java
Jei imsime skaliarines reikšmes, tada turi būti pateiktas indeksas. Skaliarinė vertė bus pakartota, kad atitiktų indekso ilgį.
#import pandas library import pandas as pd import numpy as np x = pd.Series(4, index=[0, 1, 2, 3]) print (x)
Išvestis
0 4 1 4 2 4 3 4 dtype: int64
Prieiga prie duomenų iš serijų su pozicija:
Sukūrę serijos tipo objektą, galite pasiekti jo indeksus, duomenis ir net atskirus elementus.
Serijos duomenis galima pasiekti panašiai kaip ir ndarray.
import pandas as pd x = pd.Series([1,2,3],index = ['a','b','c']) #retrieve the first element print (x[0])
Išvestis
1
Serijos objektų atributai
Atributas Serija apibrėžiamas kaip bet kokia informacija, susijusi su serijos objektu, pvz., dydis, duomenų tipas. ir tt Žemiau yra keletas atributų, kuriuos galite naudoti norėdami gauti informaciją apie serijos objektą:
Atributai | apibūdinimas |
---|---|
Series.index | Apibrėžia serijos indeksą. |
Serija.forma | Jis grąžina duomenų formos eilutę. |
Series.dtype | Jis grąžina duomenų tipą. |
Serija.dydis | Jis grąžina duomenų dydį. |
Serija.tuščia | Jis grąžina True, jei serijos objektas yra tuščias, kitu atveju grąžina false. |
Serija.hasnans | Jis grąžina True, jei yra kokių nors NaN reikšmių, kitu atveju grąžina false. |
Serija.nbaitų | Jis grąžina duomenų baitų skaičių. |
Serija aš | Jis grąžina duomenų matmenų skaičių. |
Serija.elementų dydis | Jis grąžina elemento duomenų tipo dydį. |
Serija objekto indeksų masyvo ir duomenų masyvo gavimas
Mes galime gauti esamo serijos objekto indeksų masyvą ir duomenų masyvą naudodami atributų indeksą ir reikšmes.
import numpy as np import pandas as pd x=pd.Series(data=[2,4,6,8]) y=pd.Series(data=[11.2,18.6,22.5], index=['a','b','c']) print(x.index) print(x.values) print(y.index) print(y.values)
Išvestis
RangeIndex(start=0, stop=4, step=1) [2 4 6 8] Index(['a', 'b', 'c'], dtype='object') [11.2 18.6 22.5]
Tipų (dtype) ir tipo dydžio (elemento dydis) gavimas
Galite naudoti atributą dtype su serijos objektu kaip dtype, norėdami gauti atskiro serijos objekto elemento duomenų tipą, galite naudoti elementuoti atributas, rodantis kiekvienam duomenų elementui priskirtų baitų skaičių.
Išbandykite duomenų struktūrą
import numpy as np import pandas as pd a=pd.Series(data=[1,2,3,4]) b=pd.Series(data=[4.9,8.2,5.6], index=['x','y','z']) print(a.dtype) print(a.itemsize) print(b.dtype) print(b.itemsize)
Išvestis
int64 8 float64 8
Formos atkūrimas
Serija objekto forma apibrėžia bendrą elementų skaičių, įskaitant trūkstamas arba tuščias reikšmes (NaN).
import numpy as np import pandas as pd a=pd.Series(data=[1,2,3,4]) b=pd.Series(data=[4.9,8.2,5.6],index=['x','y','z']) print(a.shape) print(b.shape)
Išvestis
(4,) (3,)
Gaunamas matmuo, dydis ir baitų skaičius:
import numpy as np import pandas as pd a=pd.Series(data=[1,2,3,4]) b=pd.Series(data=[4.9,8.2,5.6], index=['x','y','z']) print(a.ndim, b.ndim) print(a.size, b.size) print(a.nbytes, b.nbytes)
Išvestis
1 1 4 3 32 24
NaN tuštumos ir buvimo tikrinimas
Norėdami patikrinti, ar serijos objektas tuščias, galite naudoti tuščias atributas . Panašiai, norėdami patikrinti, ar serijos objekte yra kai kurių NaN reikšmių, galite naudoti hassanas atributas.
Pavyzdys
import numpy as np import pandas as pd a=pd.Series(data=[1,2,3,np.NaN]) b=pd.Series(data=[4.9,8.2,5.6],index=['x','y','z']) c=pd.Series() print(a.empty,b.empty,c.empty) print(a.hasnans,b.hasnans,c.hasnans) print(len(a),len(b)) print(a.count( ),b.count( ))
Išvestis
False False True True False False 4 3 3 3
Serijos funkcijos
Serija naudoja keletą funkcijų, kurios yra šios:
Funkcijos | apibūdinimas |
---|---|
Pandos Series.map() | Susiekite reikšmes iš dviejų serijų, turinčių bendrą stulpelį. |
Pandos Series.std() | Apskaičiuokite nurodyto skaičių, duomenų rėmelio, stulpelio ir eilučių rinkinio standartinį nuokrypį. |
Pandos Series.to_frame() | Konvertuokite serijos objektą į duomenų rėmelį. |
Pandos Series.value_counts() | Pateikia seriją, kurioje yra unikalių verčių skaičius. |