Pandas DataFrame yra dvimatė pažymėta duomenų struktūra, pavyzdžiui, lentelė su eilutėmis ir stulpeliais. „DataFrame“ dydis ir reikšmės yra keičiami, ty gali būti keičiami.
„DataFrame“ dažniausiai naudojamas duomenų analizei ir duomenų apdorojimui. Tai leidžia saugoti duomenis lentelės pavidalu, pvz., SQL duomenų bazėje, MS Excel arba Google Sheets, todėl lengviau atlikti aritmetines duomenų operacijas.
Tai dažniausiai naudojamas pandų objektas. The DataFrame() funkcija naudojamas kuriant duomenų rėmelį Pandas. Taip pat galite sukurti Pandas DataFrame keliais būdais.
Pandas Dataframe() sintaksė
pandas.DataFrame(duomenys, indeksas, stulpeliai)
jasmine Davis vaikystėje
Parametrai:
- duomenis : tai duomenų rinkinys, iš kurio turi būti sukurtas DataFrame. Tai gali būti sąrašas, žodynas, skaliarinė reikšmė, serija, masyvai ir kt.
- indeksas : Tai neprivaloma, pagal numatytuosius nustatymus DataFrame indeksas prasideda nuo 0 ir baigiasi paskutine duomenų verte (n-1). Jis aiškiai apibrėžia eilutės etiketę.
- stulpelius : Šis parametras naudojamas pateikti stulpelių pavadinimus DataFrame. Jei stulpelio pavadinimas neapibrėžtas pagal numatytuosius nustatymus, jo reikšmė bus nuo 0 iki n-1.
Grąžinimai:
- DataFrame objektas
Dabar, kai aptarėme „DataFrame()“ funkciją, pažvelkime į įvairius „DataFrame“ kūrimo būdus:
Įvairūs būdai sukurti duomenų rėmelį Python
Yra keletas būdų, kaip sukurti a Pandos duomenų rėmelis in Python . „DataFrame“ galite sukurti šiais būdais:
- Sukurkite Pandas DataFrame naudodami DataFrame() funkciją
- Sukurkite Pandas DataFrame iš sąrašų sąrašo
- Sukurkite Pandas DataFrame iš ndarray/list žodyno
- Sukurkite Pandas DataFrame iš žodynų sąrašo
- Sukurkite Pandas DataFrame iš serijos žodyno
- DataFrame kūrimas naudojant zip() funkciją
- „DataFrame“ kūrimas aiškiai įrodant indekso etiketę
Sukurkite tuščią duomenų rėmelį naudodami DataFrame() metodą
„DataFrame“ programoje Python gali būti sukurta naudojant „DataFrame()“ funkciją Pandos biblioteka . Tiesiog iškvieskite funkciją naudodami „DataFrame“ konstruktorių, kad sukurtumėte „DataFrame“.
Pavyzdys : tuščio „DataFrame“ sukūrimas naudojant „Python“ funkciją „DataFrame()“.
Python3
# Importing Pandas to create DataFrame> import> pandas as pd> # Creating Empty DataFrame and Storing it in variable df> df> => pd.DataFrame()> # Printing Empty DataFrame> print> (df)> |
>
>
Išvestis:
Empty DataFrame Columns: [] Index: []>
Sukurkite DataFrame iš sąrašų sąrašų
Norėdami sukurti Pandas DataFrame iš a sąrašą sąrašų, galite naudoti pd.DataFrame() funkciją. Ši funkcija naudoja sąrašų sąrašą kaip įvestį ir sukuria duomenų rėmelį su tokiu pat eilučių ir stulpelių skaičiumi kaip ir įvesties sąraše.
Pavyzdys : DataFrame kūrimas iš sąrašų sąrašų naudojant DataFrame() metodą
Python3
# Import pandas library> import> pandas as pd> # initialize list of lists> data> => [[> 'tom'> ,> 10> ], [> 'nick'> ,> 15> ], [> 'juli'> ,> 14> ]]> # Create the pandas DataFrame> df> => pd.DataFrame(data, columns> => [> 'Name'> ,> 'Age'> ])> # print dataframe.> print> (df)> |
>
>
Išvestis:
Name Age 0 tom 10 1 nick 15 2 juli 14>
Sukurkite „DataFrame“ iš „ndArray/Lists“ žodyno
Norėdami sukurti DataFrame iš a žodynas apie ndarrays /lists, visi masyvai turi būti vienodo ilgio. Jei indeksas perduodamas, ilgio indeksas turi būti lygus masyvų ilgiui.
Jei indeksas nepateikiamas, pagal numatytuosius nustatymus indeksas bus diapazonas (n), kur n yra masyvo ilgis.
Pavyzdys : DataFrame kūrimas iš ndarray/lists žodyno
Python3
eilutė c
# Python code demonstrate creating> # DataFrame from dict narray / lists> # By default addresses.> import> pandas as pd> # initialize data of lists.> data> => {> 'Name'> : [> 'Tom'> ,> 'nick'> ,> 'krish'> ,> 'jack'> ],> > 'Age'> : [> 20> ,> 21> ,> 19> ,> 18> ]}> # Create DataFrame> df> => pd.DataFrame(data)> # Print the output.> print> (df)> |
>
>
Išvestis:
Name Age 0 Tom 20 1 nick 21 2 krish 19 3 jack 18>
Pastaba: Kuriant DataFrame naudojant žodyną, pagal numatytuosius nustatymus žodyno raktai bus stulpelių pavadinimai. Taip pat galime aiškiai pateikti stulpelių pavadinimus naudodami stulpelio parametrą.
Sukurkite DataFrame iš žodynų sąrašo
Pandas DataFrame galima sukurti perduodant žodynų sąrašai kaip įvesties duomenys. Pagal numatytuosius nustatymus žodyno raktai bus laikomi stulpeliais.
Python3
jdbc jdbc
# Python code demonstrate how to create> # Pandas DataFrame by lists of dicts.> import> pandas as pd> # Initialize data to lists.> data> => [{> 'a'> :> 1> ,> 'b'> :> 2> ,> 'c'> :> 3> },> > {> 'a'> :> 10> ,> 'b'> :> 20> ,> 'c'> :> 30> }]> # Creates DataFrame.> df> => pd.DataFrame(data)> # Print the data> print> (df)> |
>
>
Išvestis:
a b c 0 1 2 3 1 10 20 30>
Kitas pavyzdys – sukurti Pandas DataFrame perduodant žodynų sąrašus ir eilučių indeksai .
Python3
# Python code demonstrate to create> # Pandas DataFrame by passing lists of> # Dictionaries and row indices.> import> pandas as pd> # Initialize data of lists> data> => [{> 'b'> :> 2> ,> 'c'> :> 3> }, {> 'a'> :> 10> ,> 'b'> :> 20> ,> 'c'> :> 30> }]> # Creates pandas DataFrame by passing> # Lists of dictionaries and row index.> df> => pd.DataFrame(data, index> => [> 'first'> ,> 'second'> ])> # Print the data> print> (df)> |
>
>
Išvestis:
b c a first 2 3 NaN second 20 30 10.0>
Sukurkite DataFrame iš serijos žodyno
Norėdami sukurti duomenų rėmelį iš žodyno serija , galima perduoti žodyną, kad būtų suformuotas duomenų rėmelis. Gautas indeksas yra visų patvirtintų indeksuotų serijų sąjunga.
Pavyzdys: DataFrame kūrimas iš serijų žodyno.
Python3
saulėtas deol
# Python code demonstrate creating> # Pandas Dataframe from Dicts of series.> import> pandas as pd> # Initialize data to Dicts of series.> d> => {> 'one'> : pd.Series([> 10> ,> 20> ,> 30> ,> 40> ],> > index> => [> 'a'> ,> 'b'> ,> 'c'> ,> 'd'> ]),> > 'two'> : pd.Series([> 10> ,> 20> ,> 30> ,> 40> ],> > index> => [> 'a'> ,> 'b'> ,> 'c'> ,> 'd'> ])}> # creates Dataframe.> df> => pd.DataFrame(d)> # print the data.> print> (df)> |
>
>
Išvestis:
one two a 10 10 b 20 20 c 30 30 d 40 40>
Sukurkite DataFrame naudodami funkciją zip ().
Du sąrašus galima sujungti naudojant zip() funkcija . Dabar sukurkite Pandas DataFrame iškviesdami funkciją pd.DataFrame().
Pavyzdys: DataFrame kūrimas naudojant zip() funkciją.
Python3
# Python program to demonstrate creating> # pandas Dataframe from lists using zip.> import> pandas as pd> # List1> Name> => [> 'tom'> ,> 'krish'> ,> 'nick'> ,> 'juli'> ]> # List2> Age> => [> 25> ,> 30> ,> 26> ,> 22> ]> # get the list of tuples from two lists.> # and merge them by using zip().> list_of_tuples> => list> (> zip> (Name, Age))> # Assign data to tuples.> list_of_tuples> # Converting lists of tuples into> # pandas Dataframe.> df> => pd.DataFrame(list_of_tuples,> > columns> => [> 'Name'> ,> 'Age'> ])> # Print data.> print> (df)> |
>
>
Išvestis:
momentinė java
Name Age 0 tom 25 1 krish 30 2 nick 26 3 juli 22>
Sukurkite DataFrame aiškiai įrodydami indekso etiketę
Norėdami sukurti DataFrame aiškiai pateikdami indekso etiketę, galite naudoti konstruktoriaus pd.DataFrame() indekso parametrą. Indekso parametras kaip įvestį paima indekso etikečių sąrašą, o DataFrame naudos šias etiketes DataFrame eilutėms.
Pavyzdys: „DataFrame“ kūrimas aiškiai įrodant indekso etiketę
Python3
# Python code demonstrate creating> # pandas DataFrame with indexed by> # DataFrame using arrays.> import> pandas as pd> # initialize data of lists.> data> => {> 'Name'> : [> 'Tom'> ,> 'Jack'> ,> 'nick'> ,> 'juli'> ],> > 'marks'> : [> 99> ,> 98> ,> 95> ,> 90> ]}> # Creates pandas DataFrame.> df> => pd.DataFrame(data, index> => [> 'rank1'> ,> > 'rank2'> ,> > 'rank3'> ,> > 'rank4'> ])> # print the data> print> (df)> |
>
>
Išvestis:
Name marks rank1 Tom 99 rank2 Jack 98 rank3 nick 95 rank4 juli 90>
Išvada
Python Pandas DataFrame yra panašus į lentelę su eilutėmis ir stulpeliais. Tai dvimatė duomenų struktūra ir labai naudinga duomenų analizei ir duomenų apdorojimui.
Šioje pamokoje aptarėme kelis Pandas DataFrame kūrimo būdus. Naudodami šią mokymo programą galėsite susidoroti su bet kokiu sudėtingu „DataFrame“ kūrimo reikalavimu.