logo

Kaip rūšiuoti Pandas DataFrame?

Rūšiavimą galime atlikti Pandas Dataframe. Šiame straipsnyje bus aptarta, kaip rūšiuoti Pandas DataFrame naudojant įvairius metodus Python .

Duomenų rėmelių rūšiavimas programoje Pandas

Kuriant a Pandos duomenų rėmelis Demonstracijai Čia sukūrėme duomenų rėmelį, kuriame atliksime įvairias rūšiavimo funkcijas.

Python3






nfa pavyzdžiai

# importing pandas library> import> pandas as pd> # creating and initializing a nested list> age_list>=> [[>'Afghanistan'>,>1952>,>8425333>,>'Asia'>],> >[>'Australia'>,>1957>,>9712569>,>'Oceania'>],> >[>'Brazil'>,>1962>,>76039390>,>'Americas'>],> >[>'China'>,>1957>,>637408000>,>'Asia'>],> >[>'France'>,>1957>,>44310863>,>'Europe'>],> >[>'India'>,>1952>,>3.72e>+>08>,>'Asia'>],> >[>'United States'>,>1957>,>171984000>,>'Americas'>]]> # creating a pandas dataframe> df>=> pd.DataFrame(age_list, columns>=>[>'Country'>,>'Year'>,> >'Population'>,>'Continent'>])> df>

>

>

Išvestis

Rūšiuoti Pandas DataFrame

Rūšiuoti Pandas DataFrame

Pandos duomenų rėmelio rūšiavimas

Norint surūšiuoti duomenų rėmelį pandose, funkcija Rūšiuoti_vertes() yra naudojamas. Pandos sort_values() gali rūšiuoti duomenų rėmelį didėjančia arba mažėjančia tvarka.

Pandas DataFrame Rūšiavimas didėjančia tvarka

Kodo fragmentas surūšiuoja DataFrame df didėjimo tvarka pagal stulpelį „Šalis“. Tačiau jis nesaugo ir nerodo surūšiuotų duomenų rėmelio.

Python3




# Sorting by column 'Country'> df.sort_values(by>=>[>'Country'>])>

>

>

Išvestis:

Rūšiuoti Pandas DataFrame

Rūšiuoti Pandas DataFrame

Pandas DataFrame rūšiavimas mažėjimo tvarka

„DataFrame df“ bus rūšiuojama mažėjančia tvarka pagal stulpelį „Gyventojų skaičius“, o šalis, kurioje daugiausia gyventojų, bus rodoma „DataFrame“ viršuje.

Python3




# Sorting by column 'Population'> df.sort_values(by>=>[>'Population'>], ascending>=>False>)>

>

>

Išvestis:

Rūšiuoti Pandas DataFrame

Rūšiuoti Pandas DataFrame

Rūšiuoti Pandas DataFrame pagal atranką

Čia mes rūšiuojame DataFrame (df>), remiantis stulpeliu „Gyventojai“, sutvarkydami eilutes su trūkstamomis reikšmėmis „Gyventojų skaičius“, kad jos būtų rodomos pirmiausia. Thesort_values()>metodas suna_position='first'>argumentu tai pasiekiama, pirmenybę teikiant eilutėms su trūkstamomis reikšmėmis surūšiuoto duomenų rėmelio pradžioje.

Python3


kiek metų yra Pitui Deividsonui



# Sorting by column 'Population'> # by putting missing values first> df.sort_values(by>=>[>'Population'>], na_position>=>'first'>)>

>

>

Išvestis:

c programos eilučių masyvas
Rūšiuoti Pandas DataFrame

Rūšiuoti Pandas DataFrame

Duomenų rėmelių rūšiavimas pagal kelis stulpelius

Šiame pavyzdyje mes rūšiuojame DataFrame (df>) pirmiausia pagal stulpelį „Šalis“ didėjimo tvarka ir kiekvienoje šalių grupėje – pagal stulpelį „Žemynas“. Gautas duomenų rėmelis surūšiuojamas pagal nurodytą stulpelių tvarką, sukuriant surūšiuotą duomenų rinkinį.

Python3




# Sorting by columns 'Country' and then 'Continent'> df.sort_values(by>=>[>'Country'>,>'Continent'>])>

>

>

Išvestis:

Rūšiuoti Pandas DataFrame

Rūšiuoti Pandas DataFrame

Duomenų rėmelių rūšiavimas pagal stulpelius, bet skirtinga tvarka

Šiame pavyzdyje mes rūšiuojame DataFrame (df>) pirmiausia stulpelyje „Šalis“ mažėjančia tvarka, o kiekvienoje šalių grupėje – stulpeliu „Žemynas“ didėjimo tvarka. Gautas DataFrame yra sutvarkytas pagal nurodytus stulpelių rūšiavimo kriterijus.

Python3




# Sorting by columns 'Country' in descending> # order and then 'Continent' in ascending order> df.sort_values(by>=>[>'Country'>,>'Continent'>],> >ascending>=>[>False>,>True>])>

>

>

Išvestis:

Rūšiuoti Pandas DataFrame

Rūšiuoti Pandas DataFrame