Rūšiavimą galime atlikti Pandas Dataframe. Šiame straipsnyje bus aptarta, kaip rūšiuoti Pandas DataFrame naudojant įvairius metodus Python .
Duomenų rėmelių rūšiavimas programoje Pandas
Kuriant a Pandos duomenų rėmelis Demonstracijai Čia sukūrėme duomenų rėmelį, kuriame atliksime įvairias rūšiavimo funkcijas.
Python3
nfa pavyzdžiai
# importing pandas library> import> pandas as pd> # creating and initializing a nested list> age_list>=> [[>'Afghanistan'>,>1952>,>8425333>,>'Asia'>],> >[>'Australia'>,>1957>,>9712569>,>'Oceania'>],> >[>'Brazil'>,>1962>,>76039390>,>'Americas'>],> >[>'China'>,>1957>,>637408000>,>'Asia'>],> >[>'France'>,>1957>,>44310863>,>'Europe'>],> >[>'India'>,>1952>,>3.72e>+>08>,>'Asia'>],> >[>'United States'>,>1957>,>171984000>,>'Americas'>]]> # creating a pandas dataframe> df>=> pd.DataFrame(age_list, columns>=>[>'Country'>,>'Year'>,> >'Population'>,>'Continent'>])> df> |
>
>
Išvestis

Rūšiuoti Pandas DataFrame
Pandos duomenų rėmelio rūšiavimas
Norint surūšiuoti duomenų rėmelį pandose, funkcija Rūšiuoti_vertes() yra naudojamas. Pandos sort_values() gali rūšiuoti duomenų rėmelį didėjančia arba mažėjančia tvarka.
Pandas DataFrame Rūšiavimas didėjančia tvarka
Kodo fragmentas surūšiuoja DataFrame df didėjimo tvarka pagal stulpelį „Šalis“. Tačiau jis nesaugo ir nerodo surūšiuotų duomenų rėmelio.
Python3
# Sorting by column 'Country'> df.sort_values(by>=>[>'Country'>])> |
>
>
Išvestis:

Rūšiuoti Pandas DataFrame
Pandas DataFrame rūšiavimas mažėjimo tvarka
„DataFrame df“ bus rūšiuojama mažėjančia tvarka pagal stulpelį „Gyventojų skaičius“, o šalis, kurioje daugiausia gyventojų, bus rodoma „DataFrame“ viršuje.
Python3
# Sorting by column 'Population'> df.sort_values(by>=>[>'Population'>], ascending>=>False>)> |
>
>
Išvestis:

Rūšiuoti Pandas DataFrame
Rūšiuoti Pandas DataFrame pagal atranką
Čia mes rūšiuojame DataFrame (df>), remiantis stulpeliu „Gyventojai“, sutvarkydami eilutes su trūkstamomis reikšmėmis „Gyventojų skaičius“, kad jos būtų rodomos pirmiausia. Thesort_values()>metodas suna_position='first'>argumentu tai pasiekiama, pirmenybę teikiant eilutėms su trūkstamomis reikšmėmis surūšiuoto duomenų rėmelio pradžioje.
Python3
kiek metų yra Pitui Deividsonui
# Sorting by column 'Population'> # by putting missing values first> df.sort_values(by>=>[>'Population'>], na_position>=>'first'>)> |
>
>
Išvestis:
c programos eilučių masyvas

Rūšiuoti Pandas DataFrame
Duomenų rėmelių rūšiavimas pagal kelis stulpelius
Šiame pavyzdyje mes rūšiuojame DataFrame (df>) pirmiausia pagal stulpelį „Šalis“ didėjimo tvarka ir kiekvienoje šalių grupėje – pagal stulpelį „Žemynas“. Gautas duomenų rėmelis surūšiuojamas pagal nurodytą stulpelių tvarką, sukuriant surūšiuotą duomenų rinkinį.
Python3
# Sorting by columns 'Country' and then 'Continent'> df.sort_values(by>=>[>'Country'>,>'Continent'>])> |
>
>
Išvestis:

Rūšiuoti Pandas DataFrame
Duomenų rėmelių rūšiavimas pagal stulpelius, bet skirtinga tvarka
Šiame pavyzdyje mes rūšiuojame DataFrame (df>) pirmiausia stulpelyje „Šalis“ mažėjančia tvarka, o kiekvienoje šalių grupėje – stulpeliu „Žemynas“ didėjimo tvarka. Gautas DataFrame yra sutvarkytas pagal nurodytus stulpelių rūšiavimo kriterijus.
Python3
# Sorting by columns 'Country' in descending> # order and then 'Continent' in ascending order> df.sort_values(by>=>[>'Country'>,>'Continent'>],> >ascending>=>[>False>,>True>])> |
>
>
Išvestis:

Rūšiuoti Pandas DataFrame