Šiame straipsnyje aptarsime Pandas DataFrame.set_index() Python. Python išsiskiria kaip puiki duomenų analizės kalba, daugiausia dėl savo išskirtinės į duomenis orientuotų paketų ekosistemos. Tarp šių paketų Pandos vaidina svarbų vaidmenį supaprastinant duomenų importavimą ir analizę.
Pandas DataFrame.set_index() Sintaksė
Sintaksė: DataFrame.set_index(keys, drop = True, append = False, inplace = False, verify_integrity = False)
Parametrai:
- raktai: Stulpelio pavadinimas arba stulpelių pavadinimų sąrašas.
- lašas: Būlio reikšmė, kuri, jei „True“, atmeta indeksui naudojamą stulpelį.
- pridėti: Jei True, nurodytą stulpelį prideda prie esamo indekso stulpelio.
- vietoje: Jei True, pakeitimai atliekami pačiame DataFrame.
- verify_integrity: Jei tiesa, patikrinama, ar naujame indekso stulpelyje nėra dublikatų.
Kas yra Pandas DataFrame.set_index()?
Pandos duomenų rėmelis. set_index() metodas naudojamas sąrašui, serijai ar kitam duomenų rėmui priskirti kaip tam tikro duomenų rėmelio indeksą. Tai ypač naudinga derinant kelis duomenų kadrus, nes galima lengvai keisti indeksą. Nors indekso stulpelį galima nurodyti kuriant duomenų rėmelį, set_index() suteikia lankstų būdą vėliau pakeisti indeksą. Iš esmės tai leidžia nustatyti sąrašo, serijos arba duomenų rėmelį kaip duomenų rėmelio rodyklę. Tačiau kartais duomenų rėmelis sudaromas iš dviejų ar daugiau duomenų rėmelių, todėl vėliau indeksą galima pakeisti naudojant šį metodą.
Norėdami atsisiųsti naudotą CSV failą, spustelėkite Čia.
Pandas DataFrame.set_index() Pavyzdžiai
Žemiau pateikiamos tinkamos Pandas DataFrame.set_index() pavyzdžių iliustracijos.
- Pandos Nustatyti indeksą į stulpelį
- Kelių indeksų stulpelis
- Singlo nustatymas Plūdės kolona kaip indeksas
- Nustatymas trys stulpeliai kaip MultiIndex
- Pandos Nustatyti konkretaus stulpelio indeksą
Pandos Nustatyti indeksą į stulpelį
Šiame pavyzdyje mes keičiame indekso stulpelį, stulpelis Vardas tapo duomenų rėmelio rodyklės stulpeliu.
Python3
# importing pandas package> import> pandas as pd> # making data frame from csv file> data>=> pd.read_csv(>'employees.csv'>)> # setting first name as index column> data.set_index(>'First Name'>, inplace>=> True>)> # display> data.head()> |
>
>
Išvestis : Prieš operaciją –

Po operacijos -

Kaip parodyta išvesties paveikslėliuose, anksčiau rodyklės stulpelis buvo skaičių serija, bet vėliau jis buvo pakeistas vardu Vardas.
Pandos Nustatyti indeksą į kelių indeksų stulpelį
Šiame pavyzdyje du stulpeliai bus sukurti kaip indekso stulpelis. Parametras Drop naudojamas stulpeliui išmesti, o pridėti parametras naudojamas perduotiems stulpeliams pridėti prie jau esamo indekso stulpelio.
Python3
# importing pandas package> import> pandas as pd> # making data frame from csv file> data>=> pd.read_csv(>'employees.csv'>)> # setting first name as index column> data.set_index([>'First Name'>,>'Gender'>], inplace>=> True>,> >append>=> True>, drop>=> False>)> # display> data.head()> |
>
>
Išvestis:

Kaip parodyta išvesties paveikslėlyje, duomenys turi 3 indekso stulpelius.
eilutę palyginkite c#
Pandas Dataframe Index Vieno nustatymas Plūdės kolona kaip indeksas
Šiame pavyzdyje toliau pateiktas kodo fragmentas naudoja Pandas biblioteką, kad sukurtų duomenų rėmelį pavadinimu „df“ iš įdėto mokinio duomenų sąrašo. Jis nustato stulpelį „Agg_Marks“ kaip indeksą ir rodo gautą duomenų rėmelį su stulpeliais „Vardas“, „Amžius“, „Miestas“ ir „Šalis“.
Python3
# importing pandas library> import> pandas as pd> # creating and initializing a nested list> students>=> [[>'jack'>,>34>,>'Sydeny'>,>'Australia'>,>85.96>],> >[>'Riti'>,>30>,>'Delhi'>,>'India'>,>95.20>],> >[>'Vansh'>,>31>,>'Delhi'>,>'India'>,>85.25>],> >[>'Nanyu'>,>32>,>'Tokyo'>,>'Japan'>,>74.21>],> >[>'Maychan'>,>16>,>'New York'>,>'US'>,>99.63>],> >[>'Mike'>,>17>,>'las vegas'>,>'US'>,>47.28>]]> # Create a DataFrame object> df>=> pd.DataFrame(students,> >columns>=>[>'Name'>,>'Age'>,>'City'>,>'Country'>,>'Agg_Marks'>],> >index>=>[>'a'>,>'b'>,>'c'>,>'d'>,>'e'>,>'f'>])> # here we set Float column 'Agg_Marks' as index of data frame> # using dataframe.set_index() function> df>=> df.set_index(>'Agg_Marks'>)> # Displaying the Data frame> df> |
>
>
Išvestis:
Name Age City Country Agg_Marks 85.96 jack 34 Sydeny Australia 95.20 Riti 30 Delhi India 85.25 Vansh 31 Delhi India 74.21 Nanyu 32 Tokyo Japan 99.63 Maychan 16 New York US 47.28 Mike 17 las vegas US>
Aukščiau pateiktame pavyzdyje nustatome stulpelį „ Agg_Marks “ kaip duomenų rėmelio indeksą.
Pandas Dataframe indekso nustatymas trys stulpeliai kaip MultiIndex
Šiame pavyzdyje toliau pateiktame kode naudojama „Panda“, kad iš mokinio duomenų sukurtų duomenų rėmelį „df“ su stulpeliais „Vardas“, „Amžius“, „Miestas“, „Šalis“, „Agg_Marks“ ir „ID“. Jame naudojama funkcija „set_index()“, kad būtų sukurtas kelių lygių indeksas naudojant „Vardas“, „Miestas“ ir „ID“, o tada rodomas gautas duomenų rėmelis.
Python3
# importing pandas library> import> pandas as pd> # creating and initializing a nested list> students>=> [[>'jack'>,>34>,>'Sydeny'>,>'Australia'>,>85.96>,>400>],> >[>'Riti'>,>30>,>'Delhi'>,>'India'>,>95.20>,>750>],> >[>'Vansh'>,>31>,>'Delhi'>,>'India'>,>85.25>,>101>],> >[>'Nanyu'>,>32>,>'Tokyo'>,>'Japan'>,>74.21>,>900>],> >[>'Maychan'>,>16>,>'New York'>,>'US'>,>99.63>,>420>],> >[>'Mike'>,>17>,>'las vegas'>,>'US'>,>47.28>,>555>]]> # Create a DataFrame object> df>=> pd.DataFrame(students,> >columns>=>[>'Name'>,>'Age'>,>'City'>,>'Country'>,>'Agg_Marks'>,>'ID'>],> >index>=>[>'a'>,>'b'>,>'c'>,>'d'>,>'e'>,>'f'>])> # Here we pass list of 3 columns i.e 'Name', 'City' and 'ID'> # to dataframe.set_index() function> # to set them as multiIndex of dataframe> df>=> df.set_index([>'Name'>,>'City'>,>'ID'>])> # Displaying the Data frame> df> |
>
>
Išvestis:
Age Country Agg_Marks Name City ID jack Sydeny 400 34 Australia 85.96 Riti Delhi 750 30 India 95.20 Vansh Delhi 101 31 India 85.25 Nanyu Tokyo 900 32 Japan 74.21 Maychan New York 420 16 US 99.63 Mike las vegas 555 17 US 47.28>
Aukščiau pateiktame pavyzdyje mes nustatome stulpelius ' vardas ',' Miestas “, ir „ ID “ kaip duomenų rėmelio daugiaindeksas.
Pandos Nustatyti konkretaus stulpelio indeksą
Šiame pavyzdyje toliau pateiktas kodas parodo, kaip naudoti Pandas kuriant duomenų rėmelį, nustatykite konkretų stulpelį (šiuo atveju „pavadinimas“) kaip rodyklę, naudodamiset_index()>metodą, tada rodomi ir originalūs, ir modifikuoti duomenų rėmeliai. Theinplace=True>parametras užtikrina, kad pakeitimai būtų pritaikyti tiesiogiai „DataFrame“ ir nereikia jų priskirti iš naujo.
Python3
import> pandas as pd> # Creating a sample DataFrame> data>=> {>'Name'>: [>'Geek1'>,>'Geek2'>,>'Geek3'>],> >'Age'>: [>25>,>30>,>35>],> >'City'>: [>'New York'>,>'San Francisco'>,>'Los Angeles'>]}> df>=> pd.DataFrame(data)> # Displaying the original DataFrame> print>(>'Original DataFrame:'>)> print>(df)> # Using set_index() to set 'Name' column as the index> df.set_index(>'Name'>, inplace>=>True>)> # Displaying the DataFrame after setting the index> print>(>'
DataFrame after set_index:'>)> print>(df)> |
>
>
Išvestis:
Original DataFrame: Name Age City 0 Geek1 25 New York 1 Geek2 30 San Francisco 2 Geek3 35 Los Angeles DataFrame after set_index: Age City Name Geek1 25 New York Geek2 30 San Francisco Geek3 35 Los Angeles>