logo

Pandas DataFrame filtravimo pagal stulpelių reikšmes būdai

„Pandas DataFrame“ filtravimas pagal stulpelių reikšmes yra įprastas veiksmas naudojant „Python“ informaciją. Norėdami tai padaryti, galite naudoti įvairius metodus ir metodus. Čia yra daug būdų, kaip filtruoti Pandas DataFrame per stulpelių reikšmes.

Šiame įraše pamatysime skirtingus būdus, kaip filtruoti Pandas Dataframe pagal stulpelių reikšmes. Pirmiausia sukurkime duomenų rėmelį:



Python3








# importing pandas> import> pandas as pd> > # declare a dictionary> record>=> {> >'Name'> : [>'Ankit'>,>'Swapnil'>,>'Aishwarya'>,> >'Priyanka'>,>'Shivangi'>,>'Shaurya'> ],> > >'Age'> : [>22>,>20>,>21>,>19>,>18>,>22>],> > >'Stream'> : [>'Math'>,>'Commerce'>,>'Science'>,> >'Math'>,>'Math'>,>'Science'>],> > >'Percentage'> : [>90>,>90>,>96>,>75>,>70>,>80>] }> > # create a dataframe> dataframe>=> pd.DataFrame(record,> >columns>=> [>'Name'>,>'Age'>,> >'Stream'>,>'Percentage'>])> # show the Dataframe> print>(>'Given Dataframe : '>, dataframe)>

>

>

Išvestis:

Duomenų rėmelis

Pandas Dataframe eilučių pasirinkimas pagal konkrečią stulpelio reikšmę naudojant „>“, „=“, „=“, „<=“, „!=“ operatorių.

1 pavyzdys: Pasirinkus visas eilutes iš pateikto duomenų rėmelio, kuriame „procentas“ yra didesnis nei 75 [ ] .

Python3




# selecting rows based on condition> rslt_df>=> dataframe[dataframe[>'Percentage'>]>>>]> > print>(>' Result dataframe : '>, rslt_df)>

>

>

Išvestis:

išvesties duomenų rėmelis

2 pavyzdys: Pasirinkus visas eilutes iš pateikto duomenų rėmelio, kuriame „procentas“ yra didesnis nei 70 vieta [ ] .

Python3




# selecting rows based on condition> rslt_df>=> dataframe.loc[dataframe[>'Percentage'>]>>>]> > print>(>' Result dataframe : '>,> >rslt_df)>

>

>

Išvestis:

išvesties duomenų rėmelis-1

Pasirinkus tas Pandas Dataframe eilutes, kurių stulpelio reikšmė yra sąraše naudojant tu() duomenų rėmelio metodas.

1 pavyzdys: Naudodami parinkčių sąraše pasirinkite visas eilutes iš pateikto duomenų rėmelio, kuriame yra „Srautas“. [ ] .

Python3




options>=> [>'Science'>,>'Commerce'>]> > # selecting rows based on condition> rslt_df>=> dataframe[dataframe[>'Stream'>].isin(options)]> > print>(>' Result dataframe : '>,> >rslt_df)>

>

>

Išvestis:

išvesties duomenų rėmelis-2

2 pavyzdys: Naudodami parinkčių sąraše pasirinkite visas eilutes iš pateikto duomenų rėmelio, kuriame yra „Srautas“. vieta [ ] .

Python




options>=> [>'Science'>,>'Commerce'>]> > # selecting rows based on condition> rslt_df>=> dataframe.loc[dataframe[>'Stream'>].isin(options)]> > print>(>' Result dataframe : '>,> >rslt_df)>

>

>

Išvestis:

išvesties duomenų rėmelis-3

Pandas Dataframe eilučių pasirinkimas pagal kelių stulpelių sąlygas naudojant „&“ operatorių.

1 pavyzdys: Pasirinkus visas eilutes iš pateikto duomenų rėmelio, kuriame „Age“ yra lygus 22, o „Stream“ yra parinkčių sąraše, naudojant [ ] .

Python3




options>=> [>'Commerce'> ,>'Science'>]> > # selecting rows based on condition> rslt_df>=> dataframe[(dataframe[>'Age'>]>=>=> 22>) &> >dataframe[>'Stream'>].isin(options)]> > print>(>' Result dataframe : '>,> >rslt_df)>

>

>

Išvestis:

išvesties duomenų rėmelis-4

2 pavyzdys: Pasirinkus visas eilutes iš pateikto duomenų rėmelio, kuriame „Age“ yra lygus 22, o „Stream“ yra parinkčių sąraše, naudojant vieta [ ] .

Python3




windows komanda arp

options>=> [>'Commerce'>,>'Science'>]> > # selecting rows based on condition> rslt_df>=> dataframe.loc[(dataframe[>'Age'>]>=>=> 22>) &> >dataframe[>'Stream'>].isin(options)]> > print>(>' Result dataframe : '>,> >rslt_df)>

>

>

Išvestis:

išvesties duomenų rėmelis-5