logo

Gaukite unikalias vertes iš Pandas DataFrame stulpelio

Unikali () funkcija pašalina visas pasikartojančias stulpelio vertes ir grąžina vieną reikšmę kelioms toms pačioms reikšmėms. Šiame straipsnyje aptarsime, kaip galime gauti unikalias vertes iš stulpelio Pandas DataFrame .

Pandos duomenų rėmelio su pasikartojančiais elementais kūrimas

Sukurkite Pandos duomenų rėmelio pavyzdį su sąrašų žodynu, tarkime, kad yra stulpelių pavadinimai A, B, C, D ir E su pasikartojančiais elementais.



Python3








# Import pandas package> import> pandas as pd> # create a dictionary with five fields each> data>=> {> >'A'>: [>'A1'>,>'A2'>,>'A3'>,>'A4'>,>'A5'>],> >'B'>: [>'B1'>,>'B2'>,>'B3'>,>'B4'>,>'B4'>],> >'C'>: [>'C1'>,>'C2'>,>'C3'>,>'C3'>,>'C3'>],> >'D'>: [>'D1'>,>'D2'>,>'D2'>,>'D2'>,>'D2'>],> >'E'>: [>'E1'>,>'E1'>,>'E1'>,>'E1'>,>'E1'>]}> # Convert the dictionary into DataFrame> df>=> pd.DataFrame(data)>

>

>

Gaukite unikalias vertes iš Pandas DataFrame stulpelio

Toliau pateikiami keli pavyzdžiai, pagal kuriuos galime gauti unikalias stulpelio reikšmes šiame duomenų rėmelyje.

  • Gaukite unikalias „B“ stulpelio reikšmes
  • Gaukite unikalias „E“ stulpelio reikšmes
  • Gaukite unikalių verčių skaičių stulpelyje
  • Naudokite set(), kad pašalintumėte pasikartojančias reikšmes iš stulpelio
  • Naudojant pandas.concat() ir Unique() metodus
  • Naudojant Series.drop_duplicates()

Gaukite unikalias „B“ stulpelio reikšmes

Šiame pavyzdyje mes gauname ir spausdiname unikalias reikšmes iš stulpelio „B“, naudodami unique()> metodas. Gautos unikalios vertės yra['B1', 'B2', 'B3', 'B4']>.

Python3




# Import pandas package> import> pandas as pd> # Convert the dictionary into DataFrame> df>=> pd.DataFrame(data)> # Get the unique values of 'B' column> df.B.unique()>

>

>

Išvestis

array(['B1', 'B2', 'B3', 'B4'], dtype=object)>

Gaukite unikalias pandų vertybes „E“ stulpelyje

Šiame pavyzdyje mes sukuriame pandos duomenų rėmelį iš žodyno ir tada nuskaitome unikalias reikšmes iš stulpelio „E“, naudodamiunique()>metodas. Gautos unikalios vertės yra['E1']>.

Python3

dfs vs bfs




# Import pandas package> import> pandas as pd> # Convert the dictionary into DataFrame> df>=> pd.DataFrame(data)> # Get the unique values of 'E' column> df.E.unique()>

>

>

Išvestis

array(['E1'], dtype=object)>

Gaukite unikalių verčių skaičių stulpelyje

Šiame pavyzdyje mes sukuriame pandos duomenų rėmelį iš žodyno, tada apskaičiuojame ir atspausdiname unikalių reikšmių skaičių stulpelyje „C“, neįskaitant NaN reikšmių. Rezultatas yra 3, o tai reiškia, kad stulpelyje „C“ yra trys unikalios reikšmės.

Python3

latekso sąrašai




# Import pandas package> import> pandas as pd> # Convert the dictionary into DataFrame> df>=> pd.DataFrame(data)> # Get number of unique values in column 'C'> df.C.nunique(dropna>=>True>)>

>

>

Išvestis

3>

Pašalinkite pasikartojančias reikšmes iš stulpelio naudodami set()

Šiame pavyzdyje mes sukuriame pandos DataFrame iš žodyno ir tada naudojame set()>funkcija išskirti unikalias reikšmes iš stulpelio „C“, pašalinant dublikatus. Gautas rinkinys,{'C1', 'C2', 'C3'}>, reiškia unikalias reikšmes stulpelyje „C“.

Python3




# Import pandas package> import> pandas as pd> # Convert the dictionary into DataFrame> df>=> pd.DataFrame(data)> # Use set() to eliminate duplicate values in column 'C'> unique_values_set>=> set>(df[>'C'>])> # Print the unique values> print>(unique_values_set)>

>

>

Išvestis

{'C1', 'C2', 'C3'}>

Naudojant pandas.concat() ir Unique() metodus

Šiame pavyzdyje mes sukuriame pandos duomenų rėmelį iš žodyno ir tada sujungiame unikalias reikšmes iš visų stulpelių naudodami pd.concat()> . Gautame NumPy masyve, atspausdintame, rodomos visos unikalios reikšmės nuo stulpelių „A“ iki „E“.

Python3


avl medis



# Import pandas package> import> pandas as pd> # Convert the dictionary into DataFrame> df>=> pd.DataFrame(data)> # Use pd.concat() to concatenate all columns and then apply unique()> unique_values_all_columns>=> pd.concat([df[col].unique()>for> col>in> df.columns])> # Print the unique values> print>(unique_values_all_columns)>

>

>

Išvestis

['A1' 'A2' 'A3' 'A4' 'A5' 'B1' 'B2' 'B3' 'B4' 'C1' 'C2' 'C3' 'D1' 'D2' 'E1']>

Naudojant Series.drop_duplicates()

Šiame pavyzdyje mes sukuriame pandos duomenų rėmelį iš žodyno ir pašaliname dublikatus iš stulpelių „A“ ir „D“, naudodami drop_duplicates()>metodas . Gautas DataFrame atspausdintas stulpeliuose „A“ ir „D“ rodo unikalias vertes su NaN reikšmėmis, kai dublikatai buvo pašalinti iš „D“.

Python3




# Import pandas package> import> pandas as pd> # Convert the dictionary into DataFrame> df>=> pd.DataFrame(data)> # Use drop_duplicates() to remove duplicates from columns 'A' and 'D'> df[>'A'>]>=> df[>'A'>].drop_duplicates()> df[>'D'>]>=> df[>'D'>].drop_duplicates()> # Print the DataFrame after removing duplicates from columns 'A' and 'D'> print>(df)>

>

>

Išvestis

   A B C D E   0 A1 B1 C1 D1 E1 1 A2 B2 C2 D2 E1 2 A3 B3 C3 NaN E1 3 A4 B4 C3 NaN E1 4 A5 B4 C3 NaN E1>