Unikali () funkcija pašalina visas pasikartojančias stulpelio vertes ir grąžina vieną reikšmę kelioms toms pačioms reikšmėms. Šiame straipsnyje aptarsime, kaip galime gauti unikalias vertes iš stulpelio Pandas DataFrame .
Pandos duomenų rėmelio su pasikartojančiais elementais kūrimas
Sukurkite Pandos duomenų rėmelio pavyzdį su sąrašų žodynu, tarkime, kad yra stulpelių pavadinimai A, B, C, D ir E su pasikartojančiais elementais.
Python3
# Import pandas package> import> pandas as pd> # create a dictionary with five fields each> data>=> {> >'A'>: [>'A1'>,>'A2'>,>'A3'>,>'A4'>,>'A5'>],> >'B'>: [>'B1'>,>'B2'>,>'B3'>,>'B4'>,>'B4'>],> >'C'>: [>'C1'>,>'C2'>,>'C3'>,>'C3'>,>'C3'>],> >'D'>: [>'D1'>,>'D2'>,>'D2'>,>'D2'>,>'D2'>],> >'E'>: [>'E1'>,>'E1'>,>'E1'>,>'E1'>,>'E1'>]}> # Convert the dictionary into DataFrame> df>=> pd.DataFrame(data)> |
>
>

Gaukite unikalias vertes iš Pandas DataFrame stulpelio
Toliau pateikiami keli pavyzdžiai, pagal kuriuos galime gauti unikalias stulpelio reikšmes šiame duomenų rėmelyje.
- Gaukite unikalias „B“ stulpelio reikšmes
- Gaukite unikalias „E“ stulpelio reikšmes
- Gaukite unikalių verčių skaičių stulpelyje
- Naudokite set(), kad pašalintumėte pasikartojančias reikšmes iš stulpelio
- Naudojant pandas.concat() ir Unique() metodus
- Naudojant Series.drop_duplicates()
Gaukite unikalias „B“ stulpelio reikšmes
Šiame pavyzdyje mes gauname ir spausdiname unikalias reikšmes iš stulpelio „B“, naudodami unique()> metodas. Gautos unikalios vertės yra['B1', 'B2', 'B3', 'B4']>.
Python3
# Import pandas package> import> pandas as pd> # Convert the dictionary into DataFrame> df>=> pd.DataFrame(data)> # Get the unique values of 'B' column> df.B.unique()> |
>
>
Išvestis
array(['B1', 'B2', 'B3', 'B4'], dtype=object)>
Gaukite unikalias pandų vertybes „E“ stulpelyje
Šiame pavyzdyje mes sukuriame pandos duomenų rėmelį iš žodyno ir tada nuskaitome unikalias reikšmes iš stulpelio „E“, naudodamiunique()>metodas. Gautos unikalios vertės yra['E1']>.
Python3
dfs vs bfs
# Import pandas package> import> pandas as pd> # Convert the dictionary into DataFrame> df>=> pd.DataFrame(data)> # Get the unique values of 'E' column> df.E.unique()> |
>
>
Išvestis
array(['E1'], dtype=object)>
Gaukite unikalių verčių skaičių stulpelyje
Šiame pavyzdyje mes sukuriame pandos duomenų rėmelį iš žodyno, tada apskaičiuojame ir atspausdiname unikalių reikšmių skaičių stulpelyje „C“, neįskaitant NaN reikšmių. Rezultatas yra 3, o tai reiškia, kad stulpelyje „C“ yra trys unikalios reikšmės.
Python3
latekso sąrašai
# Import pandas package> import> pandas as pd> # Convert the dictionary into DataFrame> df>=> pd.DataFrame(data)> # Get number of unique values in column 'C'> df.C.nunique(dropna>=>True>)> |
>
>
Išvestis
3>
Pašalinkite pasikartojančias reikšmes iš stulpelio naudodami set()
Šiame pavyzdyje mes sukuriame pandos DataFrame iš žodyno ir tada naudojame set()>funkcija išskirti unikalias reikšmes iš stulpelio „C“, pašalinant dublikatus. Gautas rinkinys,{'C1', 'C2', 'C3'}>, reiškia unikalias reikšmes stulpelyje „C“.
Python3
# Import pandas package> import> pandas as pd> # Convert the dictionary into DataFrame> df>=> pd.DataFrame(data)> # Use set() to eliminate duplicate values in column 'C'> unique_values_set>=> set>(df[>'C'>])> # Print the unique values> print>(unique_values_set)> |
>
>
Išvestis
{'C1', 'C2', 'C3'}> Naudojant pandas.concat() ir Unique() metodus
Šiame pavyzdyje mes sukuriame pandos duomenų rėmelį iš žodyno ir tada sujungiame unikalias reikšmes iš visų stulpelių naudodami pd.concat()> . Gautame NumPy masyve, atspausdintame, rodomos visos unikalios reikšmės nuo stulpelių „A“ iki „E“.
Python3
avl medis
# Import pandas package> import> pandas as pd> # Convert the dictionary into DataFrame> df>=> pd.DataFrame(data)> # Use pd.concat() to concatenate all columns and then apply unique()> unique_values_all_columns>=> pd.concat([df[col].unique()>for> col>in> df.columns])> # Print the unique values> print>(unique_values_all_columns)> |
>
>
Išvestis
['A1' 'A2' 'A3' 'A4' 'A5' 'B1' 'B2' 'B3' 'B4' 'C1' 'C2' 'C3' 'D1' 'D2' 'E1']>
Naudojant Series.drop_duplicates()
Šiame pavyzdyje mes sukuriame pandos duomenų rėmelį iš žodyno ir pašaliname dublikatus iš stulpelių „A“ ir „D“, naudodami drop_duplicates()>metodas . Gautas DataFrame atspausdintas stulpeliuose „A“ ir „D“ rodo unikalias vertes su NaN reikšmėmis, kai dublikatai buvo pašalinti iš „D“.
Python3
# Import pandas package> import> pandas as pd> # Convert the dictionary into DataFrame> df>=> pd.DataFrame(data)> # Use drop_duplicates() to remove duplicates from columns 'A' and 'D'> df[>'A'>]>=> df[>'A'>].drop_duplicates()> df[>'D'>]>=> df[>'D'>].drop_duplicates()> # Print the DataFrame after removing duplicates from columns 'A' and 'D'> print>(df)> |
>
>
Išvestis
A B C D E 0 A1 B1 C1 D1 E1 1 A2 B2 C2 D2 E1 2 A3 B3 C3 NaN E1 3 A4 B4 C3 NaN E1 4 A5 B4 C3 NaN E1>