logo

Pandas DataFrame.loc[] metodas

„Pandas DataFrame“ yra dvimatė keičiamo dydžio, potencialiai nevienalytė lentelių duomenų struktūra su pažymėtomis ašimis (eilelėmis ir stulpeliais). Aritmetinės operacijos sulygiuojamos tiek eilučių, tiek stulpelių etiketėse. Jį galima įsivaizduoti kaip į diktą panašią talpyklą serijiniams objektams. Tai yra pirminė duomenų struktūra Pandos .

Pandas DataFrame loc[] Sintaksė

Pandos DataFrame.loc atributas pasiekia eilučių ir stulpelių grupę pagal etiketę (-es) arba loginį masyvą duotoje vietoje Pandas DataFrame .



Sintaksė: DataFrame.loc

Parametras : Nė vienas

Grąžinimai: Skaliarinis, serijos, duomenų rėmelis



Pandas DataFrame loc ypatybė

Toliau pateikiami keli pavyzdžiai, pagal kuriuos galime naudoti Pandas DataFrame loc[]:

1 pavyzdys: Pasirinkite vieną eilutę ir stulpelį pagal etiketę naudodami loc[]

Naudokite DataFrame.loc atributą, kad pasiektumėte tam tikrą langelį duotoje vietoje Pandos duomenų rėmelis naudojant rodyklės ir stulpelių etiketes. Tada mes pasirenkame vieną eilutę ir stulpelį pagal etiketę naudodami loc[].

Python3






# importing pandas as pd> import> pandas as pd> # Creating the DataFrame> df>=> pd.DataFrame({>'Weight'>: [>45>,>88>,>56>,>15>,>71>],> >'Name'>: [>'Sam'>,>'Andrea'>,>'Alex'>,>'Robin'>,>'Kia'>],> >'Age'>: [>14>,>25>,>55>,>8>,>21>]})> # Create the index> index_>=> [>'Row_1'>,>'Row_2'>,>'Row_3'>,>'Row_4'>,>'Row_5'>]> # Set the index> df.index>=> index_> # Print the DataFrame> print>(>'Original DataFrame:'>)> print>(df)> # Corrected selection using loc for a specific cell> result>=> df.loc[>'Row_2'>,>'Name'>]> # Print the result> print>(>' Selected Value at Row_2, Column 'Name':'>)> print>(result)>

>

>

sulaužyti java

Išvestis

Original DataFrame:  Weight Name Age Row_1 45 Sam 14 Row_2 88 Andrea 25 Row_3 56 Alex 55 Row_4 15 Robin 8 Row_5 71 Kia 21 Selected Value at Row_2, Column 'Name': Andrea>

2 pavyzdys: Pasirinkite kelias eilutes ir stulpelius

Naudokite atributą DataFrame.loc, kad pateiktumėte du stulpelius duotame duomenų rėmelyje, tada pasirinkite kelias eilutes ir stulpelius, kaip tai daroma toliau pateiktame pavyzdyje.

Python3




# importing pandas as pd> import> pandas as pd> # Creating the DataFrame> df>=> pd.DataFrame({>'A'>:[>12>,>4>,>5>,>None>,>1>],> >'B'>:[>7>,>2>,>54>,>3>,>None>],> >'C'>:[>20>,>16>,>11>,>3>,>8>],> >'D'>:[>14>,>3>,>None>,>2>,>6>]})> # Create the index> index_>=> [>'Row_1'>,>'Row_2'>,>'Row_3'>,>'Row_4'>,>'Row_5'>]> # Set the index> df.index>=> index_> # Print the DataFrame> print>(>'Original DataFrame:'>)> print>(df)> # Corrected column names ('A' and 'D') in the result> result>=> df.loc[:, [>'A'>,>'D'>]]> # Print the result> print>(>' Selected Columns 'A' and 'D':'>)> print>(result)>

>

>

Išvestis

Original DataFrame:  A B C D Row_1 12.0 7 20 14.0 Row_2 4.0 2 16 3.0 Row_3 5.0 54 11 NaN Row_4 NaN 3 3 2.0 Row_5 1.0 NaN 8 6.0 Selected Columns 'A' and 'D':  A D Row_1 12.0 14.0 Row_2 4.0 3.0 Row_3 5.0 NaN Row_4 NaN 2.0 Row_5 1.0 6.0>

3 pavyzdys: pasirinkite tarp dviejų eilučių arba stulpelių

Šiame pavyzdyje sukuriame pandos duomenų rėmelį pavadinimu „df“, nustatome pasirinktinius eilučių indeksus ir tada naudojameloc>priedą, norėdami pasirinkti eilutes tarp „Eilutė_2“ ir „Eilutė_4“ imtinai ir stulpelius „B“ iki „D“. Pasirinktos eilutės ir stulpeliai spausdinami, parodantis, kaip naudojamas etiketėmis pagrįstas indeksavimasloc>.

Python3




# importing pandas as pd> import> pandas as pd> # Creating the DataFrame> df>=> pd.DataFrame({>'A'>: [>12>,>4>,>5>,>None>,>1>],> >'B'>: [>7>,>2>,>54>,>3>,>None>],> >'C'>: [>20>,>16>,>11>,>3>,>8>],> >'D'>: [>14>,>3>,>None>,>2>,>6>]})> # Create the index> index_>=> [>'Row_1'>,>'Row_2'>,>'Row_3'>,>'Row_4'>,>'Row_5'>]> # Set the index> df.index>=> index_> # Print the original DataFrame> print>(>'Original DataFrame:'>)> print>(df)> # Select Rows Between 'Row_2' and 'Row_4'> selected_rows>=> df.loc[>'Row_2'>:>'Row_4'>]> print>(>' Selected Rows:'>)> print>(selected_rows)> # Select Columns 'B' through 'D'> selected_columns>=> df.loc[:,>'B'>:>'D'>]> print>(>' Selected Columns:'>)> print>(selected_columns)>

>

>

Išvestis

gauti ryšį
Original DataFrame:  A B C D Row_1 12.0 7 20 14.0 Row_2 4.0 2 16 3.0 Row_3 5.0 54 11 NaN Row_4 NaN 3 3 2.0 Row_5 1.0 NaN 8 6.0 Selected Rows:  A B C D Row_2 4 2 16 3.0 Row_3 5 54 11 NaN Row_4 NaN 3 3 2.0 Selected Columns:  B C D Row_1 7 20 14.0 Row_2 2 16 3.0 Row_3 54 11 NaN Row_4 3 3 2.0 Row_5 NaN 8 6.0>

4 pavyzdys: pasirinkite alternatyvias eilutes arba stulpelius

Šiame pavyzdyje sukuriame pandos duomenų rėmelį pavadinimu „df“, nustatome pasirinktinius eilučių indeksus ir tada naudojameiloc>Prieigą, norėdami pasirinkti alternatyvias eilutes (kas antrą eilutę) ir alternatyvius stulpelius (kas antrą stulpelį). Gauti pasirinkimai atspausdinami, demonstruojant sveikųjų skaičių indeksavimo naudojimą suiloc>.

Python3




# importing pandas as pd> import> pandas as pd> # Creating the DataFrame> df>=> pd.DataFrame({>'A'>: [>12>,>4>,>5>,>None>,>1>],> >'B'>: [>7>,>2>,>54>,>3>,>None>],> >'C'>: [>20>,>16>,>11>,>3>,>8>],> >'D'>: [>14>,>3>,>None>,>2>,>6>]})> # Create the index> index_>=> [>'Row_1'>,>'Row_2'>,>'Row_3'>,>'Row_4'>,>'Row_5'>]> # Set the index> df.index>=> index_> # Print the original DataFrame> print>(>'Original DataFrame:'>)> print>(df)> # Select Alternate Rows> alternate_rows>=> df.iloc[::>2>]> print>(>' Alternate Rows:'>)> print>(alternate_rows)> # Select Alternate Columns> alternate_columns>=> df.iloc[:, ::>2>]> print>(>' Alternate Columns:'>)> print>(alternate_columns)>

>

>

Išvestis

Original DataFrame:  A B C D Row_1 12.0 7 20 14.0 Row_2 4.0 2 16 3.0 Row_3 5.0 54 11 NaN Row_4 NaN 3 3 2.0 Row_5 1.0 NaN 8 6.0 Alternate Rows:  A B C D Row_1 12.0 7 20 14.0 Row_3 5.0 54 11 NaN Row_5 1.0 NaN 8 6.0 Alternate Columns:  A C Row_1 12.0 20 Row_2 4.0 16 Row_3 5.0 11 Row_4 NaN 3 Row_5 1.0 8>

5 pavyzdys: Sąlygų naudojimas su Pandas loc

Šiame pavyzdyje kuriame pandos duomenų rėmelį pavadinimu „df“, nustatome pasirinktinius eilučių indeksus ir naudojameloc>priedą, kad pasirinktumėte eilutes pagal sąlygas. Tai parodo, kaip pasirinkti eilutes, kuriose stulpelio „A“ reikšmės yra didesnės nei 5, ir pasirinkti eilutes, kuriose „B“ stulpelis nėra nulis. Gauti pasirinkimai atspausdinami, demonstruojant sąlyginio filtravimo naudojimąloc>.

Python3


css centruoja vaizdą



# importing pandas as pd> import> pandas as pd> # Creating the DataFrame> df>=> pd.DataFrame({>'A'>: [>12>,>4>,>5>,>None>,>1>],> >'B'>: [>7>,>2>,>54>,>3>,>None>],> >'C'>: [>20>,>16>,>11>,>3>,>8>],> >'D'>: [>14>,>3>,>None>,>2>,>6>]})> # Create the index> index_>=> [>'Row_1'>,>'Row_2'>,>'Row_3'>,>'Row_4'>,>'Row_5'>]> # Set the index> df.index>=> index_> # Print the original DataFrame> print>(>'Original DataFrame:'>)> print>(df)> # Using Conditions with loc> # Example: Select rows where column 'A' is greater than 5> selected_rows>=> df.loc[df[>'A'>]>>>]> print>(>' Rows where column 'A' is greater than 5:'>)> print>(selected_rows)> # Example: Select rows where column 'B' is not null> non_null_rows>=> df.loc[df[>'B'>].notnull()]> print>(>' Rows where column 'B' is not null:'>)> print>(non_null_rows)>

>

>

Išvestis

Original DataFrame:  A B C D Row_1 12.0 7 20 14.0 Row_2 4.0 2 16 3.0 Row_3 5.0 54 11 NaN Row_4 NaN 3 3 2.0 Row_5 1.0 NaN 8 6.0 Rows where column 'A' is greater than 5:  A B C D Row_1 12.0 7 20 14.0 Row_3 5.0 54 11 NaN Rows where column 'B' is not null:  A B C D Row_1 12.0 7 20 14.0 Row_2 4.0 2 16 3.0 Row_3 5.0 54 11 NaN Row_4 NaN 3 3 2.0>