„Pandas DataFrame“ yra dvimatė keičiamo dydžio, potencialiai nevienalytė lentelių duomenų struktūra su pažymėtomis ašimis (eilelėmis ir stulpeliais). Aritmetinės operacijos sulygiuojamos tiek eilučių, tiek stulpelių etiketėse. Jį galima įsivaizduoti kaip į diktą panašią talpyklą serijiniams objektams. Tai yra pirminė duomenų struktūra Pandos .
Pandas DataFrame loc[] Sintaksė
Pandos DataFrame.loc atributas pasiekia eilučių ir stulpelių grupę pagal etiketę (-es) arba loginį masyvą duotoje vietoje Pandas DataFrame .
Sintaksė: DataFrame.loc
Parametras : Nė vienas
Grąžinimai: Skaliarinis, serijos, duomenų rėmelis
Pandas DataFrame loc ypatybė
Toliau pateikiami keli pavyzdžiai, pagal kuriuos galime naudoti Pandas DataFrame loc[]:
1 pavyzdys: Pasirinkite vieną eilutę ir stulpelį pagal etiketę naudodami loc[]
Naudokite DataFrame.loc atributą, kad pasiektumėte tam tikrą langelį duotoje vietoje Pandos duomenų rėmelis naudojant rodyklės ir stulpelių etiketes. Tada mes pasirenkame vieną eilutę ir stulpelį pagal etiketę naudodami loc[].
Python3
# importing pandas as pd> import> pandas as pd> # Creating the DataFrame> df>=> pd.DataFrame({>'Weight'>: [>45>,>88>,>56>,>15>,>71>],> >'Name'>: [>'Sam'>,>'Andrea'>,>'Alex'>,>'Robin'>,>'Kia'>],> >'Age'>: [>14>,>25>,>55>,>8>,>21>]})> # Create the index> index_>=> [>'Row_1'>,>'Row_2'>,>'Row_3'>,>'Row_4'>,>'Row_5'>]> # Set the index> df.index>=> index_> # Print the DataFrame> print>(>'Original DataFrame:'>)> print>(df)> # Corrected selection using loc for a specific cell> result>=> df.loc[>'Row_2'>,>'Name'>]> # Print the result> print>(>'
Selected Value at Row_2, Column 'Name':'>)> print>(result)> |
>
>
sulaužyti java
Išvestis
Original DataFrame: Weight Name Age Row_1 45 Sam 14 Row_2 88 Andrea 25 Row_3 56 Alex 55 Row_4 15 Robin 8 Row_5 71 Kia 21 Selected Value at Row_2, Column 'Name': Andrea>
2 pavyzdys: Pasirinkite kelias eilutes ir stulpelius
Naudokite atributą DataFrame.loc, kad pateiktumėte du stulpelius duotame duomenų rėmelyje, tada pasirinkite kelias eilutes ir stulpelius, kaip tai daroma toliau pateiktame pavyzdyje.
Python3
# importing pandas as pd> import> pandas as pd> # Creating the DataFrame> df>=> pd.DataFrame({>'A'>:[>12>,>4>,>5>,>None>,>1>],> >'B'>:[>7>,>2>,>54>,>3>,>None>],> >'C'>:[>20>,>16>,>11>,>3>,>8>],> >'D'>:[>14>,>3>,>None>,>2>,>6>]})> # Create the index> index_>=> [>'Row_1'>,>'Row_2'>,>'Row_3'>,>'Row_4'>,>'Row_5'>]> # Set the index> df.index>=> index_> # Print the DataFrame> print>(>'Original DataFrame:'>)> print>(df)> # Corrected column names ('A' and 'D') in the result> result>=> df.loc[:, [>'A'>,>'D'>]]> # Print the result> print>(>'
Selected Columns 'A' and 'D':'>)> print>(result)> |
>
>
Išvestis
Original DataFrame: A B C D Row_1 12.0 7 20 14.0 Row_2 4.0 2 16 3.0 Row_3 5.0 54 11 NaN Row_4 NaN 3 3 2.0 Row_5 1.0 NaN 8 6.0 Selected Columns 'A' and 'D': A D Row_1 12.0 14.0 Row_2 4.0 3.0 Row_3 5.0 NaN Row_4 NaN 2.0 Row_5 1.0 6.0>
3 pavyzdys: pasirinkite tarp dviejų eilučių arba stulpelių
Šiame pavyzdyje sukuriame pandos duomenų rėmelį pavadinimu „df“, nustatome pasirinktinius eilučių indeksus ir tada naudojameloc>priedą, norėdami pasirinkti eilutes tarp „Eilutė_2“ ir „Eilutė_4“ imtinai ir stulpelius „B“ iki „D“. Pasirinktos eilutės ir stulpeliai spausdinami, parodantis, kaip naudojamas etiketėmis pagrįstas indeksavimasloc>.
Python3
# importing pandas as pd> import> pandas as pd> # Creating the DataFrame> df>=> pd.DataFrame({>'A'>: [>12>,>4>,>5>,>None>,>1>],> >'B'>: [>7>,>2>,>54>,>3>,>None>],> >'C'>: [>20>,>16>,>11>,>3>,>8>],> >'D'>: [>14>,>3>,>None>,>2>,>6>]})> # Create the index> index_>=> [>'Row_1'>,>'Row_2'>,>'Row_3'>,>'Row_4'>,>'Row_5'>]> # Set the index> df.index>=> index_> # Print the original DataFrame> print>(>'Original DataFrame:'>)> print>(df)> # Select Rows Between 'Row_2' and 'Row_4'> selected_rows>=> df.loc[>'Row_2'>:>'Row_4'>]> print>(>'
Selected Rows:'>)> print>(selected_rows)> # Select Columns 'B' through 'D'> selected_columns>=> df.loc[:,>'B'>:>'D'>]> print>(>'
Selected Columns:'>)> print>(selected_columns)> |
>
>
Išvestis
gauti ryšį
Original DataFrame: A B C D Row_1 12.0 7 20 14.0 Row_2 4.0 2 16 3.0 Row_3 5.0 54 11 NaN Row_4 NaN 3 3 2.0 Row_5 1.0 NaN 8 6.0 Selected Rows: A B C D Row_2 4 2 16 3.0 Row_3 5 54 11 NaN Row_4 NaN 3 3 2.0 Selected Columns: B C D Row_1 7 20 14.0 Row_2 2 16 3.0 Row_3 54 11 NaN Row_4 3 3 2.0 Row_5 NaN 8 6.0>
4 pavyzdys: pasirinkite alternatyvias eilutes arba stulpelius
Šiame pavyzdyje sukuriame pandos duomenų rėmelį pavadinimu „df“, nustatome pasirinktinius eilučių indeksus ir tada naudojameiloc>Prieigą, norėdami pasirinkti alternatyvias eilutes (kas antrą eilutę) ir alternatyvius stulpelius (kas antrą stulpelį). Gauti pasirinkimai atspausdinami, demonstruojant sveikųjų skaičių indeksavimo naudojimą suiloc>.
Python3
# importing pandas as pd> import> pandas as pd> # Creating the DataFrame> df>=> pd.DataFrame({>'A'>: [>12>,>4>,>5>,>None>,>1>],> >'B'>: [>7>,>2>,>54>,>3>,>None>],> >'C'>: [>20>,>16>,>11>,>3>,>8>],> >'D'>: [>14>,>3>,>None>,>2>,>6>]})> # Create the index> index_>=> [>'Row_1'>,>'Row_2'>,>'Row_3'>,>'Row_4'>,>'Row_5'>]> # Set the index> df.index>=> index_> # Print the original DataFrame> print>(>'Original DataFrame:'>)> print>(df)> # Select Alternate Rows> alternate_rows>=> df.iloc[::>2>]> print>(>'
Alternate Rows:'>)> print>(alternate_rows)> # Select Alternate Columns> alternate_columns>=> df.iloc[:, ::>2>]> print>(>'
Alternate Columns:'>)> print>(alternate_columns)> |
>
>
Išvestis
Original DataFrame: A B C D Row_1 12.0 7 20 14.0 Row_2 4.0 2 16 3.0 Row_3 5.0 54 11 NaN Row_4 NaN 3 3 2.0 Row_5 1.0 NaN 8 6.0 Alternate Rows: A B C D Row_1 12.0 7 20 14.0 Row_3 5.0 54 11 NaN Row_5 1.0 NaN 8 6.0 Alternate Columns: A C Row_1 12.0 20 Row_2 4.0 16 Row_3 5.0 11 Row_4 NaN 3 Row_5 1.0 8>
5 pavyzdys: Sąlygų naudojimas su Pandas loc
Šiame pavyzdyje kuriame pandos duomenų rėmelį pavadinimu „df“, nustatome pasirinktinius eilučių indeksus ir naudojameloc>priedą, kad pasirinktumėte eilutes pagal sąlygas. Tai parodo, kaip pasirinkti eilutes, kuriose stulpelio „A“ reikšmės yra didesnės nei 5, ir pasirinkti eilutes, kuriose „B“ stulpelis nėra nulis. Gauti pasirinkimai atspausdinami, demonstruojant sąlyginio filtravimo naudojimąloc>.
Python3
css centruoja vaizdą
# importing pandas as pd> import> pandas as pd> # Creating the DataFrame> df>=> pd.DataFrame({>'A'>: [>12>,>4>,>5>,>None>,>1>],> >'B'>: [>7>,>2>,>54>,>3>,>None>],> >'C'>: [>20>,>16>,>11>,>3>,>8>],> >'D'>: [>14>,>3>,>None>,>2>,>6>]})> # Create the index> index_>=> [>'Row_1'>,>'Row_2'>,>'Row_3'>,>'Row_4'>,>'Row_5'>]> # Set the index> df.index>=> index_> # Print the original DataFrame> print>(>'Original DataFrame:'>)> print>(df)> # Using Conditions with loc> # Example: Select rows where column 'A' is greater than 5> selected_rows>=> df.loc[df[>'A'>]>>> print>(>'
Rows where column 'A' is greater than 5:'>)> print>(selected_rows)> # Example: Select rows where column 'B' is not null> non_null_rows>=> df.loc[df[>'B'>].notnull()]> print>(>'
Rows where column 'B' is not null:'>)> print>(non_null_rows)> |
>
>
Išvestis
Original DataFrame: A B C D Row_1 12.0 7 20 14.0 Row_2 4.0 2 16 3.0 Row_3 5.0 54 11 NaN Row_4 NaN 3 3 2.0 Row_5 1.0 NaN 8 6.0 Rows where column 'A' is greater than 5: A B C D Row_1 12.0 7 20 14.0 Row_3 5.0 54 11 NaN Rows where column 'B' is not null: A B C D Row_1 12.0 7 20 14.0 Row_2 4.0 2 16 3.0 Row_3 5.0 54 11 NaN Row_4 NaN 3 3 2.0>