logo

Differenza tra loc() e iloc() in Pandas DataFrame

La libreria Pandas di Python è molto utile per la manipolazione di dati matematici ed è ampiamente utilizzata nel campo dell'apprendimento automatico. Comprende molti metodi per il suo corretto funzionamento. posto() E iloc() sono uno di quei metodi. Questi vengono utilizzati per suddividere i dati dal file Panda DataFrame . Aiutano nella comoda selezione dei dati dal DataFrame in Pitone . Vengono utilizzati per filtrare i dati in base ad alcune condizioni.

Differenza tra loc() e iloc() in Pandas DataFrame

Qui vedremo la differenza tra la funzione loc() e iloc() in Pandas DataFrame. Per vedere e confrontare la differenza tra questi due, creeremo un Dataframe di esempio che utilizzeremo in tutto il paragrafo. Il funzionamento di entrambi questi metodi è spiegato nel set di dati campione delle automobili.



python3




10 ml è quanto





# importing the module> import> pandas as pd> > # creating a sample dataframe> data>=> pd.DataFrame({>'Brand'>: [>'Maruti'>,>'Hyundai'>,>'Tata'>,> >'Mahindra'>,>'Maruti'>,>'Hyundai'>,> >'Renault'>,>'Tata'>,>'Maruti'>],> >'Year'>: [>2012>,>2014>,>2011>,>2015>,>2012>,> >2016>,>2014>,>2018>,>2019>],> >'Kms Driven'>: [>50000>,>30000>,>60000>,> >25000>,>10000>,>46000>,> >31000>,>15000>,>12000>],> >'City'>: [>'Gurgaon'>,>'Delhi'>,>'Mumbai'>,> >'Delhi'>,>'Mumbai'>,>'Delhi'>,> >'Mumbai'>,>'Chennai'>,>'Ghaziabad'>],> >'Mileage'>: [>28>,>27>,>25>,>26>,>28>,> >29>,>24>,>21>,>24>]})> > # displaying the DataFrame> display(data)>

>

>

Produzione

 Brand Year Kms Driven City Mileage 0 Maruti 2012 50000 Gurgaon 28 1 Hyundai 2014 30000 Delhi 27 2 Tata 2011 60000 Mumbai 25 3 Mahindra 2015 25000 Delhi 26 4 Maruti 2012 10000 Mumbai 28 5 Hyundai 2016 46000 Delhi 29 6 Renault 2014 31000 Mumbai 24 7 Tata 2018 15000 Chennai 21 8 Maruti 2019 12000 Ghaziabad 24>

Funzione loc() di Python

IL funzione loc() è un metodo di selezione dei dati basato su etichette, il che significa che dobbiamo passare il nome della riga o della colonna che vogliamo selezionare. Questo metodo include l'ultimo elemento dell'intervallo passato, a differenza di iloc(). loc() può accettare i dati booleani a differenza di iloc(). Molte operazioni possono essere eseguite utilizzando il metodo loc() come

Esempio 1: Selezione dei dati in base ad alcune condizioni

In questo esempio, il codice utilizza il fileloc>funzione per selezionare e visualizzare righe dal DataFrame in cui il marchio è 'Maruti' e il chilometraggio è maggiore di 25, mostrando informazioni rilevanti sulle auto Maruti con chilometraggio elevato.

python3

cos'è un'interfaccia




# selecting cars with brand 'Maruti' and Mileage>25> display(data.loc[(data.Brand>=>=> 'Maruti'>) & (data.Mileage>>25>)])>

>

>

Produzione

 Brand Year Kms Driven City Mileage 0 Maruti 2012 50000 Gurgaon 28 4 Maruti 2012 10000 Mumbai 28>

Esempio 2: Selezione di un intervallo di righe dal DataFrame

In questo esempio, il codice utilizza il fileloc>funzione per estrarre e visualizzare righe con indici compresi tra 2 e 5 (inclusi) dal DataFrame, fornendo informazioni su una gamma specifica di auto nel set di dati.

python3




# selecting range of rows from 2 to 5> display(data.loc[>2>:>5>])>

>

>

Produzione

 Brand Year Kms Driven City Mileage 2 Tata 2011 60000 Mumbai 25 3 Mahindra 2015 25000 Delhi 26 4 Maruti 2012 10000 Mumbai 28 5 Hyundai 2016 46000 Delhi 29>

Esempio 3: Aggiornamento del valore di qualsiasi colonna

In questo esempio, il codice utilizza il fileloc>funzione per aggiornare i valori 'Chilometraggio' a 22 per le auto nel DataFrame in cui l'anno di produzione è precedente al 2015. Viene quindi visualizzato il DataFrame modificato, riflettendo le modifiche apportate alla colonna Chilometraggio.

python3




converti str in intero

# updating values of Mileage if Year <2015> data.loc[(data.Year <>2015>), [>'Mileage'>]]>=> 22> display(data)>

>

>

Produzione

 Brand Year Kms Driven City Mileage 0 Maruti 2012 50000 Gurgaon 22 1 Hyundai 2014 30000 Delhi 22 2 Tata 2011 60000 Mumbai 22 3 Mahindra 2015 25000 Delhi 26 4 Maruti 2012 10000 Mumbai 22 5 Hyundai 2016 46000 Delhi 29 6 Renault 2014 31000 Mumbai 22 7 Tata 2018 15000 Chennai 21 8 Maruti 2019 12000 Ghaziabad 24>

Funzione iloc() di Python

IL funzione iloc() è un metodo di selezione basato su indici, il che significa che dobbiamo passare un indice intero nel metodo per selezionare una riga/colonna specifica. Questo metodo non include l'ultimo elemento dell'intervallo passato a differenza di loc(). iloc() non accetta i dati booleani a differenza di loc(). Le operazioni eseguite utilizzando iloc() sono:

errore: impossibile trovare o caricare la classe principale

Esempio 1: Selezione di righe utilizzando indici interi

In questo esempio, il codice utilizza il fileiloc>funzione per estrarre e visualizzare righe specifiche con indici 0, 2, 4 e 7 dal DataFrame, mostrando informazioni sulle auto selezionate nel set di dati.

python3




# selecting 0th, 2nd, 4th, and 7th index rows> display(data.iloc[[>0>,>2>,>4>,>7>]])>

>

>

Produzione

 Brand Year Kms Driven City Mileage 0 Maruti 2012 50000 Gurgaon 28 2 Tata 2011 60000 Mumbai 25 4 Maruti 2012 10000 Mumbai 28 7 Tata 2018 15000 Chennai 21>

Esempio 2: Selezione di un intervallo di colonne e righe contemporaneamente

In questo esempio, il codice utilizza il fileiloc>funzione per estrarre e visualizzare un sottoinsieme del DataFrame, comprese le righe da 1 a 4 e le colonne da 2 a 4. Ciò fornisce informazioni su una gamma specifica di auto e i loro attributi rilevanti nel set di dati.

python3

array di byte in stringa




# selecting rows from 1 to 4 and columns from 2 to 4> display(data.iloc[>1>:>5>,>2>:>5>])>

>

>

Produzione

 Kms Driven City Mileage 1 30000 Delhi 27 2 60000 Mumbai 25 3 25000 Delhi 26 4 10000 Mumbai 28>