La libreria Pandas di Python è molto utile per la manipolazione di dati matematici ed è ampiamente utilizzata nel campo dell'apprendimento automatico. Comprende molti metodi per il suo corretto funzionamento. posto() E iloc() sono uno di quei metodi. Questi vengono utilizzati per suddividere i dati dal file Panda DataFrame . Aiutano nella comoda selezione dei dati dal DataFrame in Pitone . Vengono utilizzati per filtrare i dati in base ad alcune condizioni.
Differenza tra loc() e iloc() in Pandas DataFrame
Qui vedremo la differenza tra la funzione loc() e iloc() in Pandas DataFrame. Per vedere e confrontare la differenza tra questi due, creeremo un Dataframe di esempio che utilizzeremo in tutto il paragrafo. Il funzionamento di entrambi questi metodi è spiegato nel set di dati campione delle automobili.
python3
10 ml è quanto
# importing the module> import> pandas as pd> > # creating a sample dataframe> data>=> pd.DataFrame({>'Brand'>: [>'Maruti'>,>'Hyundai'>,>'Tata'>,> >'Mahindra'>,>'Maruti'>,>'Hyundai'>,> >'Renault'>,>'Tata'>,>'Maruti'>],> >'Year'>: [>2012>,>2014>,>2011>,>2015>,>2012>,> >2016>,>2014>,>2018>,>2019>],> >'Kms Driven'>: [>50000>,>30000>,>60000>,> >25000>,>10000>,>46000>,> >31000>,>15000>,>12000>],> >'City'>: [>'Gurgaon'>,>'Delhi'>,>'Mumbai'>,> >'Delhi'>,>'Mumbai'>,>'Delhi'>,> >'Mumbai'>,>'Chennai'>,>'Ghaziabad'>],> >'Mileage'>: [>28>,>27>,>25>,>26>,>28>,> >29>,>24>,>21>,>24>]})> > # displaying the DataFrame> display(data)> |
>
>
Produzione
Brand Year Kms Driven City Mileage 0 Maruti 2012 50000 Gurgaon 28 1 Hyundai 2014 30000 Delhi 27 2 Tata 2011 60000 Mumbai 25 3 Mahindra 2015 25000 Delhi 26 4 Maruti 2012 10000 Mumbai 28 5 Hyundai 2016 46000 Delhi 29 6 Renault 2014 31000 Mumbai 24 7 Tata 2018 15000 Chennai 21 8 Maruti 2019 12000 Ghaziabad 24>
Funzione loc() di Python
IL funzione loc() è un metodo di selezione dei dati basato su etichette, il che significa che dobbiamo passare il nome della riga o della colonna che vogliamo selezionare. Questo metodo include l'ultimo elemento dell'intervallo passato, a differenza di iloc(). loc() può accettare i dati booleani a differenza di iloc(). Molte operazioni possono essere eseguite utilizzando il metodo loc() come
Esempio 1: Selezione dei dati in base ad alcune condizioni
In questo esempio, il codice utilizza il fileloc>funzione per selezionare e visualizzare righe dal DataFrame in cui il marchio è 'Maruti' e il chilometraggio è maggiore di 25, mostrando informazioni rilevanti sulle auto Maruti con chilometraggio elevato.
python3
cos'è un'interfaccia
# selecting cars with brand 'Maruti' and Mileage>25> display(data.loc[(data.Brand>=>=> 'Maruti'>) & (data.Mileage>>25>)])> |
>
>
Produzione
Brand Year Kms Driven City Mileage 0 Maruti 2012 50000 Gurgaon 28 4 Maruti 2012 10000 Mumbai 28>
Esempio 2: Selezione di un intervallo di righe dal DataFrame
In questo esempio, il codice utilizza il fileloc>funzione per estrarre e visualizzare righe con indici compresi tra 2 e 5 (inclusi) dal DataFrame, fornendo informazioni su una gamma specifica di auto nel set di dati.
python3
# selecting range of rows from 2 to 5> display(data.loc[>2>:>5>])> |
>
>
Produzione
Brand Year Kms Driven City Mileage 2 Tata 2011 60000 Mumbai 25 3 Mahindra 2015 25000 Delhi 26 4 Maruti 2012 10000 Mumbai 28 5 Hyundai 2016 46000 Delhi 29>
Esempio 3: Aggiornamento del valore di qualsiasi colonna
In questo esempio, il codice utilizza il fileloc>funzione per aggiornare i valori 'Chilometraggio' a 22 per le auto nel DataFrame in cui l'anno di produzione è precedente al 2015. Viene quindi visualizzato il DataFrame modificato, riflettendo le modifiche apportate alla colonna Chilometraggio.
python3
converti str in intero
# updating values of Mileage if Year <2015> data.loc[(data.Year <>2015>), [>'Mileage'>]]>=> 22> display(data)> |
>
>
Produzione
Brand Year Kms Driven City Mileage 0 Maruti 2012 50000 Gurgaon 22 1 Hyundai 2014 30000 Delhi 22 2 Tata 2011 60000 Mumbai 22 3 Mahindra 2015 25000 Delhi 26 4 Maruti 2012 10000 Mumbai 22 5 Hyundai 2016 46000 Delhi 29 6 Renault 2014 31000 Mumbai 22 7 Tata 2018 15000 Chennai 21 8 Maruti 2019 12000 Ghaziabad 24>
Funzione iloc() di Python
IL funzione iloc() è un metodo di selezione basato su indici, il che significa che dobbiamo passare un indice intero nel metodo per selezionare una riga/colonna specifica. Questo metodo non include l'ultimo elemento dell'intervallo passato a differenza di loc(). iloc() non accetta i dati booleani a differenza di loc(). Le operazioni eseguite utilizzando iloc() sono:
errore: impossibile trovare o caricare la classe principale
Esempio 1: Selezione di righe utilizzando indici interi
In questo esempio, il codice utilizza il fileiloc>funzione per estrarre e visualizzare righe specifiche con indici 0, 2, 4 e 7 dal DataFrame, mostrando informazioni sulle auto selezionate nel set di dati.
python3
# selecting 0th, 2nd, 4th, and 7th index rows> display(data.iloc[[>0>,>2>,>4>,>7>]])> |
>
>
Produzione
Brand Year Kms Driven City Mileage 0 Maruti 2012 50000 Gurgaon 28 2 Tata 2011 60000 Mumbai 25 4 Maruti 2012 10000 Mumbai 28 7 Tata 2018 15000 Chennai 21>
Esempio 2: Selezione di un intervallo di colonne e righe contemporaneamente
In questo esempio, il codice utilizza il fileiloc>funzione per estrarre e visualizzare un sottoinsieme del DataFrame, comprese le righe da 1 a 4 e le colonne da 2 a 4. Ciò fornisce informazioni su una gamma specifica di auto e i loro attributi rilevanti nel set di dati.
python3
array di byte in stringa
# selecting rows from 1 to 4 and columns from 2 to 4> display(data.iloc[>1>:>5>,>2>:>5>])> |
>
>
Produzione
Kms Driven City Mileage 1 30000 Delhi 27 2 60000 Mumbai 25 3 25000 Delhi 26 4 10000 Mumbai 28>