logo

Pitone | Panda DataFrame.set_index()

In questo articolo discuteremo di Panda DataFrame.set_index() in Python. Pitone si distingue come un linguaggio eccellente per l'analisi dei dati, in gran parte grazie al suo eccezionale ecosistema di pacchetti incentrati sui dati. Tra questi pacchetti, Panda svolge un ruolo significativo nel semplificare l'importazione e l'analisi dei dati.

Sintassi di Panda DataFrame.set_index()

Sintassi: DataFrame.set_index(chiavi, drop=True, append=False, inplace=False, verify_integrity=False)



parametri:

  • chiavi: Nome della colonna o un elenco di nomi di colonne.
  • gocciolare: Un valore booleano che, se True, elimina la colonna utilizzata per l'indice.
  • aggiungere: Se True, aggiunge la colonna specificata alla colonna dell'indice esistente.
  • a posto: Se True, le modifiche vengono apportate nel DataFrame stesso.
  • verifica_integrità: Se Vero, controlla la presenza di duplicati nella nuova colonna dell'indice.

Cos'è Pandas DataFrame.set_index()?

Il Dataframe dei Panda. set_indice() Il metodo viene utilizzato per assegnare un elenco, una serie o un altro frame di dati come indice di un determinato frame di dati. È particolarmente utile quando si combinano più frame di dati, consentendo una facile modifica dell'indice. Mentre è possibile specificare una colonna dell'indice durante la creazione del frame di dati, set_index() fornisce un modo flessibile per modificare l'indice in un secondo momento. In sostanza, ti consente di impostare un frame List, Series o Data come indice di un Data Frame. Ma a volte un frame di dati è composto da due o più frame di dati e quindi l'indice successivo può essere modificato utilizzando questo metodo.

Per scaricare il file CSV utilizzato, fare clic su Qui.



Esempi di Panda DataFrame.set_index()

Di seguito sono riportate le illustrazioni corrette degli esempi per Pandas DataFrame.set_index().

  • I panda impostano l'indice sulla colonna
  • Colonna con indici multipli
  • Impostazione di un singolo Colonna galleggiante come Indice
  • Collocamento tre colonne COME Multiindice
  • I panda impostano l'indice della colonna specifica

I panda impostano l'indice sulla colonna

In questo esempio, stiamo modificando la colonna Indice, la colonna Nome è stata resa la colonna indice di Data Frame.

Python3






# importing pandas package> import> pandas as pd> # making data frame from csv file> data>=> pd.read_csv(>'employees.csv'>)> # setting first name as index column> data.set_index(>'First Name'>, inplace>=> True>)> # display> data.head()>

scarica video da youtube vlc

>

>

Produzione : Prima dell'operazione –

Dopo l'operazione –

Come mostrato nelle immagini di output, in precedenza la colonna dell'indice era una serie di numeri, ma in seguito è stata sostituita con il nome.

I panda impostano l'indice su più colonne di indici

In questo esempio, due colonne verranno create come colonna indice. Il parametro Drop viene utilizzato per eliminare la colonna e il parametro append viene utilizzato per aggiungere le colonne passate alla colonna dell'indice già esistente.

Python3




# importing pandas package> import> pandas as pd> # making data frame from csv file> data>=> pd.read_csv(>'employees.csv'>)> # setting first name as index column> data.set_index([>'First Name'>,>'Gender'>], inplace>=> True>,> >append>=> True>, drop>=> False>)> # display> data.head()>

>

>

Produzione:

Come mostrato nell'immagine di output, i dati hanno 3 colonne di indice.

Indice Pandas Dataframe Impostazione di un singolo Colonna galleggiante come Indice

In questo esempio il frammento di codice seguente utilizza la libreria Pandas per creare un DataFrame denominato 'df' da un elenco nidificato di dati degli studenti. Imposta la colonna 'Agg_Marks' come indice e visualizza il DataFrame risultante con le colonne 'Nome', 'Età', 'Città' e 'Paese'.

Python3




# importing pandas library> import> pandas as pd> # creating and initializing a nested list> students>=> [[>'jack'>,>34>,>'Sydeny'>,>'Australia'>,>85.96>],> >[>'Riti'>,>30>,>'Delhi'>,>'India'>,>95.20>],> >[>'Vansh'>,>31>,>'Delhi'>,>'India'>,>85.25>],> >[>'Nanyu'>,>32>,>'Tokyo'>,>'Japan'>,>74.21>],> >[>'Maychan'>,>16>,>'New York'>,>'US'>,>99.63>],> >[>'Mike'>,>17>,>'las vegas'>,>'US'>,>47.28>]]> # Create a DataFrame object> df>=> pd.DataFrame(students,> >columns>=>[>'Name'>,>'Age'>,>'City'>,>'Country'>,>'Agg_Marks'>],> >index>=>[>'a'>,>'b'>,>'c'>,>'d'>,>'e'>,>'f'>])> # here we set Float column 'Agg_Marks' as index of data frame> # using dataframe.set_index() function> df>=> df.set_index(>'Agg_Marks'>)> # Displaying the Data frame> df>

>

>

Produzione :

 Name Age City Country Agg_Marks 85.96 jack 34 Sydeny Australia 95.20 Riti 30 Delhi India 85.25 Vansh 31 Delhi India 74.21 Nanyu 32 Tokyo Japan 99.63 Maychan 16 New York US 47.28 Mike 17 las vegas US>

Nell'esempio sopra, impostiamo la colonna ' Agg_Marks ‘ come indice del frame di dati.

Impostazione dell'indice Dataframe Pandas tre colonne COME Multiindice

In questo esempio il codice seguente utilizza Pandas per creare un DataFrame 'df' dai dati degli studenti, con le colonne 'Nome', 'Età', 'Città', 'Paese', 'Agg_Marks' e 'ID'. Utilizza la funzione 'set_index()' per stabilire un indice multilivello utilizzando 'Nome', 'Città' e 'ID', quindi visualizza il DataFrame risultante.

Python3




# importing pandas library> import> pandas as pd> # creating and initializing a nested list> students>=> [[>'jack'>,>34>,>'Sydeny'>,>'Australia'>,>85.96>,>400>],> >[>'Riti'>,>30>,>'Delhi'>,>'India'>,>95.20>,>750>],> >[>'Vansh'>,>31>,>'Delhi'>,>'India'>,>85.25>,>101>],> >[>'Nanyu'>,>32>,>'Tokyo'>,>'Japan'>,>74.21>,>900>],> >[>'Maychan'>,>16>,>'New York'>,>'US'>,>99.63>,>420>],> >[>'Mike'>,>17>,>'las vegas'>,>'US'>,>47.28>,>555>]]> # Create a DataFrame object> df>=> pd.DataFrame(students,> >columns>=>[>'Name'>,>'Age'>,>'City'>,>'Country'>,>'Agg_Marks'>,>'ID'>],> >index>=>[>'a'>,>'b'>,>'c'>,>'d'>,>'e'>,>'f'>])> # Here we pass list of 3 columns i.e 'Name', 'City' and 'ID'> # to dataframe.set_index() function> # to set them as multiIndex of dataframe> df>=> df.set_index([>'Name'>,>'City'>,>'ID'>])> # Displaying the Data frame> df>

>

>

Produzione :

 Age Country Agg_Marks Name City ID jack Sydeny 400 34 Australia 85.96 Riti Delhi 750 30 India 95.20 Vansh Delhi 101 31 India 85.25 Nanyu Tokyo 900 32 Japan 74.21 Maychan New York 420 16 US 99.63 Mike las vegas 555 17 US 47.28>

Nell'esempio sopra, impostiamo le colonne ' Nome ', ' Città ', E ' ID ‘ come multiIndice del frame di dati.

I panda impostano l'indice della colonna specifica

In questo esempio il codice seguente mostra come utilizzare Pandas per creare un DataFrame, impostare una colonna specifica ('Nome' in questo caso) come indice utilizzando il comandoset_index()>metodo e quindi visualizza sia il DataFrames originale che quello modificato. ILinplace=True>Il parametro garantisce che le modifiche vengano applicate direttamente al DataFrame senza la necessità di riassegnazione.

Python3




albero binario in Java

import> pandas as pd> # Creating a sample DataFrame> data>=> {>'Name'>: [>'Geek1'>,>'Geek2'>,>'Geek3'>],> >'Age'>: [>25>,>30>,>35>],> >'City'>: [>'New York'>,>'San Francisco'>,>'Los Angeles'>]}> df>=> pd.DataFrame(data)> # Displaying the original DataFrame> print>(>'Original DataFrame:'>)> print>(df)> # Using set_index() to set 'Name' column as the index> df.set_index(>'Name'>, inplace>=>True>)> # Displaying the DataFrame after setting the index> print>(>' DataFrame after set_index:'>)> print>(df)>

>

>

Produzione :

Original DataFrame: Name Age City 0 Geek1 25 New York 1 Geek2 30 San Francisco 2 Geek3 35 Los Angeles DataFrame after set_index: Age City Name Geek1 25 New York Geek2 30 San Francisco Geek3 35 Los Angeles>