Panda DataFrame è una struttura dati etichettata bidimensionale come una tabella con righe e colonne. Le dimensioni e i valori di DataFrame sono mutabili, ovvero possono essere modificati.
DataFrame viene utilizzato principalmente nell'analisi e nella manipolazione dei dati. Ti consente di archiviare i dati in formato tabellare come database SQL, MS Excel o Fogli Google, semplificando l'esecuzione di operazioni aritmetiche sui dati.
È l'oggetto Panda più comunemente usato. IL Funzione DataFrame() viene utilizzato per creare un DataFrame in Pandas. Puoi anche creare Pandas DataFrame in diversi modi.
Sintassi di Panda Dataframe()
pandas.DataFrame(dati, indice, colonne)
come trasformare la stringa in int
parametri:
- dati : È un set di dati da cui deve essere creato un DataFrame. Può essere un elenco, un dizionario, un valore scalare, una serie e un array, ecc.
- indice : È facoltativo, per impostazione predefinita l'indice del DataFrame inizia da 0 e termina con l'ultimo valore dei dati (n-1). Definisce esplicitamente l'etichetta della riga.
- colonne : questo parametro viene utilizzato per fornire i nomi delle colonne nel DataFrame. Se il nome della colonna non è definito per impostazione predefinita, assumerà un valore compreso tra 0 e n-1.
Ritorna:
- Oggetto DataFrame
Ora che abbiamo discusso della funzione DataFrame(), diamo un'occhiata ai diversi modi per creare un DataFrame:
Diversi modi per creare Dataframe in Python
Esistono diversi modi per creare un file Panda Dataframe In Pitone . È possibile creare un DataFrame con i seguenti metodi:
- Crea Pandas DataFrame utilizzando la funzione DataFrame()
- Crea Pandas DataFrame dall'elenco degli elenchi
- Crea Pandas DataFrame dal dizionario di ndarray/list
- Crea Pandas DataFrame dall'elenco dei dizionari
- Crea Pandas DataFrame da un dizionario di serie
- Creazione di DataFrame utilizzando la funzione zip()
- Creazione di un DataFrame dimostrando esplicitamente l'etichetta dell'indice
Crea un DataFrame vuoto utilizzando il metodo DataFrame()
DataFrame in Python può essere creato dalla funzione DataFrame() di Biblioteca dei panda . Basta chiamare la funzione con il costruttore DataFrame per creare un DataFrame.
Esempio : Creazione di un DataFrame vuoto utilizzando la funzione DataFrame() in Python
Python3
# Importing Pandas to create DataFrame> import> pandas as pd> # Creating Empty DataFrame and Storing it in variable df> df> => pd.DataFrame()> # Printing Empty DataFrame> print> (df)> |
>
>
Produzione:
Empty DataFrame Columns: [] Index: []>
Crea DataFrame da elenchi di elenchi
Per creare un Pandas DataFrame da a elenco di elenchi, è possibile utilizzare la funzione pd.DataFrame(). Questa funzione accetta un elenco di elenchi come input e crea un DataFrame con lo stesso numero di righe e colonne dell'elenco di input.
Esempio : Creazione di DataFrame da elenchi di elenchi utilizzando il metodo DataFrame()
Python3
# Import pandas library> import> pandas as pd> # initialize list of lists> data> => [[> 'tom'> ,> 10> ], [> 'nick'> ,> 15> ], [> 'juli'> ,> 14> ]]> # Create the pandas DataFrame> df> => pd.DataFrame(data, columns> => [> 'Name'> ,> 'Age'> ])> # print dataframe.> print> (df)> |
>
>
Produzione:
Name Age 0 tom 10 1 nick 15 2 juli 14>
Crea DataFrame dal dizionario di ndArray/Lists
Per creare DataFrame da a dizionario Di ndarrays /lists, tutti gli array devono avere la stessa lunghezza. Se viene passato un indice, l'indice di lunghezza dovrebbe essere uguale alla lunghezza degli array.
Se non viene passato alcun indice, per impostazione predefinita l'indice sarà range(n) dove n è la lunghezza dell'array.
Esempio : Creazione di DataFrame da un dizionario di ndarray/liste
Python3
# Python code demonstrate creating> # DataFrame from dict narray / lists> # By default addresses.> import> pandas as pd> # initialize data of lists.> data> => {> 'Name'> : [> 'Tom'> ,> 'nick'> ,> 'krish'> ,> 'jack'> ],> > 'Age'> : [> 20> ,> 21> ,> 19> ,> 18> ]}> # Create DataFrame> df> => pd.DataFrame(data)> # Print the output.> print> (df)> |
tavolo in lattice
>
>
Produzione:
Name Age 0 Tom 20 1 nick 21 2 krish 19 3 jack 18>
Nota: Durante la creazione di DataFrame utilizzando un dizionario, le chiavi del dizionario saranno nomi di colonna per impostazione predefinita. Possiamo anche fornire nomi di colonna esplicitamente utilizzando il parametro colonna.
Crea DataFrame dall'elenco dei dizionari
Pandas DataFrame può essere creato passando elenchi di dizionari come dati di input. Per impostazione predefinita, le chiavi del dizionario verranno considerate come colonne.
Python3
# Python code demonstrate how to create> # Pandas DataFrame by lists of dicts.> import> pandas as pd> # Initialize data to lists.> data> => [{> 'a'> :> 1> ,> 'b'> :> 2> ,> 'c'> :> 3> },> > {> 'a'> :> 10> ,> 'b'> :> 20> ,> 'c'> :> 30> }]> # Creates DataFrame.> df> => pd.DataFrame(data)> # Print the data> print> (df)> |
ordina l'elenco degli array java
>
>
Produzione:
a b c 0 1 2 3 1 10 20 30>
Un altro esempio è creare un DataFrame Pandas passando elenchi di dizionari e indici di riga .
Python3
# Python code demonstrate to create> # Pandas DataFrame by passing lists of> # Dictionaries and row indices.> import> pandas as pd> # Initialize data of lists> data> => [{> 'b'> :> 2> ,> 'c'> :> 3> }, {> 'a'> :> 10> ,> 'b'> :> 20> ,> 'c'> :> 30> }]> # Creates pandas DataFrame by passing> # Lists of dictionaries and row index.> df> => pd.DataFrame(data, index> => [> 'first'> ,> 'second'> ])> # Print the data> print> (df)> |
>
>
Produzione:
b c a first 2 3 NaN second 20 30 10.0>
Crea DataFrame da un dizionario di serie
Per creare un DataFrame da un dizionario di serie , è possibile passare un dizionario per formare un DataFrame. L'indice risultante è l'unione di tutte le serie di indicizzati passati.
Esempio: Creazione di un DataFrame da un dizionario di serie.
Python3
differenza tra azienda e azienda
# Python code demonstrate creating> # Pandas Dataframe from Dicts of series.> import> pandas as pd> # Initialize data to Dicts of series.> d> => {> 'one'> : pd.Series([> 10> ,> 20> ,> 30> ,> 40> ],> > index> => [> 'a'> ,> 'b'> ,> 'c'> ,> 'd'> ]),> > 'two'> : pd.Series([> 10> ,> 20> ,> 30> ,> 40> ],> > index> => [> 'a'> ,> 'b'> ,> 'c'> ,> 'd'> ])}> # creates Dataframe.> df> => pd.DataFrame(d)> # print the data.> print> (df)> |
>
>
Produzione:
one two a 10 10 b 20 20 c 30 30 d 40 40>
Crea DataFrame utilizzando la funzione zip()
Due elenchi possono essere uniti utilizzando il comando funzione zip() . Ora crea Pandas DataFrame chiamando la funzione pd.DataFrame().
Esempio: Creazione di DataFrame utilizzando la funzione zip().
Python3
convertire l'oggetto Java in JSON
# Python program to demonstrate creating> # pandas Dataframe from lists using zip.> import> pandas as pd> # List1> Name> => [> 'tom'> ,> 'krish'> ,> 'nick'> ,> 'juli'> ]> # List2> Age> => [> 25> ,> 30> ,> 26> ,> 22> ]> # get the list of tuples from two lists.> # and merge them by using zip().> list_of_tuples> => list> (> zip> (Name, Age))> # Assign data to tuples.> list_of_tuples> # Converting lists of tuples into> # pandas Dataframe.> df> => pd.DataFrame(list_of_tuples,> > columns> => [> 'Name'> ,> 'Age'> ])> # Print data.> print> (df)> |
>
>
Produzione:
Name Age 0 tom 25 1 krish 30 2 nick 26 3 juli 22>
Crea un DataFrame dimostrando esplicitamente l'etichetta dell'indice
Per creare un DataFrame fornendo esplicitamente l'etichetta dell'indice, è possibile utilizzare il parametro indice del costruttore pd.DataFrame(). Il parametro indice accetta un elenco di etichette di indice come input e DataFrame utilizzerà queste etichette per le righe di DataFrame.
Esempio: Creazione di un DataFrame dimostrando esplicitamente l'etichetta dell'indice
Python3
# Python code demonstrate creating> # pandas DataFrame with indexed by> # DataFrame using arrays.> import> pandas as pd> # initialize data of lists.> data> => {> 'Name'> : [> 'Tom'> ,> 'Jack'> ,> 'nick'> ,> 'juli'> ],> > 'marks'> : [> 99> ,> 98> ,> 95> ,> 90> ]}> # Creates pandas DataFrame.> df> => pd.DataFrame(data, index> => [> 'rank1'> ,> > 'rank2'> ,> > 'rank3'> ,> > 'rank4'> ])> # print the data> print> (df)> |
>
>
Produzione:
Name marks rank1 Tom 99 rank2 Jack 98 rank3 nick 95 rank4 juli 90>
Conclusione
Python Pandas DataFrame è simile a una tabella con righe e colonne. È una struttura dati bidimensionale ed è molto utile per l'analisi e la manipolazione dei dati.
In questo tutorial, abbiamo discusso diversi modi per creare un Pandas DataFrame. Con questo tutorial sarai in grado di gestire qualsiasi requisito complesso relativo alla creazione di DataFrame.