logo

Serie Panda Python

La serie Pandas può essere definita come un array unidimensionale in grado di memorizzare vari tipi di dati. Possiamo convertire facilmente la lista, la tupla e il dizionario in serie usando ' serie ' metodo. Le etichette delle righe delle serie sono chiamate indice. Una serie non può contenere più colonne. Ha il seguente parametro:

    dati:Può essere qualsiasi elenco, dizionario o valore scalare.indice:Il valore dell'indice deve essere univoco e hashable. Deve avere la stessa lunghezza dei dati. Se non passiamo alcun indice, default np.arrangia(n) sarà usato.dtipo:Si riferisce al tipo di dati della serie.copia:Viene utilizzato per copiare i dati.

Creazione di una serie:

Possiamo creare una Serie in due modi:

  1. Crea una serie vuota
  2. Crea una serie utilizzando gli input.

Crea una serie vuota:

Possiamo facilmente creare una serie vuota in Pandas, il che significa che non avrà alcun valore.

La sintassi utilizzata per creare una serie vuota:

 = pandas.Series() 

L'esempio seguente crea un oggetto di tipo Serie vuota che non ha valori e ha un tipo di dati predefinito, ovvero float64 .

Esempio

 import pandas as pd x = pd.Series() print (x) 

Produzione

 Series([], dtype: float64) 

Creazione di una serie utilizzando gli input:

Possiamo creare serie utilizzando vari input:

  • Vettore
  • Dict
  • Valore scalare

Creazione di serie da array:

Prima di creare una serie, dobbiamo innanzitutto importare il file insensato module e quindi utilizzare la funzione array() nel programma. Se i dati sono ndarray, l'indice passato deve avere la stessa lunghezza.

Se non passiamo un indice, per impostazione predefinita indice di intervallo(n) viene passato dove n definisce la lunghezza di un array, ovvero [0,1,2,.... intervallo(len(array))-1 ].

Esempio

 import pandas as pd import numpy as np info = np.array(['P','a','n','d','a','s']) a = pd.Series(info) print(a) 

Produzione

 0 P 1 a 2 n 3 d 4 a 5 s dtype: object 

Crea una serie da dict

Possiamo anche creare una serie da dict. Se l'oggetto dizionario viene passato come input e l'indice non è specificato, le chiavi del dizionario vengono prese in ordine per costruire l'indice .

Se viene passato l'indice, i valori corrispondenti a una particolare etichetta nell'indice verranno estratti dal file dizionario .

elenco degli stati
 #import the pandas library import pandas as pd import numpy as np info = {'x' : 0., 'y' : 1., 'z' : 2.} a = pd.Series(info) print (a) 

Produzione

 x 0.0 y 1.0 z 2.0 dtype: float64 

Crea una serie utilizzando Scalare:

Se prendiamo i valori scalari, è necessario fornire l'indice. Il valore scalare verrà ripetuto per far corrispondere la lunghezza dell'indice.

 #import pandas library import pandas as pd import numpy as np x = pd.Series(4, index=[0, 1, 2, 3]) print (x) 

Produzione

 0 4 1 4 2 4 3 4 dtype: int64 

Accesso ai dati dalle serie con Posizione:

Una volta creato l'oggetto di tipo Serie, puoi accedere ai suoi indici, ai dati e persino ai singoli elementi.

È possibile accedere ai dati nelle serie in modo simile a quello in ndarray.

 import pandas as pd x = pd.Series([1,2,3],index = ['a','b','c']) #retrieve the first element print (x[0]) 

Produzione

 1 

Attributi degli oggetti della serie

L'attributo Serie è definito come qualsiasi informazione relativa all'oggetto Serie come dimensione, tipo di dati. ecc. Di seguito sono riportati alcuni degli attributi che è possibile utilizzare per ottenere informazioni sull'oggetto Serie:

Attributi Descrizione
Indice.serie Definisce l'indice della serie.
Forma.della.serie Restituisce una tupla di forma dei dati.
Serie.dtipo Restituisce il tipo di dati dei dati.
Serie.dimensione Restituisce la dimensione dei dati.
Serie.vuoto Restituisce True se l'oggetto Series è vuoto, altrimenti restituisce false.
Serie.hasnans Restituisce True se sono presenti valori NaN, altrimenti restituisce false.
Serie.nbytes Restituisce il numero di byte nei dati.
Serie Restituisce il numero di dimensioni nei dati.
Serie.dimensionearticolo Restituisce la dimensione del tipo di dati dell'elemento.

Recupero dell'array di indici e dell'array di dati di un oggetto serie

Possiamo recuperare l'array di indici e l'array di dati di un oggetto Series esistente utilizzando l'indice e i valori degli attributi.

 import numpy as np import pandas as pd x=pd.Series(data=[2,4,6,8]) y=pd.Series(data=[11.2,18.6,22.5], index=['a','b','c']) print(x.index) print(x.values) print(y.index) print(y.values) 

Produzione

 RangeIndex(start=0, stop=4, step=1) [2 4 6 8] Index(['a', 'b', 'c'], dtype='object') [11.2 18.6 22.5] 

Recupero di tipi (dtype) e dimensioni del tipo (itemsize)

Puoi utilizzare l'attributo dtype con l'oggetto Series come dtype per recuperare il tipo di dati di un singolo elemento di un oggetto serie, puoi utilizzare l'attributo dimensione dell'articolo attributo per mostrare il numero di byte allocati a ciascun elemento di dati.

 import numpy as np import pandas as pd a=pd.Series(data=[1,2,3,4]) b=pd.Series(data=[4.9,8.2,5.6], index=['x','y','z']) print(a.dtype) print(a.itemsize) print(b.dtype) print(b.itemsize) 

Produzione

 int64 8 float64 8 

Recupero della forma

La forma dell'oggetto Serie definisce il numero totale di elementi inclusi i valori mancanti o vuoti (NaN).

 import numpy as np import pandas as pd a=pd.Series(data=[1,2,3,4]) b=pd.Series(data=[4.9,8.2,5.6],index=['x','y','z']) print(a.shape) print(b.shape) 

Produzione

 (4,) (3,) 

Recupero di dimensione, dimensione e numero di byte:

 import numpy as np import pandas as pd a=pd.Series(data=[1,2,3,4]) b=pd.Series(data=[4.9,8.2,5.6], index=['x','y','z']) print(a.ndim, b.ndim) print(a.size, b.size) print(a.nbytes, b.nbytes) 

Produzione

 1 1 4 3 32 24 

Controllo del vuoto e della presenza di NaN

Per verificare che l'oggetto Series sia vuoto, puoi utilizzare il file attributo vuoto . Allo stesso modo, per verificare se un oggetto serie contiene o meno alcuni valori NaN, è possibile utilizzare il file Hassan attributo.

Esempio

cos'è svn checkout
 import numpy as np import pandas as pd a=pd.Series(data=[1,2,3,np.NaN]) b=pd.Series(data=[4.9,8.2,5.6],index=['x','y','z']) c=pd.Series() print(a.empty,b.empty,c.empty) print(a.hasnans,b.hasnans,c.hasnans) print(len(a),len(b)) print(a.count( ),b.count( )) 

Produzione

 False False True True False False 4 3 3 3 

Funzioni di serie

Ci sono alcune funzioni utilizzate in Series che sono le seguenti:

Funzioni Descrizione
Serie Panda.map() Mappare i valori di due serie che hanno una colonna comune.
Serie Panda.std() Calcola la deviazione standard del dato insieme di numeri, DataFrame, colonna e righe.
Serie Panda.to_frame() Converti l'oggetto serie nel dataframe.
Serie Panda.value_counts() Restituisce una serie che contiene conteggi di valori univoci.