La serie Pandas può essere definita come un array unidimensionale in grado di memorizzare vari tipi di dati. Possiamo convertire facilmente la lista, la tupla e il dizionario in serie usando ' serie ' metodo. Le etichette delle righe delle serie sono chiamate indice. Una serie non può contenere più colonne. Ha il seguente parametro:
Creazione di una serie:
Possiamo creare una Serie in due modi:
- Crea una serie vuota
- Crea una serie utilizzando gli input.
Crea una serie vuota:
Possiamo facilmente creare una serie vuota in Pandas, il che significa che non avrà alcun valore.
La sintassi utilizzata per creare una serie vuota:
= pandas.Series()
L'esempio seguente crea un oggetto di tipo Serie vuota che non ha valori e ha un tipo di dati predefinito, ovvero float64 .
Esempio
import pandas as pd x = pd.Series() print (x)
Produzione
Series([], dtype: float64)
Creazione di una serie utilizzando gli input:
Possiamo creare serie utilizzando vari input:
- Vettore
- Dict
- Valore scalare
Creazione di serie da array:
Prima di creare una serie, dobbiamo innanzitutto importare il file insensato module e quindi utilizzare la funzione array() nel programma. Se i dati sono ndarray, l'indice passato deve avere la stessa lunghezza.
Se non passiamo un indice, per impostazione predefinita indice di intervallo(n) viene passato dove n definisce la lunghezza di un array, ovvero [0,1,2,.... intervallo(len(array))-1 ].
Esempio
import pandas as pd import numpy as np info = np.array(['P','a','n','d','a','s']) a = pd.Series(info) print(a)
Produzione
0 P 1 a 2 n 3 d 4 a 5 s dtype: object
Crea una serie da dict
Possiamo anche creare una serie da dict. Se l'oggetto dizionario viene passato come input e l'indice non è specificato, le chiavi del dizionario vengono prese in ordine per costruire l'indice .
Se viene passato l'indice, i valori corrispondenti a una particolare etichetta nell'indice verranno estratti dal file dizionario .
elenco degli stati
#import the pandas library import pandas as pd import numpy as np info = {'x' : 0., 'y' : 1., 'z' : 2.} a = pd.Series(info) print (a)
Produzione
x 0.0 y 1.0 z 2.0 dtype: float64
Crea una serie utilizzando Scalare:
Se prendiamo i valori scalari, è necessario fornire l'indice. Il valore scalare verrà ripetuto per far corrispondere la lunghezza dell'indice.
#import pandas library import pandas as pd import numpy as np x = pd.Series(4, index=[0, 1, 2, 3]) print (x)
Produzione
0 4 1 4 2 4 3 4 dtype: int64
Accesso ai dati dalle serie con Posizione:
Una volta creato l'oggetto di tipo Serie, puoi accedere ai suoi indici, ai dati e persino ai singoli elementi.
È possibile accedere ai dati nelle serie in modo simile a quello in ndarray.
import pandas as pd x = pd.Series([1,2,3],index = ['a','b','c']) #retrieve the first element print (x[0])
Produzione
1
Attributi degli oggetti della serie
L'attributo Serie è definito come qualsiasi informazione relativa all'oggetto Serie come dimensione, tipo di dati. ecc. Di seguito sono riportati alcuni degli attributi che è possibile utilizzare per ottenere informazioni sull'oggetto Serie:
Attributi | Descrizione |
---|---|
Indice.serie | Definisce l'indice della serie. |
Forma.della.serie | Restituisce una tupla di forma dei dati. |
Serie.dtipo | Restituisce il tipo di dati dei dati. |
Serie.dimensione | Restituisce la dimensione dei dati. |
Serie.vuoto | Restituisce True se l'oggetto Series è vuoto, altrimenti restituisce false. |
Serie.hasnans | Restituisce True se sono presenti valori NaN, altrimenti restituisce false. |
Serie.nbytes | Restituisce il numero di byte nei dati. |
Serie | Restituisce il numero di dimensioni nei dati. |
Serie.dimensionearticolo | Restituisce la dimensione del tipo di dati dell'elemento. |
Recupero dell'array di indici e dell'array di dati di un oggetto serie
Possiamo recuperare l'array di indici e l'array di dati di un oggetto Series esistente utilizzando l'indice e i valori degli attributi.
import numpy as np import pandas as pd x=pd.Series(data=[2,4,6,8]) y=pd.Series(data=[11.2,18.6,22.5], index=['a','b','c']) print(x.index) print(x.values) print(y.index) print(y.values)
Produzione
RangeIndex(start=0, stop=4, step=1) [2 4 6 8] Index(['a', 'b', 'c'], dtype='object') [11.2 18.6 22.5]
Recupero di tipi (dtype) e dimensioni del tipo (itemsize)
Puoi utilizzare l'attributo dtype con l'oggetto Series come dtype per recuperare il tipo di dati di un singolo elemento di un oggetto serie, puoi utilizzare l'attributo dimensione dell'articolo attributo per mostrare il numero di byte allocati a ciascun elemento di dati.
import numpy as np import pandas as pd a=pd.Series(data=[1,2,3,4]) b=pd.Series(data=[4.9,8.2,5.6], index=['x','y','z']) print(a.dtype) print(a.itemsize) print(b.dtype) print(b.itemsize)
Produzione
int64 8 float64 8
Recupero della forma
La forma dell'oggetto Serie definisce il numero totale di elementi inclusi i valori mancanti o vuoti (NaN).
import numpy as np import pandas as pd a=pd.Series(data=[1,2,3,4]) b=pd.Series(data=[4.9,8.2,5.6],index=['x','y','z']) print(a.shape) print(b.shape)
Produzione
(4,) (3,)
Recupero di dimensione, dimensione e numero di byte:
import numpy as np import pandas as pd a=pd.Series(data=[1,2,3,4]) b=pd.Series(data=[4.9,8.2,5.6], index=['x','y','z']) print(a.ndim, b.ndim) print(a.size, b.size) print(a.nbytes, b.nbytes)
Produzione
1 1 4 3 32 24
Controllo del vuoto e della presenza di NaN
Per verificare che l'oggetto Series sia vuoto, puoi utilizzare il file attributo vuoto . Allo stesso modo, per verificare se un oggetto serie contiene o meno alcuni valori NaN, è possibile utilizzare il file Hassan attributo.
Esempio
cos'è svn checkout
import numpy as np import pandas as pd a=pd.Series(data=[1,2,3,np.NaN]) b=pd.Series(data=[4.9,8.2,5.6],index=['x','y','z']) c=pd.Series() print(a.empty,b.empty,c.empty) print(a.hasnans,b.hasnans,c.hasnans) print(len(a),len(b)) print(a.count( ),b.count( ))
Produzione
False False True True False False 4 3 3 3
Funzioni di serie
Ci sono alcune funzioni utilizzate in Series che sono le seguenti:
Funzioni | Descrizione |
---|---|
Serie Panda.map() | Mappare i valori di due serie che hanno una colonna comune. |
Serie Panda.std() | Calcola la deviazione standard del dato insieme di numeri, DataFrame, colonna e righe. |
Serie Panda.to_frame() | Converti l'oggetto serie nel dataframe. |
Serie Panda.value_counts() | Restituisce una serie che contiene conteggi di valori univoci. |