logo

Countplot in Python

In questo articolo, discuteremo come possiamo creare un file countplot utilizzando la libreria Seaborn e come i diversi parametri possono essere utilizzati per dedurre risultati dalle caratteristiche del nostro set di dati.

Biblioteca Seaborn

La libreria Seaborn è ampiamente utilizzata tra gli analisti di dati, la galassia di grafici che contiene fornisce la migliore rappresentazione possibile dei nostri dati.

La libreria Seaborn può essere importata nel nostro ambiente di lavoro utilizzando-

 import seaborn as sns 

Parliamo ora del motivo per cui utilizziamo countplot e qual è il significato dei suoi parametri.

Countplot

Il countplot viene utilizzato per rappresentare l'occorrenza (conteggi) dell'osservazione presente nella variabile categoriale.

Utilizza il concetto di grafico a barre per la rappresentazione visiva.

parametri-

I seguenti parametri vengono specificati quando creiamo un countplot, vediamone una breve idea-

    xey-Questo parametro specifica i dati a cui facciamo riferimento per la rappresentazione e quindi osserva i modelli evidenziati.colore-Questo parametro specifica il colore che può dare un bell'aspetto alla nostra trama.tavolozza-Prende il valore della tavolozza. Viene utilizzato principalmente per mostrare la variabile tonalità.tinta-Questo parametro specifica il nome della colonna.dati-Questo parametro specifica il frame di dati che vorremmo prendere per la rappresentazione. Ad esempio, i dati possono essere un array.schivare-Questo parametro è facoltativo e accetta un valore booleano come input.saturazione-Questo parametro accetta un valore float. Una variazione nell'intensità dei colori può essere osservata quando lo specifichiamo.tonalità_ordine-Il parametro hue_order accetta le stringhe come input.kwargs-Il parametro kwargs specifica le mappature di chiavi e valori.ascia-Il parametro ax è facoltativo e viene utilizzato per prendere gli assi su cui vengono creati i grafici.orientare-Il parametro orient è facoltativo e indica l'orientamento della trama di cui abbiamo bisogno, orizzontale o verticale.

Vediamo ora quali sono i diversi modi di rappresentare i nostri attributi.

Nel primo esempio, creeremo un countplot per una singola variabile. Abbiamo seguito i 'suggerimenti' del set di dati per implementare lo stesso.

1. Il valore conta per una singola variabile

Esempio -

java mescolando a int
 import matplotlib.pyplot as plt import seaborn as sns import pandas as pd #loading the dataset 'tips' df=pd.read_csv('/content/tips.csv') #plotting the graph sns.countplot(x='sex',data=df) plt.show() 

Produzione:

Countplot in Python

Nel prossimo esempio utilizzeremo il parametro hue e creeremo un countplot.

Il seguente programma illustra lo stesso-

2. Rappresentare due variabili categoriali utilizzando il parametro tonalità

Esempio -

 import matplotlib.pyplot as plt import seaborn as sns import pandas as pd #loading the dataset 'tips' df=pd.read_csv('/content/tips.csv') #plotting the graph sns.countplot(x='sex',hue='smoker',data=df) plt.show() 

Produzione:

Countplot in Python

Nel prossimo esempio considereremo l'asse y e creeremo un countplot orizzontale.

Il seguente programma illustra lo stesso-

3. Creazione di grafici orizzontali

Esempio -

 import matplotlib.pyplot as plt import seaborn as sns import pandas as pd #loading the dataset 'tips' df=pd.read_csv('/content/tips.csv') #plotting the graph sns.countplot(y='sex',hue='smoker',data=df) plt.show() 

Produzione:

Countplot in Python

Diamo ora un'occhiata a come le tavolozze dei colori possono migliorare la presentazione dei nostri dati.

lancia int nella stringa java

Nel prossimo esempio utilizzeremo il parametro 'palette'.

Il seguente programma illustra lo stesso-

4. Utilizzo delle tavolozze dei colori

Ingresso-

 import matplotlib.pyplot as plt import seaborn as sns import pandas as pd #loading the dataset 'tips' df=pd.read_csv('/content/tips.csv') #plotting the graph sns.countplot(x='sex', data=df, palette='Set1') plt.show() 

Produzione:

Countplot in Python

Nel prossimo esempio utilizzeremo il parametro color e vedremo come funziona?

Il seguente programma illustra lo stesso-

5. Utilizzo del parametro 'colore'

Esempio -

 import matplotlib.pyplot as plt import seaborn as sns import pandas as pd #loading the dataset 'train' df=pd.read_csv('/content/train.csv') #plotting the graph sns.countplot(x='Pclass',hue='Sex', data=df, color='green') plt.show() 

Produzione:

Countplot in Python

Ora utilizzeremo il parametro 'saturazione' e vedremo come influisce sulla rappresentazione dei nostri dati.

Il seguente programma illustra lo stesso-

10 su 100

6. Utilizzo del parametro 'saturazione'

Esempio -

 import matplotlib.pyplot as plt import seaborn as sns import pandas as pd #loading the dataset 'train' df=pd.read_csv('/content/train.csv') #plotting the graph sns.countplot(x='Pclass',data=df, color='green', saturation=0.1) plt.show() 

Produzione:

Countplot in Python

E infine nell'ultimo esempio utilizzeremo i parametri larghezza della linea E colore del bordo.

    Utilizzando matplotlib.axes.Axes.bar()

Esempio -

 import matplotlib.pyplot as plt import seaborn as sns import pandas as pd #loading the dataset 'train' df=pd.read_csv('/content/train.csv') sns.countplot(x='Sex', data=df, color='green', facecolor=(0,0,0,0), linewidth=5, edgecolor=sns.color_palette('BrBG',2)) plt.show() 

Produzione:

Countplot in Python