I PANDA SI FONDONO - TUTORIAL SUI PANDA

Panda unisci() è definito come il processo di riunificazione dei due set di dati in uno solo e di allineamento delle righe in base agli attributi o alle colonne comuni. È un punto di ingresso per tutte le operazioni di join di database standard tra oggetti DataFrame:

Sintassi:

 pd.merge(left, right, how=&apos;inner&apos;, on=None, left_on=None, right_on=None, left_index=False, right_index=False, sort=True)

parametri:

DataFrame o serie denominate

{'sinistra', 'destra', 'esterno', 'interno'}, predefinito 'interno'

Sinistra:Utilizza solo le chiavi del frame sinistro, simile a un left external join SQL; preservare l'ordine delle chiavi.Giusto:Utilizza solo le chiavi del frame destro, simile a un right external join SQL; preservare l'ordine delle chiavi.esterno:Utilizzava l'unione delle chiavi di entrambi i frame, simile a un full external join SQL; ordinare le chiavi lessicograficamente.interno:Utilizza l'intersezione delle chiavi di entrambi i frame, simile a un inner join SQL; preservare l'ordine dei tasti di sinistra.

etichetta o elenco

lasciato acceso:

etichetta o elenco o simile a un array

bool, predefinito False

tupla di (str, str), default ('_x', '_y')

bool, predefinito Vero

bool o str, predefinito False

_unire

'solo_sinistra'per le osservazioni la cui chiave di unione appare solo nella 'sinistra' del DataFrame, mentre,'solo_giusto'è definito per le osservazioni in cui la chiave di unione appare solo nella 'destra' del DataFrame,'Entrambi'se la chiave di unione dell'osservazione si trova in entrambi.

stre, facoltativo

'one_to_one' o '1:1': controlla se le chiavi di unione sono univoche sia nel set di dati sinistro che in quello destro.
'one_to_many' o '1:m': controlla se le chiavi di unione sono univoche solo nel set di dati di sinistra.
'many_to_one' o 'm:1': controlla se le chiavi di unione sono univoche solo nel set di dati corretto.
'many_to_many' o 'm:m': è consentito, ma non comporta controlli.

Esempio 1: unisci due DataFrame su una chiave

 # import the pandas library import pandas as pd left = pd.DataFrame({ &apos;id&apos;:[1,2,3,4], &apos;Name&apos;: [&apos;John&apos;, &apos;Parker&apos;, &apos;Smith&apos;, &apos;Parker&apos;], &apos;subject_id&apos;:[&apos;sub1&apos;,&apos;sub2&apos;,&apos;sub4&apos;,&apos;sub6&apos;]}) right = pd.DataFrame({ &apos;id&apos;:[1,2,3,4], &apos;Name&apos;: [&apos;William&apos;, &apos;Albert&apos;, &apos;Tony&apos;, &apos;Allen&apos;], &apos;subject_id&apos;:[&apos;sub2&apos;,&apos;sub4&apos;,&apos;sub3&apos;,&apos;sub6&apos;]}) print (left) print (right)

Produzione

 id Name subject_id 0 1 John sub1 1 2 Parker sub2 2 3 Smith sub4 3 4 Parker sub6 id Name subject_id 0 1 William sub2 1 2 Albert sub4 2 3 Tony sub3 3 4 Allen sub6

Esempio2: unisci due DataFrame su più chiavi:

 import pandas as pd left = pd.DataFrame({ &apos;id&apos;:[1,2,3,4,5], &apos;Name&apos;: [&apos;Alex&apos;, &apos;Amy&apos;, &apos;Allen&apos;, &apos;Alice&apos;, &apos;Ayoung&apos;], &apos;subject_id&apos;:[&apos;sub1&apos;,&apos;sub2&apos;,&apos;sub4&apos;,&apos;sub6&apos;,&apos;sub5&apos;]}) right = pd.DataFrame({ &apos;id&apos;:[1,2,3,4,5], &apos;Name&apos;: [&apos;Billy&apos;, &apos;Brian&apos;, &apos;Bran&apos;, &apos;Bryce&apos;, &apos;Betty&apos;], &apos;subject_id&apos;:[&apos;sub2&apos;,&apos;sub4&apos;,&apos;sub3&apos;,&apos;sub6&apos;,&apos;sub5&apos;]}) print pd.merge(left,right,on=&apos;id&apos;)

Produzione

 id Name_x subject_id_x Name_y subject_id_y 0 1 John sub1 William sub2 1 2 Parker sub2 Albert sub4 2 3 Smith sub4 Tony sub3 3 4 Parker sub6 Allen sub6

TechCodeview