logo

Comando Wget in Linux/Unix

Wget è il downloader di rete non interattivo che viene utilizzato per scaricare file dal server anche quando l'utente non ha effettuato l'accesso al sistema e può funzionare in background senza ostacolare il processo corrente.

  • GNU wget è un'utilità gratuita per il download non interattivo di file dal Web. Supporta i protocolli HTTP, HTTPS e FTP, nonché il recupero tramite proxy HTTP.
  • wget non è interattivo, il che significa che può funzionare in background, mentre l'utente non è connesso. Ciò consente di avviare un recupero e disconnettersi dal sistema, lasciando che wget finisca il lavoro. Al contrario, la maggior parte dei browser Web richiede la presenza costante dell’utente, il che può rappresentare un grosso ostacolo durante il trasferimento di grandi quantità di dati.
  • wget può seguire i collegamenti nelle pagine HTML e XHTML e creare versioni locali di siti Web remoti, ricreando completamente la struttura delle directory del sito originale. Questo a volte viene definito download ricorsivo. Nel fare ciò, wget rispetta lo standard di esclusione dei robot (/robots.txt). È possibile istruire wget a convertire i collegamenti nei file HTML scaricati nei file locali per la visualizzazione offline.
  • wget è stato progettato per garantire robustezza su connessioni di rete lente o instabili; se il download fallisce a causa di un problema di rete, continuerà a riprovare finché non sarà stato recuperato l'intero file. Se il server supporta la ripresa, ordinerà al server di continuare il download da dove era stato interrotto.

Sintassi di base:

La sintassi di base del comando Wget è la seguente:



wget [option] [URL]>

Qui

[options]> rappresenta varie opzioni della riga di comando che modificano il comportamento di Wget

[URL]> è l'indirizzo del file o del sito Web da scaricare.



Opzioni:

Ecco le opzioni disponibili nel comando wget in Linux.

Opzione Descrizione Sintassi
-v / –versione Visualizza la versione di Wget installata sul tuo sistema. $ wget -v
-h / –aiuto Stampa un messaggio di aiuto che mostra tutte le opzioni della riga di comando disponibili per Wget. $ wget -h [URL]
-o file di registro Dirigere tutti i messaggi generati dal sistema al file di registro specificato. Se non viene specificato alcun file di registro, i messaggi vengono reindirizzati al file di registro predefinito ('wget-log'). $ wget -o file di registro [URL]
-b / –sfondo Invia il processo in background non appena inizia, consentendo ad altri processi di continuare. Se non viene specificato alcun file di output, l'output viene reindirizzato a 'wget-log' per impostazione predefinita. $ wget -b [URL]
-UN Aggiungi i messaggi di output al file di registro di output corrente senza sovrascriverlo. Ciò preserva il registro dei comandi precedenti, con il registro corrente aggiunto dopo di essi. $ wget -a file di registro [URL]
-io Leggere gli URL da un file. Se specificati come file, gli URL vengono letti dall'input standard. Se gli URL sono presenti sia nella riga di comando che nel file di input, quelli sulla riga di comando hanno la precedenza. Non è necessario che il file sia un documento HTML. $ wget -i file di input
$ wget -i file di input [URL]
-t numero / –tentativi=numero Imposta il numero di tentativi. Specificare '0' o 'inf' per tentativi infiniti. Il valore predefinito è 20 tentativi, con eccezioni per errori fatali come il rifiuto della connessione o il collegamento non trovato. $ wget -t numero [URL]
-C Riprendi un file parzialmente scaricato se il file supporta la ripresa. Se la ripresa non è supportata, il download non potrà essere ripreso. $ wget -c [URL]
-In Imposta il sistema in modo che attenda il numero di secondi specificato tra i recuperi. Questa opzione aiuta a ridurre il carico del server distanziando le richieste. Il tempo può essere specificato in secondi, minuti (m), ore (h) o giorni (d). $ wget -w numero_in_secondi [URL]
-R Abilita il recupero ricorsivo di collegamenti specificati, anche in caso di errori irreversibili. Questa opzione segue ricorsivamente i collegamenti all'interno dell'URL specificato. $ wget -r [URL]

Esempio :

1. Per scaricare semplicemente una pagina web:

Per scaricare un singolo file da un URL, è sufficiente specificare l'URL come segue:

wget http://example.com/sample.php>

2. Per scaricare il file in background

Esegui il processo di download in background utilizzando il file-b>O--background>opzione:



wget -b http://www.example.com/samplepage.php>

3. Per sovrascrivere il registro durante il comando wget

Reindirizzare i messaggi di output in un file di registro utilizzando il file-o>opzione:

wget http://www.example.com/filename.txt -o /path/filename.txt>

4. Per riprendere un file parzialmente scaricato

Se un download viene interrotto, riprenderlo utilizzando il file-c>opzione:

wget -c http://example.com/samplefile.tar.gz>

5. Per provare un dato numero di volte

Specificare il numero di tentativi utilizzando il file--tries>opzione:

wget --tries=10 http://example.com/samplefile.tar.gz>

6. Imposta il tempo di attesa tra i recuperi:

Imposta il tempo di attesa tra i recuperi utilizzando il comando-w>opzione (in secondi, minuti, ore o giorni):

wget -w 10 http://example.com/large_file.zip>

7. Abilita il recupero ricorsivo:

Abilita il recupero ricorsivo per scaricare un intero sito Web utilizzando il file-r>opzione:

wget -r http://example.com/>

8. Leggi gli URL dal file:

Leggi gli URL da un file e scaricali utilizzando il file-i>opzione:

wget -i urls.txt>

Comando Wget – Domande frequenti

A cosa serve il comando wget?

Il comando wget è un potente strumento da riga di comando utilizzato nei sistemi basati su Linux e Unix per recuperare file da Internet tramite protocolli HTTP, HTTPS e FTP. È particolarmente utile per download non interattivi, mirroring di siti Web e download ricorsivi.

Come si scarica un file usando wget?

Per scaricare un singolo file utilizzando wget, puoi semplicemente eseguire il comando seguito dall'URL del file che desideri scaricare.

Per esempio:

wget https://example.com/file.zip>

Come posso scaricare un intero sito Web utilizzando wget?

Per scaricare un intero sito Web in modo ricorsivo, utilizzare il file-m>O--mirror>opzione insieme a-p>O--page-requisites>opzione per scaricare tutti i file necessari.

Per esempio:

wget -m -p https://example.com>

Come posso limitare la velocità di download o la larghezza di banda quando utilizzo wget?

Puoi usare il--limit-rate>opzione per limitare la velocità di download o l'utilizzo della larghezza di banda.

Ad esempio: per limitare la velocità di download a 500KB/s, puoi eseguire:

wget --limit-rate=500k https://example.com/file.zip>

Come posso continuare un download interrotto utilizzando wget?

Se un download viene interrotto, è possibile utilizzare il file-c>O--continue>opzione per riprendere il download da dove era stato interrotto.

Per esempio:

wget -c https://example.com/file.zip>

Conclusione

In questo articolo abbiamo discusso del comando Wget che è uno strumento utile in Linux per scaricare file da Internet senza bisogno dell'interazione dell'utente. Funziona silenziosamente in background, il che significa che puoi avviare un download e fare altre cose mentre funziona. Wget può gestire vari tipi di indirizzi web e può persino copiare interi siti web. È utile per connessioni Internet lente o inaffidabili perché continua a provare a scaricare finché non riesce. Inoltre, offre funzionalità utili come la ripresa dei download interrotti e l'impostazione dei tempi di attesa tra i recuperi. Imparando i suoi semplici comandi e opzioni, gli utenti possono gestire in modo efficiente i propri download e risparmiare tempo.