joi, 16 februarie 2017

Utilizati wget pentru descarcarea fisierelor in linie de comanda


wget este un utilitar care va permite sa descarcati pagini web, fisiere si imagini folosind linia de comanda. Fie ca doriti sa descarcati un singur fisier, un dosar intreg sau chiar un site intreg, wget va permite sa o faceti cu doar cateva apasari de taste. Printre caracteristici amintim:
- robustete: wget a fost proiectat pentru retele lente sau instabile

- descarcare recursiva: poate lucra in mod optional ca un crawler web prin extragerea de resurse legate de pagini HTML
- non-interactiv: nu necesita interactiunea cu utilizatorul
- suporta descarcarea prin proxy-uri
- SSL/TLS este acceptat pentru download-uri criptate

Instalare wget:
***RHEL/CentOS
# yum install wget -y

***Fedora
$ sudo yum install wget

***Ubuntu, Debian
$ sudo apt-get install wget

***Arch
# pacman -Sy wget

***openSUSE
# zypper install wget

***PCLinuxOS
$ su
# apt-get install wget

***Source Code
wget http://files.directadmin.com/services/wget-*.tar.gz
tar xvzf wget-*.tar.gz
cd wget-*
make
make install

Utilizarea wget in linie de comanda
1. descarcati un singur fisier
$ wget http://example.com/file.iso

2. descarcati un fisier si salvati-l sub un alt nume
$ wget ‐‐output-document=filename.html example.com

3. descarcati un fisier si salvati-l intr-un anumit director
$ wget ‐‐directory-prefix=folder/subfolder example.com

4. reluare descarcare intrerupta
$ wget ‐‐continue example.com/big.file.iso

5. descarcati un fisier, numai in cazul in care versiunea de pe server este mai nou decat copia locala
$ wget ‐‐continue ‐‐timestamping wordpress.org/latest.zip

6. Descarcati URL-uri multiple. Puneti lista de URL-uri intr-un fisier text pe linii separate
$ wget ‐‐input list-of-file-urls.txt

7. descarcati o lista de fisiere numerotate secvential de la un server
$ wget http://example.com/images/{1..20}.jpg

8. descarcati o pagina web cu toate elementele active
$ wget ‐‐page-requisites ‐‐span-hosts ‐‐convert-links ‐‐adjust-extension http://example.com/dir/file

9. descarcati un site intreg
$ wget ‐‐execute robots=off ‐‐recursive ‐‐no-parent ‐‐continue ‐‐no-clobber http://example.com/

10. descarcati toate fisierele MP3 dintr-un director
$ wget ‐‐level=1 ‐‐recursive ‐‐no-parent ‐‐accept mp3,MP3 http://example.com/mp3/

11. descarcati toate imaginile de pe un site intr-un dosar comun
wget ‐‐directory-prefix=files/pictures ‐‐no-directories ‐‐recursive ‐‐no-clobber ‐‐accept jpg,gif,png,jpeg http://example.com/images/

12. descarcati documente PDF dintr-un site web prin recursie dar sa ramana in anumite domenii
$ wget ‐‐mirror ‐‐domains=abc.com,files.abc.com,docs.abc.com ‐‐accept=pdf http://abc.com/

13. descarcati toate fisierele de pe un site, dar exclude cateva directaore
wget ‐‐recursive ‐‐no-clobber ‐‐no-parent ‐‐exclude-directories /forums,/support http://example.com

14. descarcati fisiere de pe site-uri prin parola
wget ‐‐http-user=labnol ‐‐http-password=hello123 http://example.com/secret/file.zip

15. gasiti dimensiunea unui fisier fara al descarca
wget ‐‐spider ‐‐server-response http://example.com/file.iso

16. descarcati un fisier si afisati continutul fara a-l salva
wget ‐‐output-document – ‐‐quiet google.com/humans.txt

17. cunoaste data ultimei modificari a unei pagini web
wget ‐‐server-response ‐‐spider http://www.labnol.org/

18. verificati link-urile de pe site-ul dv. pentru a va asigura ca acestea functioneaza
wget ‐‐output-file=logfile.txt ‐‐recursive ‐‐spider http://example.com

Acest articol va aratat cum sa instalati si sa folositi comanda wget.

Niciun comentariu: