【Linux、Windows】使用wget下载整个网站、特定目录、指定文件类型

一、wget的使用

下载某个目录下的所有文件:
wget -c -r -np -k -L -p www.xxx.xxx/pub/path/

若用到外部域名的图片或链接,须添加-H参数:
wget -np -nH -r --span-hosts www.xxx.xxx/pub/path/

参数解释如下:

-c 断点续传
-r 递归下载,下载指定网页某一目录下(包括子目录)的所有文件
-np 递归下载时不搜索上层目录,如 wget -c -r www.xxx.xxx/pub/path/ 没有加参数-np,就会同时下载path的上一级目录pub下的其它文件
-k 将绝对链接转为相对链接,下载整个站点后脱机浏览网页,最好加上这个参数
-L 递归时不进入其它主机
-p 下载网页所需的所有文件,如图片等
-nH, –no-host-directories 不创建主机目录
-H, -–span-hosts 当递归时转到外部主机
–accept=LIST 可以接受的文件类型(LIST换成文件后缀)
–reject=LIST 拒绝接受的文件类型(LIST换成文件后缀)

二、Windows下使用wget

wget是Linux下的工具,直接使用即可。下面是如何在Windows下使用wget。

1、下载WGET for Windows:wgetwin-1_5_3_1-binary.zip
2、解压到目录 比如 D:\wget
3、添加wget环境变量,这样使用就更方便了,右键计算机->属性->高级系统设置->高级->环境变量->选中PATH->编辑,在最后添加 ;D:\wget (实际解压路径)
4、完成。

发表评论

电子邮件地址不会被公开。 必填项已用*标注