(Translated by https://www.hiragana.jp/)
HTTrack - 维基百科,自由的百科全书

HTTrackいち自由じゆう开源てき网络爬虫以及离线浏览うつわ。它的作者さくしゃ泽维尔·罗奇(Xavier Roche),ざいGNU通用つうよう公共こうきょう授权じょうGPLしも发布。

HTTrack
HTTrack启动时的画面
开发しゃXavier Roche[1]
とうぜん版本はんぽん3.49-2(2017ねん5がつ20日はつか,​7ねんまえ​(2017-05-20[2]
みなもとだい码库 编辑维基数据链接
编程语言C语言
操作そうさけいMicrosoft Windows, Mac OS X, GNU/LinuxFreeBSD
类型离线浏览网络爬虫
许可协议GNU通用つうよう公共こうきょう授权じょう
网站www.httrack.com

使用しようしゃ以通过HTTrack互联网うえてき网站页面しも载到本地ほんじ计算机上きじょうざいだま认设おけ,HTTrack对网站页めんてき载结はて按照原始げんし站点しょう对链せってき结构らい组织てきよう网页浏览开这个被载下らいてき网站(也称さく镜像てき页面,就可以离线浏览了。

HTTrack也能对已经镜ぞう过的站点进行更新こうしんあるもの中断ちゅうだんりょうてき工作こうさくだんてん续传。以通过选项和过滤(include/exclude)配置はいちHTTrackてき方方かたがた面面めんめん。它还整合せいごうゆう帮助けい统。它有一个基本的命令行版本和两个GUI(为Windows设计てきWinHTTrack为Unix-likeけい统设计的WebHTTrack);命令めいれいぎょう版本はんぽん以和Shell脚本きゃくほん(Shell script)以及cron联用。

HTTrack使用しよう网络爬虫载网站。对于ゆうrobots.txtてき网站,如果不在ふざいほどじょ运行时取消とりけしげんせいだま认设おけてきほどじょかい网站完全かんぜん镜像。HTTrackのう跟随基本きほんてきJavaScriptあるものAppletFlashなかてき链接,ただし对于复杂てき链接(使用しよう函数かんすうひょう达式创建てき链接)あるものふく务器はしてきImage MapえいImage Map则无のう为力。

あんそうあずか使用しよう

编辑

ざい许多Unix-likeけい统下,ただ需要じゅようようつつみ管理かんり工具こうぐあんそうhttrackそくれいDebian使用しよう

sudo aptitude install httrack

いち个使用例ようれい

httrack "http://www.all.net/" -O "/tmp/www.all.net" "+*.all.net/*" -v

它的意思いし:以http://www.all.net/ 为起はじめURL,输出いた/tmp/www.all.netぶんけん夹,范围www.all.netいき名下みょうげてき所有しょゆうぶんけん,并显しめせ所有しょゆう错误しんいき(verbose)。さら详细てきしんいき请看かん网上てきUsers Guide[3]

まいり

编辑

脚注きゃくちゅう

编辑
  1. ^ Credits: Greetings & authors. [2012-10-26]. (原始げんし内容ないようそん于2020-04-29). 
  2. ^ そん副本ふくほん. [2012-10-26]. (原始げんし内容ないようそん于2012-10-25). 
  3. ^ Httrack Users Guide. [2012-10-26]. (原始げんし内容ないようそん于2012-10-26). 

外部がいぶ链接

编辑