离线浏览再省一笔
棋子
序:离线浏览器的原理十分简单:由用户自己安排下载的方式、填入Web站点的路径和在硬盘上存储的位置,并且保留所有页面的链接。这样,当所要的信息都下载到硬盘后,即可离线使用浏览器慢慢浏览。下面就以离线浏览利器Teleport
Pro为例讲讲这类软件的使用方法。
★★新手上路★★
安装与设定
TeleportPro的安装文件是一个名叫pro12.exe的自解包。先将其拷贝到一个临时目录下运行,它便会自行解压,并执行setup.exe,按照其安装向导提示,就可以顺利完成安装。安装完后在TeleportPro程序组中,双击Teleportpro图标即可运行。如果你是通过Proxy访问Internet的话,请在“File”菜单下面选中“ProxyServer”,输入你的Proxy
Server的地址和端口,就可以开始使用它了。该软件可以到了www.tenmax.com下载。
下载网页
TeleportPro是在“New Project Wizard”(新作业向导)的帮助下一步步完成的。
1.双击TeleportPro图标即可自动调出
TeleportPro的主窗口,单击主窗口工具栏中的图标,“New Project
Wizard”就被启动,共有六大功能供你选择,分别介绍如下。
·Create a brosable copy of a website on my harddriver:将拷贝整个站点以供离线浏览。如果你须要创建一个可以离线浏览的Web副本,这是最快最简单的一种方式;
·Duplicate a website,including directory structure:该功能将复制一个web站点,并且包含它所有的目录结构,相当于建立一个镜像站点;
·Search a web Site for files of a certain type:在网站上寻找特定类型的文件。如果你只想下载网页中特定类型的档案,例如纯文本文件、图形文件等等,请选用该功能;
·Explore every site linked from a certain site:该功能将列出web站点上所有的文件链接,但并不实际下载文件;
·Retrieve one or more files as known address:如果你想从已知的一系列网址中搜索和下载一个已知文件的话,请采用这种方式。TeleportPro将顺序搜索每个你输入的地址,并将相应的搜索结果下载到你的硬盘上;
·Search a Website for key words:用关键字搜索网站,使用这项功能,TeleportPro将根据你输入的关键字,自动搜索含有这些关键字的主页。
你可以根据自己的需要,选择其中一种功能。
2.单击“下一步”,输入你想离线浏览的网站的网址
3.再单击“下一步”,选择默认的“Text,Graphics,and Sound。不要输入account或password。当你再单击“下一步”的时候,系统就为你创建了一个新“专案”了。最后单击“完成”,保存专案以后,你就可以运行它了。
运行“专案”和离线浏览
请从“Project”菜单中选择“Start”(按工具条上的运行按钮亦可),“运行栏”会告诉你每一个运行通道的状态。此时,你大可以将窗口最小化,让它在后台运行。而自己去做别的事情。
离线浏览
专案窗口与windows的资源管理器相似,其右部是文件列表,Teleportpro针对“专案”中的每一个网页,访问了哪些文件等均提供记录,让人一目了然。
请在专案窗口中任何文件夹处按下鼠标右键,然后选择“Open”按钮。TeleportPro会自动启动你的默认浏览器将网页装入,供你离线浏览。
★★进阶特区★★
在实际使用TeleportPro时,出现下载一个不大的网站,用时却长达几个小时,看看下载内容,不想下载的内容下载了,而想下载的内容还没下载完,问题出在哪儿?原来是设置出了问题。看来我们还得钻研一下TeleportPro的设置。单击工具栏中的“属性”按钮,TeleportPro的设置主要在这里,下面详细为你介绍:
1.概况(Summary)
这里是项目的基本情况,如读取多少页,下载多少文件、多少字节等等。这里的“Clear
Project Database”(清理项目数据)相当于系统初始化,它将清除用户进行的所有设置和下载的内容,所以没有把握不要按它。最后一行是自动保存数据的间隔时间,因为TeleportPro先把下载内容放在内存中,而不是放在磁盘上,这样做可以节省时间,如果不选此项,TeleportPro会在完全下载之后,或内存没有空间时才将下载内容存到硬盘上。当然还是设个定时存盘放心,否则一旦掉电,你哭去吧,没人可怜你。
2.文件下载(FileRetrieval)
对下载的文件进行设置。它可以规定下载文件的大小,超过规定字节的文件不下载,如果规定为0,则下载所有文件;还可以规定下载的文件类型,可用通配符*和?,如*.html、*.gif等,如果你喜欢某个站点的图片,可在此设置只下载图片文件,而把其它类型的文件过滤掉。
在下载模式(Retrieval Mode)中还有几个选项,一是选择下载所有文件,一般此项要选中,但如果你只下载大于一定字节的文件时,这项要关掉;二是选择是否下载背景图片;三是选择是否下载JAVA小程序;四是选择只下载文件名,第四项 |
|
看似无用,实际很有用,因为选中此项后下载速度非常快,这样在文件列表中可以检查你的设置是否生效。如你设置不下载某一地址的内容,但你没有信心,不知设置是否正确,可打开这一选项,在最短的时间内检验设置的效果。
3.浏览/映像(Browsing/mirroring)
在这里定义TeleportPro如何在你的磁盘上保存文件,如何定位链接等。
有制作HTML文件经历的朋友可能都知道,一个HTML并不能包含所有网页中所能看到的东西,如把一个HTML文件单独COPY到一个目录下,然后用浏览器打开,会看不到图片,因为图片文件不包含在HTML文件之内,这种情况TeleportPro为你想到了,选中Always
save HTML pages(完整保存HTML页)就可以完整下载HTML页。
Replicate the directory structure of remote servers(复制远程服务器目录结构),是把下载的文件按远程服务器目录结构进行保存,这样可以精确复制网站结构;如果不选,所有文件都将放在同一目录下,有可能出现重名情况,遇到这种情况,TeleportPro会自动将重名文件进行改名保存。但在实际使用中,我发现TeleportPro在这方面的表现不佳,如有重名文件,有可能出现停滞情况,好像死机一般,所以我建议在下载地址较多时,最好选中此项,以免出差错,尤其是在无人看守或自动下载之时,长时间不工作,却占用线路,耗费网络费和电话费,这个损失太大了。
微软的Internet Explorer只把*.htm或*.html当作HTML文件,但是很多网站的HTML文件的扩展名不是*.htm或*.html,如*.shtml或*.pl,这样IE就不认为它们是HTML,选中Use
MSIE-compatible file names(使用MSIE兼容文件名),就可以解决这个问题。
Localize links for retrieved files(为下载文件定位链接)选中此项后离线浏览时就可以像浏览网站一样浏览下载内容。
4.探索(Exploration)
Explore server-side image maps,探索服务器方面的映像图,这里包含了TeleportPro的一种叫作“Pinging”的新技术,对用户而言,不必穷究技术细节,一般选中即可。Explore
frames和Explore forms,是让Teleport搜索一些特殊的链接,这样的链接会被某些浏览器读取。
TeleportPro之所以快,是因为它可以同时多线下载,东方不亮西方亮,哪个空闲下载哪个,但到底同时多少线连接合适?LaunchXretrievalthreads允许你选择,默认为10,其实10个连接同时工作基本是满负荷了,没必要再压担子。
5.网络规范(Netiquette)
有的站点速度快,有的站点速度慢,Enable Domain Dispersed Querying是允许TeleportPro与多服务器连接,这样可以避免在一条路上死等,从而提高下载速度;也正因为TeleportPro可同时多线连接,所以有时会出现Modem忙不过来的情况,如不加以限制,下载的文件有可能不全,或出其它错误,此时选中Enable
Server Overload Protection可避免这一危险。太快了可以慢下来,太慢了可以快起来,这两个选项是一定要选中的。Robot
ExClusion standard是一种在自动代理方面的网络标准,遵守它可以防止TeleportPro漫无边际地漫游,一般此项也要选中。
6.排除(Exclusions)
这是一个非常有用的选项,把它玩熟了,你在别人眼里就成高手了,因为上面介绍的不少选项TeleportPro都为你设置好了,用不着你费心思,这里的选项却必须由你根据实际情况来设置,好在它并不复杂,请听我细细道来。
第一栏是排除某些内容,意为:“不保存Web页或者与某些Web页相链接的文件,除非页中包含以下的关键字”,哪些呢?你自己添。允许使用通配符*和?,还提供了大小写匹配和全词匹配选项。比如你在此栏中输入“电脑”,不选“全词匹配”,则TeleportPro只下载包含“电脑”两字的Web页,没有这两个字的Web页不下载。
第二栏是排除某些文件,用DOS文件名形式表示。如在此栏中输入“*.GIF”,则表示下载除以GIF为扩展名的所有其它文件,这个选项比较容易理解。
第三栏是排除某些网址,HTTP地址一定要加上“http://”。这个选项的用处比上两个要大,举一个最简单的例子:某网站的结构在主页http://www.cniti.com下有AA、BB、CC三个次页,现在要下载AA页的内容,那么就要排除BB和CC这两个网址。但实际情况是复杂的,因为网页相互之间的链接特别多,“跳级”的现象也很严重,所以要设置得科学也是不容易的。我的经验是:尽量把排除级设高些,这样出问题的机会少,比如在这个例子中,设置下载的网址是http://www.cniti.com/aa,在这里排除的网址可以是http://www.cniti.com/bb和http://www.cniti.comcc,也可以是http://www.cniti.com显然后一种比较科学,一则设置内容少,TeleportPro运行速度快二则可以避免因为没有发现意外链接而出错。还有一个经验,就是尽量让TeleportPro单独工作、不要边上网一边让TeleportProk干活,这样很容易出意外。
注意:排除设置的优先级高于其它设置。还有一点,就是每个排除栏目的容量是有限的,不允许你无限制地增加排除条件。
7.高级(Advanced)
这里是一些自动化设置,主要是用于无人监控的预定(Schedule)下载。
文章版权或来源:新潮电子 |