一、新建方案

1、认识方案列表;

方案设定窗口的左侧,是一个树形目录,以‘分组’和‘方案’两级方式显示方案列表,见图示1:


(图示1)

 

 

2、操作菜单;

在方案树上点击右键,弹出操作菜单,注意,在分组和方案上点击右键的弹出菜单项目是有区别的;

 

新增:弹出菜单中的‘添加组’和‘添加方案’项分别用来新增方案和分组,方案列表需要至少1个分组;

 

复制:在方案上弹出菜单时有‘复制方案’项,可以将当前选中的方案完整复制一份,对于新建大部分设置和该方案相似的新方案,能缩减很多操作;

 

更名:使用弹出菜单的‘重命名’项,能修改选中的分组或方案的名称;在分组或方案名称上双击鼠标左键,也可以进入修改状态;

 

删除:使用弹出菜单的‘删除’项,能删除选中的分组或方案,这是删除的唯一方法;

 

排序:分组和方案根据名称自动排序;

 

调整分组: 左键点住方案名称,可以将方案拖动到其他分组,见图示2:


(图示2)

 

 

 

二、基本设置

创建新方案后,在方案窗口右侧的方案设定区进行方案设置;


 

1、选择规则;

一个方案由采集规则、中间规则、发布规则组合而成,这三者是相互独立,又是相互关联的,通过不同的搭配,能组合出实现各种采集目标的方案,见图示3:


(图示3)

当所选规则有关键项未设置时,将弹出提示;

点击规则选框旁的小图标,可以快捷进入规则配置窗口;

注:改变方案的采集规则会导致该方案的未发布文章记录被自动删除。

 

2、方案执行次数

方案在自动工作时,每天的执行总次数,设为0则不限制,见图示:


通过本项与自动文章发布数配合,可以控制方案每天发布的文章数量。

 

3、文章发布数

在自动工作时,每一次执行方案所允许发布成功的最大文章数量,设为0则不限制,见图示:


通过本项与自动执行次数配合,可以控制方案每天发布的文章数量。

 

4、采集间隔;

用于控制采发节奏,很多网站尤其是论坛类都对一定时间内的发帖次数有限制,如果用户未在接口中取消这个限制,则需要用采集间隔时间来控制采发节奏,以保证不会被网站程序拒发文章,同时,也控制采发速度,采集间隔以秒为单位,见图示4:


(图示4)

 

5、发布顺序;

这是一个发布时的容错机制,通过三个选项的组合,控制数据发布与文件上传,见图示5:


(图示5)

先发布文章:选中此项,发布时,先发布各数据项,成功后再上传文件;

 

先上传文件:选中此项,发布时,先上传文件,成功后再发布各数据项;

 

6、重复检查范围;

勾选此项时,ET内部数据库文章重复检查仅在同一方案中进行,若本地数据库中有文章与采集目标相同,而所属方案不同,仍执行采集,见图示7:


(图示7)

 

7、文章本地检查模式;

ET采集文章列表时,会现根据预设模式检查是否与ET内部数据库已采集文章重复,如果重复,则不会再次采集,下图中的四个选项则用来控制检查模式,见图示6:


(图示6)

不检查重复:选中时,不在ET内部数据库做文章是否重复检查;

 

按网址检查:选中时,若内部数据库存在与采集目标网址相同的文章条目,则系统判定文章重复,不予采集,此项受‘仅限本方案’选项影响;

 

按标题检查:选中时,若内部数据库存在与采集目标标题相同的文章条目,则系统判定文章重复,不予采集,此项受‘仅限本方案’选项影响;

 

网址和标题:选中时,只有在内部数据库存在与采集目标网址、标题同时相同的文章条目,系统才判定文章重复,不予采集,此项受‘仅限本方案’选项影响;

 

8、不保存记录

启用本项,将不保存发布成功的文章到已发布文章列表,选项见图示:


 

 

三、文件设置

当启用文件下载后,下载文件将按此处设置处理。


 

1、强制发布文章

勾选此项时,则当发生文件下载、上传失败的情况后仍然继续发布文章。

 

2、发布后本地自动删除文件

此项一般在ET运行于工作机时启用,工作机上一般不需要保留下载文件,启用此项则在文件上传后自动删除本地文件;当ET在网站服务器上运行,且文件直接下载到网站文件目录时,不可启用此项;

 

3、图片下载失败时从文章删除

如果用户启用了文件传送失败时强制发布文章,那么在文章中无效的图片将不能正常显示,启用本功能时,则会自动从文章中删除图片的HTML代码,以美化显示,本功能为2.5版新增。

 

4、使用下载文件原名

启用本项时ET将自动获取下载文件的原名。

注:当下载的文件名重复时,将会使用ET命名规则的文件名。

 

5、自动命名名前缀

下载文件的命名规则是 ‘文件名前缀+本地文章ID+日期时间+文章内序号+扩展名’;

 

6、本地下载目录

指定下载文件到本地的位置;当ET在网站服务器运行时,通常不需要使用文件上传,只需要将文件保存路径指定到该网站文件目录即可;

 

7、本地子目录

在文件保存路径下按自动建立子目录,文件将保存到该子目录下;

 

8、目录同名文件

在本地保存目录中存在同名文件时的处理方法:跳过表示不下载,覆盖表示用新文件覆盖旧文件,更名表示按自动命名规则重命名新文件。

 

当ET在网站服务器上运行时,用户可以直接将下载的文件保存到网站附件目录,而不再需要使用文件上传,可参考帮助文章 《ET中文件下载和上传的四种情况》

 

四、定时设置

通过设置方案定时,可使ET在指定时间执行该方案,见图示8:


 

五、日志设置

ET采集3新增方案日志功能。


1、类型

设置需要记录的日志消息种类,警告类型包括警告和错误,当日志项目中出现警告或错误消息时,将当前信息保存到日志中,错误类型则只在出现错误消息时保存。

 

2、项目

选择需要保存的日志记录。

 

3、滚动更新

按计划周期保存最近的日志,超出周期的记录将自动删除。

文件大小限制单个日志文件的尺寸,超过后将新建日志文件。