ET采集技巧之如何防止采集到回复可见及类似帖子
不少论坛的帖子都设置了回复可见、或积分、权限等限制,这类帖子对于采集文章的用户来说,都是不需要的。
这里讲述一个ET的使用技巧,通过它,可以简单防止采集到这些文章。
在方案对应的中间规则中设置正文敏感词,例如:“您所在的用户组无法下载或查看附件”、“需要回复才可以浏览”,每个敏感词字符串为一行,多个敏感词字符串请换行分隔;
当我们采集文章时,遇到含有设置的敏感词的文章,将会被放弃采集,我们的网站就不会出现这些无用的文章了。
不少论坛的帖子都设置了回复可见、或积分、权限等限制,这类帖子对于采集文章的用户来说,都是不需要的。
这里讲述一个ET的使用技巧,通过它,可以简单防止采集到这些文章。
在方案对应的中间规则中设置正文敏感词,例如:“您所在的用户组无法下载或查看附件”、“需要回复才可以浏览”,每个敏感词字符串为一行,多个敏感词字符串请换行分隔;
当我们采集文章时,遇到含有设置的敏感词的文章,将会被放弃采集,我们的网站就不会出现这些无用的文章了。