文章采集发布

# 文章采集发布 文章采集发布分为采集规则管理,手动采集发布,自动采集发布三个部分。 ## 采集规则管理 点击【创建规则管理】,可创建新的采集规则。 ![image.png](https://cos.easydoc.net/70013111/files/kchdbcg0.png) ### 基础设置 首先需要选择一下域名,再填入规则名称,选择一下网站编码,再选择一下是否排查网址,是否图片采集,是否强制去空格,最后再选择一下规则类型。 ![image.png](https://cos.easydoc.net/70013111/files/kchdj501.png) ### 起始页设置 可以手动输入网址进行添加,也可以点击【批量添加】,按照网址格式正确输入网址,再点击【提交】。 ![image.png](https://cos.easydoc.net/70013111/files/kchdspul.png) ### 采集与数据处理 填入第一项列表范围提取:列表区域的起始标签和结束标签;规则排除的起始标签和结束标签。 填入第二项详情规则提取:标题规则的起始标签和结束标签;时间规则的起始标签和结束标签;内容规则的起始标签和结束标签。 填入数据预处理的保留标签。 保留img则采集时会保留对方图片,如果去掉img则不保留图片 all全部标签 a超链接 img图片 div层 p段落 br换行 form表单 iframe框架 object对象 script脚本 style样式 link外部样式 再填入需要替换的内容,选择一下标题替换或者内容替换。点击【测试】以后再点击【保存】。 ![image.png](https://cos.easydoc.net/70013111/files/kchdz4bk.png) ## 手动采集发布 ### 采集管理 会显示任务名称,开始时间,结束时间,失败条数,成功条数,任务状态以及操作栏。 ![image.png](https://cos.easydoc.net/70013111/files/kchedgkc.png) 点击【创建任务】,会弹出画框,我们需要填入任务名称,选择一下规则类型,再点击【保存】。 ![image.png](https://cos.easydoc.net/70013111/files/kcheiumt.png) ### 数据管理 会显示采集数据所属任务,文章标题,发布时间,采集时间,智能原创,图片处理,状态栏和操作栏。 同时可以选择一个,多个或者全选进行发布,删除,一键智能原创 (收费),一键同义词替换(免费),一键处理图片,一键替换关键词的相关操作。 ![image.png](https://cos.easydoc.net/70013111/files/kchekf0n.png) ### 任务管理 会显示任务名称,发布时间,域名,创建时间,待发条数,已发条数,总发条数,发布条数,推送条数等。 ![image.png](https://cos.easydoc.net/70013111/files/kchffb39.png) ## 自动采集发布 自动采集发布会显示任务名称,发布域名,每天执行条数,当日任务条数,当日采集条数,当日发布条数,自动采集条数和操作栏。点击【创建】可创建新的自动采集规则。 ![image.png](https://cos.easydoc.net/70013111/files/kchfsokz.png) ### 采集设置 输入任务名称,选择采集规则,每日采集时间,每日采集条数,然后点击【下一步】。 ![image.png](https://cos.easydoc.net/70013111/files/kchfxj8x.png) ### 数据处理 选择是否智能原创,是否图片处理,在内容替换处输入需要替换的内容,然后再点击【下一步】。 ![image.png](https://cos.easydoc.net/70013111/files/kchg0kue.png) 点击【选择图片】,会弹出选择图片的画框,点击【获取图片】,会弹出选择域名的画框,我们进行域名的选择以后,点击【下一步】,即可在相应的文件夹里获取我们需要的图片。 ![image.png](https://cos.easydoc.net/70013111/files/kchg5sit) ### 发布设置 我们需要选择一下域名,发布栏目,发布时间,填入间隔时间,选择一下是否推荐,最后再点击【保存】。 ![image.png](https://cos.easydoc.net/70013111/files/kchg9cav.png)