url网址采集器侠文章url是英文的怎么设置

查看: 6262|回复: 15
V9中支持采集侠吗?简单的配置我也不会用,谁来介绍一下
不给力的东西
采集侠怎么使用啊,可以详细说一下吗?例如:RSS地址是什么样的地址,目标监控地址又是什么样的地址,还有文章url规则,这些,还有目标页面编码选项,等等这些都怎么填
好像不支持最新版的V9啊
<font color="#am 发表于
好像不支持最新版的V9啊
那采集侠支持哪个版本啊?
菜鸟学飞 发表于
那采集侠支持哪个版本啊?
好像支持到9.0,9.1的还不支持哦
采集侠很强大&&啊
强大在哪?都点不开啊
不支持新版的
是不是真的啊这个9.13不是得不了?我设置好了就是不会采集啊
采集俺都还不怎么会用,你们真牛X!
现在用是可以用了,有一个问,采集来的文章,怎么老是想反的啊?这个PHPCMS怎么都没有更新过的啊版本老啊,织梦的下载来可不可以安装的啊?
设了自动怎么不会自动采集的
我的v9版本是9.2.3
为什么安装后不能使用 点击采集和添加规则都没有反应
支持一下这个必须要的!这个不错哦!这个正需要又是需要回复的,呵呵,开放下嘛,支持一下^^好支持我来学习一下禹城信息网
Powered by1招分销商&/p&
只要取一小部分不同的就行,内容规则则是:
1招分销商div&
“SEO关键字策略规划技巧心得分享”该篇文章没有分页,我就取“电子商务关键数字优化(线上部分,上)()”这篇文章给大家做演示。
通过查看源码,我们找到分页部分的那段代码,如下图:
分页规则的写法则和其他规则的写法也是一样的,将[内容]替换带有分页URL的地方就行,分页规则是:
1内容&#93;&/div&
写到这里,我想大家也懂得如何设置采集规则了,是不是很简单?插件提供测试功能,在让大家测试规则是否有效,如下图般设置好,然后点击测试按钮。
如果不需要采集作者和来源信息,那只需要设置标题、内容和分页规则即可。
将会看到测试结果如下图:
可以看出各项内容都可以精确采集了,但在上图中却没有显示分页链接,其实这个并不是规则编写错误的,而是测试的第一篇文章中没有分页,所以不显示分页链接,不过大家可以单独测试一下分页规则是有效,就是列表URL和文章URL不进行通配,直接填入列表URL和文章URL,然后设置好分页规则,点击测试即可看到分页链接,如下图:
如果不写采集规则,全部设置自动的话,标题和内容是可以采集到的,作者、来源、和分页未必可以很好的采集到,只有符合插件自动规则的才行。正文部分依靠插件的正文提取算法进行提取,如果网页排版方式不够规范的话,可能会提取到有多余,或者提取少了的现象,如果想精确采集,建议还是写上采集规则。
建议如果不想采集过旧的文章,可以不需要匹配列表URL,就采集第一页就行,商业版用户可以设置好定时自动采集的时间,该栏目如有新内容更新,就会在您设置的采集时间段内采集回来,也可以设置24小时监控采集,时刻和目标站点内容保持一致,我们的演示站点 ,也是监控采集的内容,无需人工打理,每天定时定量采集更新。
【案例】利用织梦采集侠三个月打造多关键词排名首页,文章内容均是采集而来
【案例】利用织梦采集侠建站群为主站带来高质量流量
利用织梦采集侠的RSS采集功能,采集最新指定关键词新闻
感谢支持,你的支持,我们的无限动力!!!
“DEDECMS教程”欢迎分享!:
相关标签:
欢迎您报错,或提出宝贵建议,我们将第一时间处理,为大家营造一个良好网上交流平台,感谢支持织梦之家!
在百度中搜索相关文章:
在谷歌中搜索相关文章:昨天飒飒在使用织梦(Dedecms)采集侠时,在定向采集文章URL设置过程中遇到了不少问题,虽然有官方演示做参照,但是亦不觉得全面,导致经常会采集失败。下面飒飒来给大家例举一些官方文档没有详细明说的定向采集文章URL设置。官方文档给出的列表URL设置方法如下:例:比如我要采集站长之家优化栏目里面的文章,他们的文章URL是/web/5508.shtml/web/5505.shtml/web/5594.shtml通配后的URL就是:/web/(*)/(*)/(*).shtml但是大多数时候我们会设置成:/web/5(*).shtml或/web//(*).shtml或/web/2013/(*)/(*).shtml或/web/(*)/0988/(*).shtml虽然以上的通配URL也能实现采集,但是不是完整的通配。小技巧:以后在设置列表URL时,遇见数字的全部采用通配符,准没错!以下来说说官方文档未列出但又常见的URL:例1:/cs//.html/cs//.html/cs//.html这样的文章链接该如何写通配URL呢?想必有不少小伙伴会如下写:/cs/(*)/(*).html但是采集测试时,会告诉你采集失败,说明通配URL错误,那该如何设置呢?正确设置方法:/cs/(*)-(*)-(*)/(*).html例2:/?p=5122/?p=5123这是动态页面,没有生成伪静态或静态URL,也同样可以使用通配规则吗?飒飒在此将结果告诉你:可以使用通配规则正确设置方法:/?p=(*)TIPS:当然,必须补充一点,不是所有文章URL设置正确之后就可以采集,采集器都是有限制的,比如那个网站设置了防采集功能,无论你在采集设置上面做多少努力,都是徒劳,所以,在设置采集时,先测试,很重要!一些大站或者牛逼的网站一般都有防采集设置!总结1.当设置文章通配URL时,如遇到非数字的,一律不能用通配符(*),必须保留,方可正确采集。URL中常见的非数据有英文字母,-,_,?等。2.URL通配规则一定要写全,写完后注意检查通配URL中是否含有数字,如含有,则通配URL为完成,将数字修改成通配符之后再保存采集,在将来对方网站修改URL命名时,方能以不变应万变。屏蔽你采集IP除外。以上就是飒飒整理的织梦(Dedecms)采集侠定向采集文章URL设置大全,希望小伙伴和飒飒一起完善采集设置,让那么困难采集不再难!
各排名数据更新进度:}

我要回帖

更多关于 图片url采集 的文章

更多推荐

版权声明:文章内容来源于网络,版权归原作者所有,如有侵权请点击这里与我们联系,我们将及时删除。

点击添加站长微信