帝国cms分页采集正则及过滤技巧
老实说我并不主张网站采集,不过做为站长,网页采集实在是一大利器。拿帝国CMS来说,采集功能很强大。虽然帝国CMS采集方法简单易学,但还是有朋友为采集规则而绞尽脑汁。以下是我悼念的一些帝国CMS的采集正则。 从文章的源代码中获得的 第一种: <p align='center'><b><font color='red'>[1]</font> <a href='/Eat/RMenu/200806/38611_2.html'>[2]</a> <a href='/Eat/RMenu/200806/38611_3.html'>[3]</a> <a href='/Eat/RMenu/200806/38611_4.html'>[4]</a> <a href='/Eat/RMenu/200806/38611_2.html'>下一页</a> </b></p> 编写的规则: 选全部列出式
--------------------------------------------------------------------------------
采集代码
编写的规则: 选用上下导航式:
例如:http://www.3edu.net/lw/3/lw_31205.html
--------------------------------------------------------------------------------
<p align="center"><img src="/bgy/Images_1/sy8.gif" border="0" align="absbottom"> <FONT style="COLOR: #ff0000">【1】</font> <a class=page href="094221656-2.html" target=_self>【2】</a> <a class=page href="094221656-3.html" target=_self>【3】</a> <a class=page href="094221656-4.html" target=_self>【4】</a> <a class=page href="094221656-5.html" target=_self>【5】</a> <a href="094221656-2.html"><img src="/gwy/Images1/xy.gif" border="0" align="absbottom"></a></p> 编写的规则: "全部列出"式正则设置: 分页区域正则(无)
--------------------------------------------------------------------------------
<DIV class=pageContainer> <DIV class=pager><span class="nextprev"><< 前一页</span><span class="current">1</span><a href="0731_3493_686224_1.shtml" title="转到第2页">2</a><a href="0731_3493_686224_2.shtml" title="转到第3页">3</a><a href="0731_3493_686224_1.shtml" class="nextprev" title="后一页">后一页 >></a></DIV></DIV></DIV>
区域正则: 链接正则: (编辑:威海站长网) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |