重庆分公司,新征程启航
为企业提供网站建设、域名注册、服务器等服务
你已经遍历出了第一个热门的,那么肯定是这样写的代码:
创新互联建站是一家专业从事成都网站设计、网站建设的网络公司。作为专业网站设计公司,创新互联建站依托的技术实力、以及多年的网站运营经验,为您提供专业的成都网站建设、成都全网营销及网站设计开发服务!
public function index()
{
$this-display();
}
那你可以再写一个方法作为另一个页面的后端数据控制啰,比如你已经写了热门,那继续写图片:
public function hot()
{
$this-display();
}
然后在里面写图片页面的一些数据显示逻辑,基本上和index()差不多的写法。
大致上的爬行过程如下:
先把原站的首页所有链接爬一遍,可通过正则表达式提取页面HTML源码里的链接,要保证可用的话需要提取的链接应包含:超级链接(a 标签)、Link标签链接、script的src属性的链接、图片地址等,属于资源类的链接(如link标签的链接、img的src),应将资源转存下来,链接提取后保存在一个数组或者数据库里。
按照链接库爬内页和资源,提取内页的链接,保存内页用到的资源,与爬首页时的链接库对比,把相同的剔除掉,避免重复爬。在把剩下的链接追加保存到链接库。
重复爬行,直到链接库里的链接全部爬完。
?php $str = file_get_contents('a.html'); $str_len = strlen($str); for($i=0; $i=$str_len; $i+=50){ $sub_str = substr($str,$i,50); echo $sub_str."\nbr"; } ?