重庆分公司,新征程启航
为企业提供网站建设、域名注册、服务器等服务
1、首先建立一个abstract文件名php为后缀的文件。并在页面中加入php标记 。
创新互联公司2013年成立,是专业互联网技术服务公司,拥有项目成都网站建设、网站设计网站策划,项目实施与项目整合能力。我们以让每一个梦想脱颖而出为使命,1280元长白做网站,已为上家服务,为长白各地企业和个人服务,联系电话:18982081108
2、在页面中创建一个以abstract开头的类Ab。
3、在抽象类中创建一个抽象方法就是在创建方法的时候public前边加一个abstract但是方法不加方法体并在结尾加分号。
4、创建一个子类来集成抽象类Ab。
5、继承类创建好后实例化Sonab类并调用其中的方法就能调用成功了。
我只采集过天猫的数据,估计淘宝也不难吧,简单的思路就是下载html,正则链接,打开链接,爬数据,不过php是单线程的,速度慢。
创建一个新cURL资源
设置URL和相应的选项
抓取URL并把它传递给浏览器
关闭cURL资源,并且释放系统资源
代码案例:
// ==UserScript==
// @name JD
// @namespace
// @version 0.1
// @description try to take over the world!
// @author You
// @match *
// @grant none
// ==/UserScript==
/* jshint -W097 */
'use strict';
// Your code here...
var divObj=document.createElement("input");
divObj.type="button";
divObj.value='获取抓取内容';
divObj.style.marginTop="20px";
divObj.style.marginBottom="20px";
divObj.style.marginLeft="50px";
var first=document.body.firstChild;
document.body.insertBefore(divObj,first);
var result={};
divObj.onclick=function(){
//获取价格
if(document.getElementById("jd-price")){
var priceDiv=document.getElementById("jd-price");
var price = priceDiv.innerText;
price = price.substr(1);
}else if(document.getElementById("price")){
var pricePri=document.getElementById("price");
var priceDiv=pricePri.firstElementChild;
var price = priceDiv.innerText;
}else if(document.getElementsByClassName("price")[0]){
var priceClass=document.getElementsByClassName("price");
var priceDiv=priceClass[0];
var price = priceDiv.innerText;
}
result.price=price;
}
直接用Curl就行,具体爬取的数据可以穿参查看结果,方法不区分淘宝和天猫链接,但是前提是必须是PC端链接,另外正则写的不规范,所以可以自己重写正则来匹配数据。