重庆分公司,新征程启航
为企业提供网站建设、域名注册、服务器等服务
可以用以下4个方法来抓取网站 的数据:
创新互联公司是一家专注于网站制作、网站设计与策划设计,湘潭县网站建设哪家好?创新互联公司做网站,专注于网站建设十多年,网设计领域的专业建站公司;建站业务涵盖:湘潭县等地区。湘潭县做网站价格咨询:13518219792
1. 用 file_get_contents 以 get 方式获取内容:
?
$url = '';
$html = file_get_contents($url);
echo $html;
2. 用fopen打开url,以get方式获取内容
?
$url = '';
$fp = fopen($url, 'r');
stream_get_meta_data($fp);
$result = '';
while(!feof($fp))
{
$result .= fgets($fp, 1024);
}
echo "url body: $result";
fclose($fp);
3. 用file_get_contents函数,以post方式获取url
?
$data = array(
'foo'='bar',
'baz'='boom',
'site'='',
'name'='nowa magic');
$data = http_build_query($data);
//$postdata = http_build_query($data);
$options = array(
'http' = array(
'method' = 'POST',
'header' = 'Content-type:application/x-www-form-urlencoded',
'content' = $data
//'timeout' = 60 * 60 // 超时时间(单位:s)
)
);
$url = "";
$context = stream_context_create($options);
$result = file_get_contents($url, false, $context);
echo $result;
4、使用curl库,使用curl库之前,可能需要查看一下php.ini是否已经打开了curl扩展
$url = '';
$ch = curl_init();
$timeout = 5;
curl_setopt ($ch, CURLOPT_URL, $url);
curl_setopt ($ch, CURLOPT_RETURNTRANSFER, 1);
curl_setopt ($ch, CURLOPT_CONNECTTIMEOUT, $timeout);
$file_contents = curl_exec($ch);
curl_close($ch);
echo $file_contents;
1:curl获得对方数据
2:正则匹配出自己需要的内容
3:将结果写入自己的mysql
//初始化
$ch = curl_init();
//设置选项,包括URL
curl_setopt($ch, CURLOPT_URL, "");
curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1);
curl_setopt($ch, CURLOPT_HEADER, 0);
//执行并获取HTML文档内容
$output = curl_exec($ch);
//释放curl句柄
curl_close($ch);
//打印获得的数据
print_r($output);
备注,获得的数据是整个页面的,用正则过滤筛选出你需要的信息即可。
百度搜下,有很多实例,普通的采集、匹配都很简单的。
至于视频教程的话,php100上面应该有的。但这个没必要看教程,多琢磨,测试就可以了。
看你是什么视频,
如果是一些视频网站像优酷土豆之类的,把鼠标放到正在播放的视频上,就会在右边滑出分享菜单,根据你的需求复制相应格式的视频地址代码就行。
如果是一些小网站上自己上传在主机空间的小视频,你可以用IE打开,在确定你的电脑中装了迅雷的情况下,把鼠标放到视频上,就会有迅雷的下载提示,点击下载,然后在确认对话框中,你会看到一个视频的地址,复制它就可以。
另外一个办法就是在页面空白的地址点击右键,查看页面源代码,然后在代码中找到embed这一对标签,然后这对标签里的src="",在src后面的一对引号是的地址就是视频地址,你可以复制到浏览器来打开试试。
比如这个文件我们存为 test.php,那么我们只需要运行 test.php?优酷视频的url 就可以解析出FLASH地址了。