1、cURL请求的基本步骤:
(1)初始化
(2)设置选项,包括URL
(3)执行并获取HTML文档内容
(4)释放cURL句柄
<?php //1、初始化 $ch = curl_init();//2、设置选项,包括URL curl_setopt($ch, CURLOPT_URL, "http://www.cnblogs.com/it-cen/");
//将curl_exec()获取的信息以文件流的形式返回,而不是直接输出 curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1);
//启动时会将头文件的信息作为数据流输出 curl_setopt($ch, CURLOPT_HEADER, 1);
//3、执行并获取HTML文档内容 curl_exec($ch);
//4、释放句柄 curl_close($ch);
echo $ch;
?>
注意:第二步最重要,也就是curl_setopt()函数
我们可以加一段检查错误的语句,这里要注意用的是"===false",这是为了区分空输出和布尔值false
$output = curl_exec($ch); if ($output === false) { echo "cURL Error:".curl_error($ch); }
curl_getinfo()函数返回cURL执行后这一请求相关的信息,这对调试和排错很有用:
curl_exec($ch); $info = curl_getinfo($ch); echo '<pre>'; print_r($info); echo '</pre>';
返回的数据
Array ( [url] => http://www.cnblogs.com/it-cen/ [content_type] => text/html; charset=utf-8 [http_code] => 200 [header_size] => 312 [request_size] => 61 [filetime] => -1 [ssl_verify_result] => 0 [redirect_count] => 0 [total_time] => 0.172 [namelookup_time] => 0.016 [connect_time] => 0.063 [pretransfer_time] => 0.063 [size_upload] => 0 [size_download] => 14658 <span style="color: #ff0000;"> //请求的数据大小</span> [speed_download] => 85220 [speed_upload] => 0 [download_content_length] => 14658 [upload_content_length] => 0 [starttransfer_time] => 0.125 [redirect_time] => 0 [certinfo] => Array ( ) [redirect_url] => )
2、这些信息在调试很有用,例如在cURL抓取的时候,可能由于网络等原因,时常出现抓取数据不完整的情况,这是我们可以通过所获取的数据计算filesize,然后和curl_getinfo()获取的进行比较,如果大小相等,就认定下载正确,否则进行重复尝试。
下面我们看一个抓取图片的例子:
<?php header("Content-Type: image/png");//1、初始化 $ch = curl_init();
//2、设置选项,包括URL curl_setopt($ch, , CURLOPT_URL, "http://img04.taobaocdn.com/tfscom/TB1omaTHXXXXXajXVXXtKXbFXXX.png"); curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1); curl_setopt($ch, CURLOPT_HEADER, 1);
//3、执行并获取内容 $res = curl_exec($ch);
//获取信息 $info = curl_getinfo($ch);
//4、释放资源 curl_close($ch);
file_put_contents("d:/aa.png", $res);
$size = filesize("d:/aa.png");
if ($size != $info['size_download']) { echo "下载的数据不完整,请重新下载"; } else { echo "下载数据完整"; }
?>
3、在cURL中用POST方法发送数据
<?php $ch = curl_init();$data = array('name'=>'kelly', 'age'=>27, 'sex'=>1);
curl_setopt($ch, CURLOPT_URL, "http://localhost.post.php"); curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1);
//设置为post curl_setopt($ch, CURLOPT_POST, 1); //把post的变量加上 curl_setopt($ch, CURLOPT_POSTFIELDS,$data);
$res = curl_exec($ch);
curl_close($ch);
echo $res;
?>
用此方法可以模拟留言,或者可以坐灌水机器人,思路都是一样的
4、用cURL上传文件
<?php //索要上传的数据 $data = array('name'=>'beauty', "upload"=>"@a.zip");$ch = curl_init();
curl_setopt($ch, CURLOPT_URL, "http://127.0.0.1/Socket/upload_file.php"); curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1);
curl_setopt($ch, CURLOPT_POST, 1); curl_setopt($ch, CURLOPT_POSTFIELDS, $data);
$res = curl_exec($ch);
curl_close($ch);
echo $res;
?>
注意:要发送文件时,要在文件名前面加上 @ 前缀并使用完整路径
5、cURL设置项
其实,cURL有许多配置选项,这些选项才是cURL的灵魂,通过setopt()设置,下面总结几个比较常见且重要的配置项,希望在对读者在以后用到cURL时有一定的帮助:
CURLOPT_AUTOREFERER:当根据location:重定向时,自动设置header中的Referer:信息
CURLOPT_COOKIESESSION:启用时cURL会紧紧传递一个sessioncookie,忽略其他cookie
CURLOPT_HEADER:将头文件的信息作为数据流输出
CURLOPT_INFILESIZE:设置上传文件的大小,单位为字节
CURLOPT_MAXCONNECTS:允许最大连接数量
CURLOPT_MAXREDIRS:指定HTTP重定向的最多数量
CURLOPT_COOKIE:设置HTTP请求中“cookie:”部分的内容,多个cookie用分号跟个,分号后带一个空格
CURLOPT_POSTFIELDS:全部数据用HTTP协议中的“POST”操作发送要发送文件,在文件名前面加上@前缀并使用完整路径
.......
具体更多配置项请参考PHP手册
cURL功能很强大,它是一个通用的库,并非PHP独有。
希望读者通过本博文的几个经典cURL例子的学习能有所收获。