PHP中使用CURL获取页面title例子

Nyako ·

更新时间:2024-11-10

· 673 次阅读

通过PHP获取页面title内容的实战演示：

范例代码：

代码如下:
<?php
/*
功能：取得 URL 页面上的 <title> 内容

参数：$_POST['url']
*/

// 设置最长执行的秒数
ini_set ("expect.timeout", 30);
set_time_limit(30);

// 检查 URL
if(!isset($_POST['url']) || $_POST['url'] == ''){
   echo "URL 错误";
   exit;
}


/* 取得 URL 页面数据 */
// 初始化 CURL
$ch = curl_init();

// 设置 URL
curl_setopt($ch, CURLOPT_URL, $_POST['url']);
// 让 curl_exec() 获取的信息以数据流的形式返回，而不是直接输出。
curl_setopt ($ch, CURLOPT_RETURNTRANSFER, 1);
// 在发起连接前等待的时间，如果设置为0，则不等待
curl_setopt ($ch, CURLOPT_CONNECTTIMEOUT, 0);
// 设置 CURL 最长执行的秒数
curl_setopt ($ch, CURLOPT_TIMEOUT, 30);

// 尝试取得文件内容
$store = curl_exec ($ch);


// 检查文件是否正确取得
if (curl_errno($ch)){
   echo "无法取得 URL 数据";
   //echo curl_error($ch);/*显示错误信息*/
   exit;
}

// 关闭 CURL
curl_close($ch);


// 解析 HTML 的 <head> 区段
preg_match("/<head.*>(.*)<\/head>/smUi",$store, $htmlHeaders);
if(!count($htmlHeaders)){
   echo "无法解析数据中的 <head> 区段";
   exit;
}

// 取得 <head> 中 meta 设置的编码格式
if(preg_match("/<meta[^>]*http-equiv[^>]*charset=(.*)(\"|')/Ui",$htmlHeaders[1], $results)){
   $charset = $results[1];
}else{
   $charset = "None";
}

// 取得 <title> 中的文字
if(preg_match("/<title>(.*)<\/title>/Ui",$htmlHeaders[1], $htmlTitles)){
   if(!count($htmlTitles)){
       echo "无法解析 <title> 的内容";
       exit;
   }

   // 将 <title> 的文字编码格式转成 UTF-8
   if($charset == "None"){
       $title=$htmlTitles[1];
   }else{
       $title=iconv($charset, "UTF-8", $htmlTitles[1]);
   }
   echo $title;
}