亚洲国产精品成人无码区,公天天吃我奶躁我的比视频,亚洲国产欧美视频亚洲国产精品一区二区成人片不卡,天天躁日日躁狠狠躁视频2021,起视碰看97视频在线少妇久久久久久人妻无码, 芒果乱码一线二线三线新区 ,亚洲熟妇无码AⅤ不卡在线播放,人妻少妇乱子伦无码专区

400-800-9385
網(wǎng)站建設資訊詳細

用一個示例簡單講一下網(wǎng)站采集的的過程

發(fā)表日期:2020-03-19 09:24:32   作者來源:信   瀏覽:2806   標簽:    
隨著時代的發(fā)展,社會越來越信息快速化,所以信息更新非常的迅速,這讓很多站長在更新自家的網(wǎng)站信息時,顯得太浪費時間,該怎么辦呢?那就是通過采集將別家的信息錄入到自家網(wǎng)站的數(shù)據(jù)庫中,這樣做可能對網(wǎng)站的優(yōu)化會有一定的影響,但這不是我們今天討論的話題,今天就用一個示例簡單講一下網(wǎng)站采集的的過程
我們先來看下面的一個實例,這是客戶的網(wǎng)站要求采集太平洋網(wǎng)站的新聞,代碼如下圖所示(附說明):
<?php
header("content-type:text/html;charset=utf-8");//
 

采集網(wǎng)址

 
$ch = curl_init();
curl_setopt($ch, CURLOPT_URL, $url);//將為一個CURL會話設置選項。CURLOPT_URL參數(shù)是你想要的設置, 這是你想用PHP取回的URL地址,$url是這個選項給定的值
curl_setopt($ch, CURLOPT_SSL_VERIFYPEER, 0);//如果有證書的https的,除去https里面的s,此句非常重要,不可刪除,否則帶有https的站點將無法打開
curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1);//所獲的內(nèi)容不輸出
$data=curl_exec($ch);//將頁面的內(nèi)容賦于$data,即$data就是我們打開網(wǎng)頁后的內(nèi)容代碼
$data=iconv('gbk', 'utf-8',$data);//防止中文的亂碼,做轉(zhuǎn)碼處理
curl_close($ch);//關閉cURL 會話
咱們先打開太平洋新聞網(wǎng),然后查看網(wǎng)頁源代碼,找到要采集的信息內(nèi)容,截圖下圖:
 

網(wǎng)頁截圖

根據(jù)上面的代碼,我們可以寫一個正則表達:
$path = '#<i class="lpic"><a href="(.*?)" target="_blank"><img width="200" height="150" src="//www1.pconline.com.cn/images/blank.gif" (.*?)="(.*?)" alt=""> </a>
</i>
<dl><dt><a href="(.*?)" target="_blank">(.*?)</a></dt><dd><span class="des">(.*?)</span><p class="info"><span class="channel"><a href="(.*?)" target="_blank">(.*?)  </a></span><span class="date">|  (.*?)</span></p></dd></dl>#is';           preg_match_all($path,$data,$arr);//正則匹配,其中$path是匹配的規(guī)則,$data是想要匹配的內(nèi)容,$datapath給定正則表達式 的匹配結(jié)果并且將它們以flag指定順序輸出到$arr中.
$array = array();//初始化一個數(shù)組
foreach($arr as $k=>$v){
if($k==3||$k==4||$k==5||$k==6||$k==9){ //想要的參數(shù)有哪些
 $array[$k] = $v;}}
if(!empty($array)){ 
$array = array_values($array);//重置數(shù)組key,讓數(shù)組的key從0開始計算,也可以不重置,但不要弄錯
}
/*
其中
$array[0] 是信息的圖片絕對地址的數(shù)組
$array[1] 是信息鏈接地址的數(shù)組
$array[2] 是信息標題的數(shù)組
$array[3] 是信息列表簡介的數(shù)組
$array[4] 是信息時間的數(shù)組
    Print_r($array);根據(jù)輸入的數(shù)組信息就知道如何把數(shù)據(jù)添加到數(shù)據(jù)庫了,然后根據(jù)url再采集信息里面的詳細內(nèi)容,以達到采集整條信息的完整性
*/
 
如沒特殊注明,文章均為方維網(wǎng)絡原創(chuàng),轉(zhuǎn)載請注明來自http://www.oulysa.com/news/5574.html
相關網(wǎng)站設計案例
人妻高清无码中文字幕在线a | 亚洲AV永久青草无码精品| 性做久久久久久久久男女| 一级国产精品一级国产精品片| 国产亚洲欧美日韩在线一区| 国产成人自拍视频国产一区第24页| 97久久精品无码一区二区| 亚洲日韩欧美在线视频| 亚洲AV无码电影在线播放| 色综合久久久久综合体桃花网| 国产高清国内精品福利| 国产jizz中国jizz免费看| 日韩欧美精品一区二区三区视频在线观看| 四虎成人精品在永久免费| 放荡大屁股少妇高潮喷水| 中文乱码人妻系列一区二区| 少妇高潮太爽了在线视频| 亚洲人成欧美中文字幕| 自拍偷自拍亚洲精品偷一| 国产亚洲精品a在线无码2021| 國產成人一區二區三區視頻免費| 又大又粗欧美黑人AAAAA片| 中日韩欧美风情视频| 欧美精品v在线视频17kan| 中文字幕人妻第一区| 国产精品v欧美精品v日韩苍井空| 无码午夜人妻一区二区三区不卡视频| 亚洲国产精品高清在线观看| 日韩欧美一区二区精品久久| 亚洲Aⅴ不卡无码国产| 国产精品1000夫妇激情啪发布| Xx性欧美肥妇精品久久久久久| 国产丰满精品少妇| 97久久久超国产精品| 欧美日本一区二区欧美专区一区| 日本国产精品女同一区二区在线| 一级做a爰片久久毛片a片蜜桃| 在线看国产三级在线| 精品福利视频观看| 欧美日韩午夜福利一二三四区| 午夜精品久久久久成人|