亚洲国产精品成人无码区,公天天吃我奶躁我的比视频,亚洲国产欧美视频亚洲国产精品一区二区成人片不卡,天天躁日日躁狠狠躁视频2021,起视碰看97视频在线少妇久久久久久人妻无码, 芒果乱码一线二线三线新区 ,亚洲熟妇无码AⅤ不卡在线播放,人妻少妇乱子伦无码专区

400-800-9385
網(wǎng)站建設(shè)資訊詳細

php抓取第三方網(wǎng)站的小說內(nèi)容

發(fā)表日期:2023-02-01 20:20:18   作者來源:劉紅旺   瀏覽:987   標簽:php網(wǎng)站建設(shè)    
這里用到  QueryList這個第三方插件,安裝要求
php>=7.1
composer  安裝
 
composer require jaeger/querylist
 
 
或者直接下載
開箱即用:https://pan.baidu.com/s/1QPMUalL5HcVJ4L7zUY0LMg
require_once  app()->getRootPath()."extend/queryList/autoload.php";// 引入插件
$QueryList=new \QL\QueryList();
$url ='xxxxxxxxxxxxxxxxxxx';//需要獲取小說的鏈接
$rt = [];
//根據(jù)頁面獲取書籍信息
$rules = [
     'title' => ['.t>a','text'], // 獲取小說名稱
     'link' => ['.n>a','href'], // 獲取小說的鏈接
     'author' => ['.author>a','text'], //獲取小說的作者
     'status' => ['.abover>span','text'], //獲取小說的狀態(tài)
     ];
       
$range = '.ul_m_list li';  // 切片選擇器
         //encoding('UTF-8','GB2312') 轉(zhuǎn)碼
$rt = $QueryList->get($url)->rules($rules)->range($range)->removeHead()->encoding('UTF-8','GB2312')->query()->getData();
        dump($rt->all());exit;
 
根據(jù)網(wǎng)站的機構(gòu)去獲取書籍內(nèi)容,比如這個網(wǎng)站

網(wǎng)站

書名是在class   .t>a 下面的 ,鏈接是在class   .n>a 下面的
 
range :切片選擇工具    就是書籍循環(huán)的外包結(jié)構(gòu) 可以將書籍分割成一個一個的數(shù)組
remove:可以將內(nèi)容中的部分內(nèi)容過濾掉
$html =<<<STR
    <div id="content">
 
        <span class="tt">作者:xxx</span>
 
        這是正文內(nèi)容段落1.....
 
        <span>這是正文內(nèi)容段落2</span>
 
        <p>這是正文內(nèi)容段落3......</p>
 
        <span>這是廣告</span>
        <p>這是版權(quán)聲明!</p>
    </div>
STR;
 
$rules = [
    'content' => ['#content','html']
];
 
$rt = QueryList::rules($rules)
    ->html($html)
    ->query()
    ->getData(function($item){
        $ql = QueryList::html($item['content']);
        $ql->find('.tt,span:last,p:last')->remove();
        $item['content'] = $ql->find('')->html();
        return $item;
});
Array
(
    [0] => Array
        (
            [content] => 這是正文內(nèi)容段落1.....
 
        <span>這是正文內(nèi)容段落2</span>
 
        <p>這是正文內(nèi)容段落3......</p>
        )
 
)
 
 
 
print_r($rt->all());
 
$rt->find('.tt,span:last,p:last')->remove();
 
encoding:作用于內(nèi)容的轉(zhuǎn)碼,原來的網(wǎng)站'GB2312' 獲取的內(nèi)容會出現(xiàn)亂碼,需要將他轉(zhuǎn)換成‘utf-8‘。

網(wǎng)站2

$html =<<<STR
<div>
    <p>這是內(nèi)容</p>
</div>
STR;
$rule = [
    'content' => ['div>p:last','text']
];
$data = QueryList::html($html)->rules($rule)
                ->encoding('UTF-8','GB2312')->query()->getData();
 
設(shè)置輸入輸出編碼,并移除html頭部
如果設(shè)置輸入輸出參數(shù)仍然無法解決亂碼,那就使用 removeHead()方法移除html頭部
 
removeHead:過濾掉頭部
 
這樣我們就將這個頁面的書籍列表都獲取下來

數(shù)據(jù)

數(shù)據(jù)2

 
 
 
讓后通過循環(huán)去獲取分頁的數(shù)據(jù),根據(jù)書籍鏈接獲取書籍的章節(jié),封面等其他數(shù)據(jù),最后通過章節(jié)鏈接獲取到小說內(nèi)容。
                          
如沒特殊注明,文章均為方維網(wǎng)絡(luò)原創(chuàng),轉(zhuǎn)載請注明來自http://www.oulysa.com/news/6663.html
相關(guān)網(wǎng)站設(shè)計案例
AAA级精品无码久久久国产片| 日本高清va不卡视频在线观看| 国产精品自产拍在线观看| 两个领导斗把我夹在中间| 免费无遮挡无码永久视频网站| 久久人爽人人爽人人片AV| 精品人妻在线视频| 久久精品视频免费播放| 最新国内精品自在自线视频| 亚洲中文精品人人永久免费| 亚洲欧美激情精品一区二区| 亚洲国产精品第一区二区| 精品视频在线观看一区二区三区| 亚洲不卡国产黄页网址| 免费一级大片亚洲精品视频网| www内射国产在线观看| 国产精品人人爱一区二区白浆| 四虎国产精品永久一区高清| 大粗又爽又黄少妇毛片免费| 插插射啊爱视频日A级| 精品国产免费一区二区| 特级欧美A又黑又大| 欧美精品亚洲精品日韩专区va| 最近高清中文在线字幕观看| 欧美日韩在线视频,爆乳熟妇一区二区三区| 国产婷婷一区二区三区| 少妇人妻无码专区视频大码| 无码日韩精品一区二区免费暖暖| 综合久久午夜无码鲁丝片久久真人一级毛片| 开心五月天超碰激情网| 福利片在线播放| 白嫩极品在线播放| 国产性色福利在线视频| 日韩a∨无码中文无码电影| 亚洲欧美一区二区三区久本道| 婷婷蜜桃国产精品一区| 中文字幕亚洲欧美日韩在线不卡| 国产三级在线观看播放| 国产亚洲大尺度无码无码专线| 99久久精品日本一区二区免费| 中文字幕日韩欧美电影|