TShopping

 找回密碼
 註冊
搜索
查看: 2621|回復: 0

[教學] php抓取網頁特定div區塊及圖片

[複製鏈接]
發表於 2013-7-11 22:47:03 | 顯示全部樓層 |閱讀模式
 
Push to Facebook
昨天有個朋友在問我說,php怎麼抓取網頁某個div區塊的內容。像funp推推王那樣每次推文都會顯示文章內的圖片,提供縮圖撰擇,又是怎麼做到的?其實這語法出乎意料的簡短…
1. 取得指定網頁內的所有圖片:測試




  1. <?php  

  2. //取得指定位址的內容,並儲存至text  

  3. $text=file_get_contents('http://andy.diimii.com/');   



  4. //取得所有img標籤,並儲存至二維陣列match  

  5. preg_match_all('#<img[^>]*>#i', $text, $match);  



  6. //印出match  

  7. print_r($match);  

  8. ?>
複製代碼




2. 取得指定網頁內的第一張圖片:測試




  1. <?php  

  2. //取得指定位址的內容,並儲存至text  

  3. $text=file_get_contents('http://andy.diimii.com/');  



  4. //取得第一個img標籤,並儲存至陣列match(regex語法與上述同義)  

  5. preg_match('/<img[^>]*>/Ui', $text, $match);  



  6. //印出match  

  7. print_r($match);  

  8. ?>
複製代碼




3.取得指定網頁內的特定div區塊(藉由id判斷):測試





  1. <?php  

  2. //取得指定位址的內容,並儲存至text  

  3. $text=file_get_contents('http://andy.diimii.com/2009/01/seo%e5%8c%96%e7%9a%84%e9%97%9c%e9%8d%b5%e5%ad%97%e5%bb%a3%e5%91%8a%e9%80%a3%e7%b5%90/');   



  4. //去除換行及空白字元(序列化內容才需使用)  

  5. //$text=str_replace(array("\r","\n","\t","\s"), '', $text);     

  6.   

  7. //取出div標籤且id為PostContent的內容,並儲存至陣列match  

  8. preg_match('/<div[^>]*id="PostContent"[^>]*>(.*?) <\/div>/si',$text,$match);  

  9.   

  10. //印出match[0]  

  11. print($match[0]);  

  12. ?>
複製代碼

  


4. 上述2及3的結合:測試


  • <?php  

    //取得指定位址的內容,並儲存至text  

    $text=file_get_contents('http://andy.diimii.com/2009/01/seo%e5%8c%96%e7%9a%84%e9%97%9c%e9%8d%b5%e5%ad%97%e5%bb%a3%e5%91%8a%e9%80%a3%e7%b5%90/');      



    //取出div標籤且id為PostContent的內容,並儲存至陣列match  

    preg_match('/<div[^>]*id="PostContent"[^>]*>(.*?) <\/div>/si',$text,$match);     

      

    //取得第一個img標籤,並儲存至陣列match2  

    preg_match('/<img[^>]*>/Ui', $match[0], $match2);   



    //印出match2[0]  

    print_r($match2[0]);  

    ?>




後記:用正規表達式Regex來做真的很方便,但老實說我規則常會忘掉,記錄一下幾篇文章好了(Regular Expression Details| PCRE Functions | Introduction to PHP Regex | 天殺的正規表示式…

 

臉書網友討論
*滑块验证:
您需要登錄後才可以回帖 登錄 | 註冊 |

本版積分規則



Archiver|手機版|小黑屋|免責聲明|TShopping

GMT+8, 2024-4-19 10:26 , Processed in 0.081364 second(s), 23 queries .

本論壇言論純屬發表者個人意見,與 TShopping綜合論壇 立場無關 如有意見侵犯了您的權益 請寫信聯絡我們。

Powered by Discuz! X3.2

© 2001-2013 Comsenz Inc.

快速回復 返回頂部 返回列表