PHP中使用file_get_contents抓取網頁中文亂碼問題解決方法，GZIP

阿新 • • 發佈：2019-01-16

這篇文章主要介紹了PHP中使用file_get_contents抓取網頁中文亂碼問題解決方法,可以通過使用curl配置gzip選項來解決,具有一定的參考借鑑價值,需要的朋友可以參考下

本文例項講述了PHP中使用file_get_contents抓取網頁中文亂碼問題解決方法。分享給大家供大家參考。具體方法如下：

file_get_contents函式本來就是一個非常優秀的php自帶本地與遠端檔案操作函式,它可以讓我們不花吹揮之力把遠端資料直接下載,但我在使用它讀取網頁時會碰到有些頁面是亂碼了,這裡就來給各位總結具體的解決辦法.

根據網上有朋友介紹說原因可能是伺服器開了GZIP壓縮,下面是用firebug檢視我的網站的頭資訊,Gzip是開了的,請求頭資訊原始頭資訊,程式碼如下:

複製程式碼程式碼如下:Accept text/html,application/xhtml+xml,application/xml;q=0.9,*/*;q=0.8
Accept-Encoding gzip, deflate
Accept-Language zh-cn,zh;q=0.8,en-us;q=0.5,en;q=0.3
Connection keep-alive
Cookie __utma=225240837.787252530.1317310581.1335406161.1335411401.1537; __utmz=225240837.1326850415.887.3.utmcsr=google|utmccn=(organic)|utmcmd=organic|utmctr=%E4%BB%BB%E4%BD%95%E9%A1%B9%E7%9B%AE%E9%83%BD%E4%B8%8D%E4%BC%9A%E9%82%A3%E4%B9%88%E7%AE%80%E5%8D%95%20site%3Awww.nowamagic.net; PHPSESSID=888mj4425p8s0m7s0frre3ovc7; __utmc=225240837; __utmb=225240837.1.10.1335411401
Host www.jb51.net
User-Agent Mozilla/5.0 (Windows NT 5.1; rv:12.0) Gecko/20100101 Firefox/12.0
可以從header資訊中找到 Content-Encoding 項是 Gzip.

解決辦法比較簡單,就是用 curl 代替 file_get_contents 去獲取,然後在 curl 配置引數中加一條,程式碼如下:

複製程式碼程式碼如下:curl_setopt($ch, CURLOPT_ENCODING, "gzip");

今天用 file_get_contents 抓圖片的時候,開始沒發現這個問題,廢了老大勁才找出來.

使用自帶的zlib庫,如果伺服器已經裝了zlib庫,用下面的程式碼可以輕易解決亂碼問題,程式碼如下:

複製程式碼程式碼如下:$data = file_get_contents("compress.zlib://".$url);

希望本文所述對大家的PHP程式設計有所幫助。

PHP中使用file_get_contents抓取網頁中文亂碼問題解決方法，GZIP

PHP中使用file_get_contents抓取網頁中文亂碼問題解決方法，GZIP

Tomcat中日誌（控制檯）中文亂碼解決方法

用file_get_contents抓取網頁亂碼的2種解決方式

Python 抓取網頁gb2312亂碼問題

PHP使用CURL抓取網頁

使用HttpWebRequest和HtmlAgilityPack抓取網頁(無亂碼)

(PHP)用cURL抓取網頁資訊並替換部分內容

python爬取網頁中文亂碼。解決方案。python3

php使用curl抓取網頁顯示空白的問題.

python&php數據抓取、爬蟲分析與中介，有網址案例

Java Web 中 Servlet 中文亂碼解決方法

xshell中出現中文亂碼解決方法

php var_dump 列印不全，且中文亂碼解決方法

idea軟體編碼已經設定好了為utf-8，但是svn中down下來的檔案格式本身不是utf-8的，此時開啟後會出現中文亂碼解決方法

javaweb中中文亂碼解決方法總結之response和request解決方法

jsp中Get提交方式的中文亂碼解決辦法

抓包工具 Charles Response Contents中文亂碼解決方法（新）

Python中requests.get響應內容中文亂碼解決方案

html中 Charset=UTF-8還是中文亂碼解決辦法

Python抓取網頁&批量下載檔案方法初探（正則表示式+BeautifulSoup）

PHP中使用file_get_contents抓取網頁中文亂碼問題解決方法，GZIP

相關推薦