1. 程式人生 > >PHP抓取頁面內容

PHP抓取頁面內容

什麼叫抓取?

        通過PHP程式碼來實現,把其它網頁的內容抓取到本地,抓取的時候需要聯網才可以

1.通過file_get_contents()函式實現抓取。

        前提:在php.ini中設定允許開啟一個網路的url地址。

                

        程式碼如下:

<?php

            echo file_get_contents('http://www.baidu.com');
?>

有的網站抓取過來是亂碼狀態如下:

��S�OA��W�{�eiiY�P��=h�'��N� ������|�-c Q�(��wf�'�߲P�AM<�μ�o��1o/\�~��ÂA-s�g0�`ƪ!%��C��.T�$��0U[�p^���O8����4/&ը[���N-|���]�z9�
<aq��[email protected]�[o�h+lw����#��u�`�k��u��k�g?�mn��|���p�1��-�l��&[zc0xseۏ�[5���^<a��m�� �@�="" �5���8�="" �ep�="" wb="" �r="" ����[n��r���w��c�q��è���ev����o})ov��a�cؘk��%6���<�Ͱ�[��o��nx����q�z�z���d�zb="" �1bk!z���t�="" [email protected]"="" 2�i��:�am.�kl~��'����|����7�d�3h����yp��="" n|�����nn$�e80|��="" ad�s="�ضT�'K��#��?��J�+8����~�����܀6�甑�\����l_&��(�" style="color: rgb(0, 0, 0); font-family: "Microsoft YaHei"; font-size: medium; text-align: start;">��ᚡz>��*҂t��Ԡԕ�"ϋ��[��ˎ�����������>��fx4j�lҸ�u�a�ܖ <2F�8�c��<�:=_Htj�u���K�֫�29M��RG�/�D�}�(J�3����>�@��O��trnl��o{�H�������%�5#�$����bV)e�����J�k��l�o�tII����#�T*S�q�� ���XK��D>o~E�/q`�5�Ɍ'P$F�qؑ8D#Ա۱g���v��a/BBB�ರ���8p�_�;��/���+�d���w���WWW���V����v�sW��:�2t�Β��\��h�i�Բ{�u�Sd��x�1�,{P�~���넼����/.~�����/�~v��I��3&cGӆ�M�� H�[���-;�����j�q}��e��i�mV�ݠ~ʕ~ �

解決方案如下:

<?php
    $url="http://www.sohu.com/";
    echo file_get_contents("compress.zlib://".$url);
?>