1. 程式人生 > >pycharm下打開、執行並調試scrapy爬蟲程序

pycharm下打開、執行並調試scrapy爬蟲程序

AS ber bsp char ID CI num conf split

  1. 首先得有一個Scrapy項目,我在Desktop上新建一個Scrapy的項目叫test,在Desktop目錄打開命令行,鍵入命令:scrapy startproject test1


    技術分享圖片

    目錄結構如下:

    技術分享圖片
    技術分享圖片
    技術分享圖片

  2. 打開Pycharm,選擇open


    技術分享圖片

  3. 選擇項目,ok

    技術分享圖片

  4. 打開如下界面之後,按alt + 1, 打開project 面板

    技術分享圖片
    技術分享圖片
  5. 在test1/spiders/,文件夾下,新建一個爬蟲spider.py, 註意代碼中的name="dmoz"。這個名字後面會用到。

    技術分享圖片

  6. 在test1目錄和scrapy.cfg同級目錄下面,新建一個begin.py文件(便於理解可以寫成main.py),註意箭頭2所指的名字和第5步中的name=‘dmoz‘

    名字是一樣的。

    from scrapy import cmdline

    cmdline.execute("scrapy crawl dmoz".split())
  • 1
  • 2
  • 3
  • 1
  • 2
  • 3

技術分享圖片


7. 上面把文件搞定了,下面要配置一下pycharm了。點擊Run->Edit Configurations

技術分享圖片


8. 新建一個運行的python模塊

技術分享圖片


9. Name:改成spider; script:選擇剛才新建的那個begin.py文件;Working Direciton:改成自己的工作目錄
技術分享圖片
10. 至此,大功告成了,點擊下圖,右上角的按鈕就能運行了。
技術分享圖片

調試

可以在其他代碼中設置斷點,就可以debug運行

技術分享圖片
Paste_Image.png 技術分享圖片

轉載1:http://www.jianshu.com/p/f85120fcbca0

轉載2:http://blog.csdn.net/wangsidadehao/article/details/52911746

pycharm下打開、執行並調試scrapy爬蟲程序