pycharm下打開、執行並調試scrapy爬蟲程序
阿新 • • 發佈:2018-06-17
AS ber bsp char ID CI num conf split
Paste_Image.png
-
首先得有一個Scrapy項目,我在Desktop上新建一個Scrapy的項目叫test,在Desktop目錄打開命令行,鍵入命令:
scrapy startproject test1
目錄結構如下:
-
打開Pycharm,選擇open
-
選擇項目,ok
-
打開如下界面之後,按alt + 1, 打開project 面板
-
在test1/spiders/,文件夾下,新建一個爬蟲spider.py, 註意代碼中的
name="dmoz"
。這個名字後面會用到。 -
在test1目錄和scrapy.cfg同級目錄下面,新建一個begin.py文件(便於理解可以寫成main.py),註意箭頭2所指的名字和第5步中的
name=‘dmoz‘
from scrapy import cmdline
cmdline.execute("scrapy crawl dmoz".split())
- 1
- 2
- 3
- 1
- 2
- 3
7. 上面把文件搞定了,下面要配置一下pycharm了。點擊Run->Edit Configurations
8. 新建一個運行的python模塊
9. Name:改成spider; script:選擇剛才新建的那個begin.py文件;Working Direciton:改成自己的工作目錄
10. 至此,大功告成了,點擊下圖,右上角的按鈕就能運行了。
調試
可以在其他代碼中設置斷點,就可以debug運行
Paste_Image.png
轉載1:http://www.jianshu.com/p/f85120fcbca0
轉載2:http://blog.csdn.net/wangsidadehao/article/details/52911746
pycharm下打開、執行並調試scrapy爬蟲程序