利用Python爬取房產資料！並在地圖上顯示！Python乃蒂花之秀！

阿新 • • 發佈：2018-12-30

JiwuspiderSpider.py

# -*- coding: utf-8 -*-
from scrapy import Spider,Request
import re
from jiwu.items import JiwuItem
class JiwuspiderSpider(Spider):
 name = "jiwuspider"
 allowed_domains = ["wlmq.jiwu.com"]
 start_urls = ['http://wlmq.jiwu.com/loupan']
 def parse(self, response):
 """
 解析每一頁房屋的list
 :param response: 
 :return: 
 """
 for url in response.xpath('//a[@class="index_scale"]/@href').extract():
 yield Request(url,self.parse_html) # 取list集合中的url 呼叫詳情解析方法
 # 如果下一頁屬性還存在，則把下一頁的url獲取出來
 nextpage = response.xpath('//a[@class="tg-rownum-next index-icon"]/@href').extract_first()
 #判斷是否為空
 if nextpage:
 yield Request(nextpage,self.parse) #回撥自己繼續解析
 def parse_html(self,response):
 """
 解析每一個房產資訊的詳情頁面，生成item
 :param response: 
 :return: 
 """
 pattern = re.compile('<script type="text/javascript">.*?lng = '(.*?)';.*?lat = '(.*?)';.*?bname = '(.*?)';.*?'
 'address = '(.*?)';.*?price = '(.*?)';',re.S)
 item = JiwuItem()
 results = re.findall(pattern,response.text)
 for result in results:
 item['name'] = result[2]
 item['address'] = result[3]
 # 對價格判斷只取數字，如果為空就設定為0
 pricestr =result[4]
 pattern2 = re.compile('(d+)')
 s = re.findall(pattern2,pricestr)
 if len(s) == 0:
 item['price'] = 0
 else:item['price'] = s[0]
 item['lng'] = result[0]
 item['lat'] = result[1]
 yield item

私信菜鳥007獲取此案例原始碼！

item.py

# -*- coding: utf-8 -*-
# Define here the models for your scraped items
#
# See documentation in:
# http://doc.scrapy.org/en/latest/topics/items.html
import scrapy
class JiwuItem(scrapy.Item):
 # define the fields for your item here like:
 name = scrapy.Field()
 price =scrapy.Field()
 address =scrapy.Field()
 lng = scrapy.Field()
 lat = scrapy.Field()
 pass

pipelines.py 注意此處是吧mongodb的儲存方法註釋了，可以自選選擇儲存方式

# -*- coding: utf-8 -*-
# Define your item pipelines here
#
# Don't forget to add your pipeline to the ITEM_PIPELINES setting
# See: http://doc.scrapy.org/en/latest/topics/item-pipeline.html
import pymongo
from scrapy.conf import settings
from openpyxl import workbook
class JiwuPipeline(object):
 wb = workbook.Workbook()
 ws = wb.active
 ws.append(['小區名稱', '地址', '價格', '經度', '緯度'])
 def __init__(self):
 # 獲取資料庫連線資訊
 host = settings['MONGODB_URL']
 port = settings['MONGODB_PORT']
 dbname = settings['MONGODB_DBNAME']
 client = pymongo.MongoClient(host=host, port=port)
 # 定義資料庫
 db = client[dbname]
 self.table = db[settings['MONGODB_TABLE']]
 def process_item(self, item, spider):
 jiwu = dict(item)
 #self.table.insert(jiwu)
 line = [item['name'], item['address'], str(item['price']), item['lng'], item['lat']]
 self.ws.append(line)
 self.wb.save('jiwu.xlsx')
 return item

最後報表的資料

加群：960410445 即可回去數十套！

利用Python爬取房產資料！並在地圖上顯示！Python乃蒂花之秀！

mongodb資料庫

利用Python爬取房產資料！並在地圖上顯示！Python乃蒂花之秀！

地圖報表效果圖：BDP分享儀表盤，分享視覺化效果

利用Python爬取房產資料！並在地圖上顯示！Python乃蒂花之秀！

JiwuspiderSpider.py # -*- coding: utf-8 -*- from scrapy import Spider,Request import re from jiwu.items import JiwuItem clas

Python爬取房產資料，哪裡跌價買哪裡，你可能不賺，但我永遠不虧

小夥伴，我又來了，這次我們寫的是用python爬蟲爬取烏魯木齊的房產資料並展示在地圖上，地圖工具我用的是 BDP個人版-免費線上資料分析軟體，資料視覺化軟體，這個可以匯入csv或者excel資料學習Python中有不明白推薦加入交流裙

程式設計師受刺激過度每天cosplay來上班，網友：蒂花之秀！

一聽到程式設計師，我相信很多人第一反應就是這份工作加班特別嚴重，的確如此，對於程式設計師來說，如果哪一天沒加班，他們會感覺十分幸福，這說明不加班對他們真的是一種奢望，最近在職場論壇看到一個關於程式設計師的有趣帖子。有位朋友說他們公司的某位程式設計師每天都cosplay上班，老闆還讓他勸勸這個程

Python爬取網頁資料並匯入表格

import requests import time import random import socket import http.client from bs4 import BeautifulSoup import csv def getContent(url

Python爬取房產數據，在地圖上展現！

exc pre 解析 see 爬取註意 app domain 數據庫連接小夥伴，我又來了，這次我們寫的是用python爬蟲爬取烏魯木齊的房產數據並展示在地圖上，地圖工具我用的是 BDP個人版-免費在線數據分析軟件，數據可視化軟件，這個可以導入csv或者excel數據。

python爬蟲由淺入深9---定向爬取股票資料資訊並儲存至本地檔案

技術路線：requests庫+bs4庫+re庫的整合使用目標：獲得上交所和深交所所有股票的名稱和交易資訊輸出：儲存至本地檔案可選資料網路有：新浪股票和百度股票，，通過檢視網頁原始碼可知，新浪股票的資料是通過javascript指令碼獲取的，故通過以上方式無法解析呃呃

向娛樂圈看齊，Python爬取微博評論並製作酷炫的詞雲！

2019年伊始，祝願各位多吃不胖，身體倍兒棒！回顧剛剛過去的2018，還有哪些新聞在你心底留有印象？怎奈年紀增長，記憶減退，逝去的爆炸新聞也逐漸褪色變得索然無味，畢竟一直以來我的心裡只有學習。 &nbs

Python爬取微博評論並製作酷炫的詞雲！

2019年伊始，祝願各位多吃不胖，身體倍兒棒！回顧剛剛過去的2018，還有哪些新聞在你心底留有印象？進群960410445 即可獲取數十套PDF！：怎奈年紀增長，記憶減退，逝去的爆炸新聞也逐漸褪色變得索然無味，畢竟一直以來我的心裡只有

Python 爬取qqmusic音樂url並批量下載

QQ col expr IE filename 代碼都是 sles () 　qqmusic上的音樂還是不少的，有些時候想要下載好聽的音樂，但有每次在網頁下載都是煩人的登錄什麽的。於是，來了個qqmusic的爬蟲。　　至少我覺得for循環爬蟲，最核心的應該就是找到待爬元

利用python3爬取淘寶評論出問題了，求高手幫忙分析下，急！！！！

這是我按照視訊教程裡面，弄的程式碼，現在有兩個問題 1.程式碼只迴圈一次，而且只運行了最後一個數值 2.生成的Excel表格，不規律，都集中在第一行 coding:utf-8 import requests import re import time import random im

用python爬取股票資料的一點小結

一、背景網上對於爬取股票資料有相對完善的教程。不過大部分教程都是隻能夠爬取一段時間的股票資料，針對某一隻股票的歷史資料爬取，目前還沒有看到比較好的教程。下面對近期學的東西進行一點點小結。二、股票資料爬取網站網上更多推薦的是東方財富的股票資料，連結為：http://quote.eas

python3爬取qq音樂並下載 Python 爬取qqmusic音樂url並批量下載

本文參考Python 爬取qqmusic音樂url並批量下載同學找我爬取一下qq音樂播放連結，包括歌詞等資訊打包成json，試了一下可以爬取。一、找到qq音樂播放的url 1.找到搜尋頁面返回的資料包歌曲最終的播放連結時經過多次拼接的，首先找到qq音樂搜尋歌曲介面，https://y.qq.

python爬取json資料

# coding utf-8 import requests import json import datetime import pymysql user_agent = 'User-Agent: Mozilla/4.0 (compatible; MSIE 7.0; Windows NT 5.1;

Python採集房產資料，在地圖上高亮呈現！

小夥伴，我又來了，這次我們寫的是用python爬蟲爬取烏魯木齊的房產資料並展示在地圖上，地圖工具我用的是 BDP個人版-免費線上資料分析軟體，資料視覺化軟體，這個可以匯入csv或者excel資料。

Python 爬取貓眼資料分析《無名之輩》為何能逆襲成黑馬？

本文首發在 CSDN 微信（ID：CSDNNews）。最近幾天，有部國產電影因好評及口碑傳播而開始異軍突起以黑馬之勢逆襲，在朋友圈以及微博上都會不時看到相關內容，那便是由陳建斌、任素汐等主演的《無名之輩》。這樣一部沒有什麼特別大牌或流量明星，甚至名稱與海報都沒有

python爬取的資料如何匯入excel---以噹噹網為例

一、相關模組的下載與安裝（一）首先需要幾個模組，xlrd（下載地址為：https://pypi.org/project/xlrd/#files），xlwt（下載地址為：https://pypi.python.org/pypi）。現在以xlrd的安裝為例。 cmd進入x

python爬蟲（3）——python爬取大規模資料的的方法和步驟

python爬取大規模資料的的方法和步驟：一、爬取我們所需要的一線連結 channel_extract.py 這裡的一線連結也就是我們所說的大類連結： from bs4 import BeautifulSoup import requests

今日頭條ajax技術內as ,cp，_cp_signature引數分析、破解及python爬取頻道資料

相信很多人在爬今日頭條的時候就遇到了一個難題，就是找到了訊息頭後，有3個加密的引數（as ,cp，_cp_signature），如下圖：找到的請求URL是：以上共有 max_behot_time 可以看出是10位數字的時間戳； category 是對應

簡單的python爬取網頁字串內容並儲存

最近想試試python的爬蟲庫，就找了個只有字串的的網頁來爬取。網址如下：開啟後看到是一些歌名還有hash等資訊。按照hash|filename的方式存在檔案裡，先貼程式碼 #coding=utf-8 import urllib import re import

Python爬取指定資料

Python無法爬取指定資料，求解！！！當前情況就是我需要在《汽車之家》這個niuB的網站上獲取指定的資料，但是當本人爬取指定車型的問答資料的時候，網址返回的資訊是正常的200，但是返回資料則是重定向到了一個偽頁面，返回的也是偽資訊資料。本人表示不解

利用Python爬取房產資料！並在地圖上顯示！Python乃蒂花之秀！

相關推薦