Python程式碼登入新浪微博並自動發微博

阿新 • • 發佈：2019-01-16

前言

對於很少玩微博@張行之_的我來說，微博內容少的可憐。所以本人就想：能不能寫個成功程式來幫我發微博。這個程式要滿足以下要求：

自動化，自動登入微博，自動發微博。
微博內容要有意義，不能是隨機生成的字元。
可以設定每隔一段時間發一條微博，頻率不能太快，當然也不能太慢。

於是，就誕生了這個程式，程式碼使用純Python實現，沒有使用微博SDK，主要是模擬HTTP操作。程式執行後會先登入微博，然後啟動一個定時器，每隔一段時間爬取秒拍、cnBeta、部落格園、TechWeb、推酷最新的內容，再轉發到微博。

試用了幾天，效果可以檢視我的微博：@張行之_。

整體結構

程式分為3個模組：微博登入

、定時發微博、微博內容生產。程式碼結構如下：

sinaWeibo
|----main.py
|----sinaWeiboLogin.py
|----config.py
|----logger.py
|----sendWeibo.py
|----TextFactory.py
      |spider
      |----__init__.py
      |----utility.py
      |----http.py
      |----spider.py
      |----cnbeta.py          //解析cbbeta
      |----cnblog.py          //解析部落格園 

      |----techweb.py       /解析techweb
      |----tuicool.py          //解析推酷
      |----.....                      //更多解析

##使用如果你只想使用該程式碼來發微博，並不關心程式碼是怎麼實現的，那麼你只需要讀這一節內容。 1. 下載，專案地址：

pip install rsa
pip install requests

2. 如果你的微博登入時要輸入驗證碼，該程式碼是登入不成功的，可以在賬號安全的登入保護中設定不輸入驗證碼。 ##登入登入網上有很多現成的方法，在GitHub上找到一個登入新浪微博的[Python程式碼][6]，使用[requests][7]，比urllib2更方便。程式碼依賴[requests][7]和[rsa][8]。程式碼有點舊，需要做一點修改。

WBCLIENT = 'ssologin.js(v1.4.5)' 
 => WBCLIENT = 'ssologin.js(v1.4.18)'

兩個正則表示式也需要修改下：

login_url = re.search(r'replace\([\"\']([^\'\"]+)[\"\']', resp.text).group(1)
改為：
login_url = re.search('replace\\(\'([^\']+)\'\\)', resp.text).group(1) 

login_str = re.match(r'[^{]+({.+?}})', resp.text).group(1)
改為：
login_str = login_str = re.search('\((\{.*\})\)', resp.text).group(1)

登入時要注意，如果需要輸入驗證碼，這段程式碼是會登入失敗的，可以在賬號安全的登入保護中設定不輸入驗證碼。 ##定時自動發微博新浪微博發微博的介面是： `http://www.weibo.com/aj/mblog/add?ajwvr=6&__rnd=時間戳` 時間戳使用` int(time.time() * 1000`即可設定。 Post提交資料：

"location" : "v6_content_home", 
"appkey" : "", 
"style_type" : "1", 
"pic_id" : "", 
"text" : 微博內容, 
"pdetail" : "", 
"rank" : "0", 
"rankid" : "", 
"module" : "stissue", 
"pub_type" : "dialog", 
"_t" : "0",

提交資料時需要設定Headers: `self.http.headers[“Referer”] = “http://www.weibo.com/u/%s/home?wvr=5” % str(self.uid)` uid在登入時會返回。在Python中啟動一個定時器（Timer），每當定時器觸發的時候向這個介面Post資料就能實現自動發微博了。

def newTimer(self):
      self.timer = Timer(TIME_SLOG, self.main, ()).start()

def stop(self):
      log("結束任務")
      self.timer.cancel()
      pass

def main(self):
      self.sendWeibo()

      if TIMER_REPEAT:
            self.newTimer()

def sendWeibo(self):
      text = TextFactory.getText()
      self.update(text)
      log(u"傳送微博：" + text)

##微博內容生產要產生有意義的微博內容，一般需要從網站上爬取。當然，也可以把內容寫入文字再定時傳送。內容都是從網上爬取的，因此需要實現一個爬蟲，用Python的requests爬取網頁非常方便，幾行程式碼搞定。使用`SGMLParser`解析網頁也是非常方便的。爬蟲部分在爬取網頁都是一樣的，解析時不同，所以只需要分別對每一個網站實現一個[`SGMLParser`][10]子類就能實現多個網站的爬取了。為了從不同網站爬取資料，程式碼實現一個輪詢機制，用一個容器儲存各個網站的爬蟲物件，在每次獲取微博內容時使用不同的爬蟲物件。

spiders = [
      Spider(miaopai.HOME_URL, miaopai.MiaopaParser()),
      Spider(cnbeta.HOME_URL, cnbeta.CnbetaParser()),
      Spider(cnblog.HOME_URL, cnblog.CnblogParser()),
      Spider(techweb.HOME_URL, techweb.TechwebParser()),
      Spider(tuicool.HOME_URL, tuicool.TuicoolParser()),
      Spider(miaopai.HOME_URL, miaopai.MiaopaParser()),
]

currentIndex = 0
count = len(spiders)

def getText():
      spider = nextSpider()
      text = spider.getAMessage()
      return text

def nextSpider():
      global currentIndex
      spider = spiders[currentIndex]
      currentIndex = (currentIndex + 1) % count
      return spider

###新增爬蟲程式碼設計具有較好地擴充套件性，在爬蟲類`spder.py`中定義一個解析屬性

class Spider(object):
      def __init__(self, homeUrl, parser):
            super(Spider, self).__init__()
            self.homeUrl = homeUrl
            self.parser = parser

      def getAMessage(self):
            html = http.get(self.homeUrl)
            self.parser.feed(html)
            return self.parser.getMsg()

在建立`Spider`物件時，只需要注入不同的解析物件，就能解析不同的網站內容了，甚至還可實現從其他渠道獲取內容。在`TextFactory.py`中實現了輪詢機制，當有新的解析類時，只需在`TextFactory.py`中的`spiders`新增一個就行。

結語

該程式碼已經基本滿足了前言的3點要求，不過還存在一些問題：

爬蟲部分還存在很多冗餘，可以進一步優化。
產生微博內容時可能會生成相同的內容，尤其是目標網站更新頻率不高時。

Python程式碼登入新浪微博並自動發微博

前言

整體結構

結語

Python程式碼登入新浪微博並自動發微博

python模擬登入新浪微博自動獲得呼叫新浪api所需的code

python抓取新浪微博評論並分析

Python爬取新浪微博用戶信息及內容

curl模擬登入新浪微博

【python 新浪微博爬蟲】python 爬取新浪微博24小時熱門話題top500

Java 模擬登入新浪微博(Cookie)

python sdk 獲取新浪微博簽到資訊

java 模擬登入新浪微博（通過cookie）

Android授權登入新浪微博獲取使用者個人資訊

手把手教你selenium_第一個指令碼_登入新浪微博

用python爬取新浪微博資料（無需手動獲取cookie)

PHP 新浪微博開放平臺新浪雲平臺 SAE 開發微博應用建立微博應用的過程

Python爬取新浪微信評論，瞭解一下

python 爬蟲1 開始，先拿新浪微博開始

Python爬蟲開源項目代碼，爬取微信、淘寶、豆瓣、知乎、新浪微博、QQ、去哪網等代碼整理

一鍵分享到QQ空間、QQ好友、新浪微博、微信程式碼

新浪微部落格戶端開發之授權登入+獲取微博列表

Android 第三方登入之新浪微博授權登入

909422229_新浪微博API錯誤程式碼

Python程式碼登入新浪微博並自動發微博

前言

整體結構

結語

相關推薦