6.簡單提取小紅書app資料(簡單初步試採集與分析)-1

阿新 • • 發佈：2018-11-01

採集小紅書資料爬蟲：
1.本來是要通過app端的介面去直接採集資料，但是app介面手機端設定本地代理這邊開啟抓包後就不能正常訪問資料。
所以就採用了微信小程式裡的小紅書app介面去採集資料。

2.通過 fiddler去抓包，手機端進入小程式埠選擇彩妝向下滑動請求資料，這邊fiddler就會抓到請求資料和相應的response。

由上邊的兩圖可以看到請求的一個過程，這裡每次單擊拖動只會更新10條資料（資料包含在data{}裡），下面就要對請求的header引數進行分析。

3.經過分析主要引數包含

"auth":"eyJoYXNoIjoibWQ0IiwiYWxnIjoiSFMyNTYiLCJ0eXAiOiJKV1QifQ.eyJzaWQiOiI5M2JhM2Q3MC03MWJhLTQzOGYtODhiNC03MDNiZDZlNDRkNjYiLCJleHBpcmUiOjE1NDEwNjkyNTJ9.MIolGQY-A-j-n2cxDYKeN9ILh4gBaYMHUWiA0IRJILQ"

"auth-sign":"13c136011f62d6bc0e7d2bf1f7f04201",

而且引數還具有一個時效性，請求的一段時間內是能夠返回得到有效資料的。

這裡呢，暫時未做分析只是先把10條資料先拿下來試試，稍後再做處理。

import requests

def main():
    headers = {
    "charset":"utf-8",
    "Accept-Encoding":"gzip",
    "referer":"https://servicewechat.com/wxffc08ac7df482a27/117/page-frame.html",
    "authorization 
":"5bda7657a4ce660001f7eed8",
    "auth":"eyJoYXNoIjoibWQ0IiwiYWxnIjoiSFMyNTYiLCJ0eXAiOiJKV1QifQ.eyJzaWQiOiI5M2JhM2Q3MC03MWJhLTQzOGYtODhiNC03MDNiZDZlNDRkNjYiLCJleHBpcmUiOjE1NDEwNjkyNTJ9.MIolGQY-A-j-n2cxDYKeN9ILh4gBaYMHUWiA0IRJILQ",
    "content-type":"application/json",
    "auth-sign":"13c136011f62d6bc0e7d2bf1f7f04201 
",
    "User-Agent":"Mozilla/5.0 (Linux; Android 7.1.2; MI 5X Build/N2G47H; wv) AppleWebKit/537.36 (KHTML, like Gecko) Version/4.0 Chrome/64.0.3282.137 Mobile Safari/537.36 MicroMessenger/6.7.3.1360(0x26070336) NetType/WIFI Language/zh_CN Process/appbrand2",
    "Host":"www.xiaohongshu.com",
    "Connection":"Keep-Alive",
    }
    url = "http://www.xiaohongshu.com/sapi/wx_mp_api/sns/v1/homefeed?oid=homefeed.cosmetics_v2&cursor_score=1541067389.9540&sid=session.1540996623416187718"

    datas = requests.get(url= url, headers=headers ).json()
    data = datas['data']
    # print(data)
    for i in data:
        print(i)
        print(i['title'])
        print(i['share_link'])

if __name__ == "__main__":
    main()

結果如圖：

4.進入單個tag的詳情頁：

評論

5.能力有限，目前只能分析到這幾步，採集每一項tag的具體東西還沒做完善，後期的處理還需要更多新的東西支援，所涉及的東西很多自己也是初次接觸採集app端的資料，appium模擬還沒有接觸，後期的appium自動化測試模擬人工完成一系列的操作還在學習摸索中。

6.簡單提取小紅書app資料(簡單初步試採集與分析)-1

採集小紅書資料爬蟲：1.本來是要通過app端的介面去直接採集資料，但是app介面手機端設定本地代理這邊開啟抓包後就不能正常訪問資料。所以就採用了微信小程式裡的小紅書app介面去採集資料。2.通過 fiddler去抓包，手機端進入小程式埠選擇彩妝向下滑動請求資料，這邊fiddler就會抓到請求資料和相應的

小紅書App產品需求文檔（PRD）

發布者正在轉動找到消息上傳圖片兩種評論在線筆者以安卓系統手機端用戶的身份通過使用、體驗和分析等方式來倒推“小紅書”APP，並生成產品需求文檔PRD。小紅書app是以用戶分享內容(UGC)模式闖入到大家視線的，並且在某寶日益強大的趨勢下，帶有購物功能的小紅

2月第3周業務風控關註|上海網信辦復測23個被約談APP 涉及1號店、小紅書等

業務 rdp 51cto term ges 同時 images 郵件威脅易盾業務風控周報每周呈報值得關註的安全技術和事件，包括但不限於內容安全、移動安全、業務安全和網絡安全，幫助企業提高警惕，規避這些似小實大、影響業務健康發展的安全風險。 1、上海網信辦復測23個被約談

小紅書完成新一輪3億美元融資領投的阿裏看上了哪些獨特優勢?

小紅書據相關報道，社區電商小紅書近日剛完成了新一輪由阿裏領投多家知名投資機構跟投超過3億美元的融資，目前小紅書估值30億美元。今天我們不妨一起來復盤下小紅書的融資歷程。成立於2013年的小紅書當年10月，就獲得真格基金的數百萬人民幣天使輪投資；2014年6月，獲金沙江創投和真格基金的數百萬美元A輪投資；20

小紅書，1.5億年輕人的虛擬城市：美好生活的終極想象

烏鎮2018年11月9日電 /美通社/ -- 2018年11月5日-11月10日，以“創造互信共治的數字世界 -- 攜手共建網路空間命運共同體”為主題的第五屆網際網路大會，在水鄉烏鎮舉行。小紅書作為受1.5億年輕人喜愛的生活方式分享平臺，與430餘家創新企業共同亮相本次大會，交流

網紅“小紅書”，電商銷售新模式

說起“小紅書”，大家肯定不陌生，“網紅”“社交電商”“種草”“獨角獸”“美妝大賞”，他擁有各種各樣的表情，一千個人眼裡，有一千個哈姆雷特，每個人對這款在兩年內迅速躥紅的跨境電商APP都有不同的看法，而我作為一個對於電商略有涉獵的加班狗，嘗試著以自己的眼光來發表一

小紅書演算法簡介

小紅書作為中國乃至全球獨一無二的社群電商，目標是讓全世界的好生活觸手可及，那麼如何幫助使用者在社群裡發現好生活，又如何引導使用者找到值得剁手的好產品呢？本文整理自 ArchSummit 深圳演講，探討如何運用機器學習和人工智慧，幫助小紅書不到 10 人的演算法團隊快速接近目標

小紅書怎麼推廣，小紅書怎麼做排名引流？

小紅書，兩年前一個默默無聞的社群靠著口碑營銷火起來了！對於小紅書商家來說，最先抓住使用者才能抓住賺錢的機會。那麼問題就來了，怎麼才能帶來流量？如何獲得更多的曝光？只要做小紅書推廣，就能給你帶來大量客源，賺更多的錢！點贊收藏評論搜尋排名上首頁，可以諮

小紅書刷點贊可以上推薦嗎？小紅書教程

今天主要說的就是一些關於小紅書推廣的教程。我們將從4個方面開始教學。第一部分是小紅書推廣引流的。第二部分是小紅書點贊收藏的。第三部分是小紅書加粉的。第四部分是小紅書怎麼上推薦熱門，小紅書關鍵詞排名的。當

小紅書在Kubernetes容器環境的CD實踐_Kubernetes中文社群

前言容器推出以來，給軟體開發帶來了極具傳染性的振奮和創新，並獲得了來自各個行業、各個領域的巨大的支援——從大企業到初創公司，從研發到各類IT人員等等。跨境知名電商小紅書隨著業務的鋪開，線上部署單元的數量急劇增加，以 Jenkins 呼叫指令碼進行檔案推送的部署模式已經不能適應需求。這一期實踐

乾貨分享：清法網路分析小紅書內容運營那點事兒

有人說小紅書是“一夜爆紅”，其實不然。事實上，任何平臺的火爆都少不了長期的SEO優化。搜尋公關專家清法認為，雖然小紅書的成功大部分歸功於內容營銷，但是小紅書中的內容運營策略與SEO優化密不可分。一、使用者定位使用者定位是SEO優化過程中必不可少的步驟。我們建一個網站，要考慮使用者有哪些需求，再對使用者的需求進

幹貨分享：清法網絡分析小紅書內容運營那點事兒

女性發現不難不可文案最大標題官方集中有人說小紅書是“一夜爆紅”，其實不然。事實上，任何平臺的火爆都少不了長期的SEO優化。搜索公關專家清法認為，雖然小紅書的成功大部分歸功於內容營銷，但是小紅書中的內容運營策略與SEO優化密不可分。一、用戶定位用戶定位是SE

仿小紅書圖片-橫條-文字聯動點選輪播

"大三暑假找了個做APP的公司實習，當時說好有大牛帶著做Android，工作內容卻變成了前端，並且技術主管要求我儘可能用Vue.js來做網站。那時候我只會一點點HTML，CSS也只會一些很基礎的內容，別說Vue了，JS我都不懂，並且整個公司的前端就只有我一個人，遇到不會的

小紅書怎麼運營？清法網路分享步驟

作為活躍度日益暴增的社群電商平臺，小紅書如今被無數商家看做是品牌運營推廣的重要渠道。今天，上海seo網路公司清法網路就來為大家拆解分析小紅書的運營步驟。小紅書運營主要分為四個板塊：商城運營、品牌號運營、KOL文章、素人筆記佔位及其他運營手段。商城運營商城運營是十分必要的一個環節，因為品牌主在小紅書上的所有運營

小紅書怎麽運營？清法網絡分享步驟

特點經驗營銷點擊看到了今天操作 http images 作為活躍度日益暴增的社區電商平臺，小紅書如今被無數商家看做是品牌運營推廣的重要渠道。今天，上海seo網絡公司清法網絡就來為大家拆解分析小紅書的運營步驟。小紅書運營主要分為四個板塊：商城運營、品牌號運營、KO

AWS 案例研究：小紅書

小紅書的資料團隊在2015年3月成立並以AWS雲平臺為基礎搭建起完整的資料處理系統，所使用的AWS雲服務包括Amazon EC2、Amazon S3、Amazon EMR、Amazon Kinesis、Amazon RedShift等，圖1是小紅書資料處理系統架構圖。

幹貨分享！杭州知名SEO公司清法網絡告訴你如何玩轉小紅書

很大的生活直接日常生活的人自己的日常點贊需求對於需要推廣、營銷、豎立品牌形象的企業來說，SEO是一項很重要的手段，它能提高品牌的曝光度，並吸引更多的流量。一般來說，SEO都是在百度等搜索引擎網站內進行布局。不過你知道嗎，有智慧的SEO公司在給企業做優化時，

仿小紅書根據圖片高度自適應viewpager高度輪播圖

之前不瞭解小紅書，直到有一天經理說看見一個他想要的效果，跟小紅書一樣，趕緊下載小紅書來看看，寫起來賊費勁的一個自適應viewpager高度的輪播圖。效果圖: 直接粘程式碼了：main_activity <?xml version="1.0" encodi

哇哈哈小紅書原來這麼好用之體驗報告

7.25 1.0版 8.15 1.1版一、WHY 畢竟只看B站美妝區已經滿足不了我了，正好一直以來聽說小紅書有明星入駐分享美妝心得，羨慕不已於是心動不如行動，like下載了小紅書APP。版本：Android v5.20.0 二、產品概述 1.產品簡介

【小紅書2017年筆試】求一個數組中平均數最大的子陣列

題目： * 給一個數組，裡邊有N個整數，找長度為K(0<K<N)且平均值最大的子陣列，並把這個最大值輸出來輸入描述：* 6 (N的值)* 1 12 -5 -6 50 3 (含有N個整數的陣列)* 4 (K的值) 輸出描述： * 12.75 題目很簡單，時

6.簡單提取小紅書app資料(簡單初步試採集與分析)-1

相關推薦