網易雲音樂（一）爬取全部歌手及歌手id

阿新 • • 發佈：2019-01-26

動聽的音樂，走心的評論。

總會使人不斷的遐想...

本系列將爬取分析網易雲音樂最動聽的音樂，最走心的評論。

本次爬取網易雲音樂的所以歌手及歌手id。

一、網頁分析

1.標籤

通過點選左邊已經分好類的標籤及頂部的ABC等分類標籤，得到網址地址引數。

2、爬取架構

3.構建請求

    def get_index(url):
        headers = {
            'Accept': 'text/html,application/xhtml+xml,application/xml;q=0.9,image/webp,image/apng,*/*;q=0.8',
            'Accept-Encoding': 'gzip, deflate',
            'Accept-Language': 'zh-CN,zh;q=0.9',
            'Connection': 'keep-alive',
            'Host': 'music.163.com',
            'Referer': 'http://music.163.com/',
            'Upgrade-Insecure-Requests': '1',
            'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) '
                          'Chrome/66.0.3359.181 Safari/537.36'
        }
        try:
            resp = requests.get(url,headers=headers)
            if resp.status_code == 200:
                return resp.text
            else:
                print('error')
        except ConnectionError:
            get_index(url)

4.解析內容

    def parse_re(resp):
        print('start parse {}'.format(url))
        tags = re.findall(r'<a href=".*?/artist\?id=(\d+)" class="nm nm-icn f-thide s-fc0" title=".*?的音樂">(.*?)</a>', resp, re.S)
        title = re.findall(r'<title>(.*?)-.*?</title>', resp, re.S)
        for tag in tags:
            print(tag[0],tag[1],title[0])

5.資料儲存

    def save_csv(tag, title):
        print('start save {}'.format(url))
        with open('all_singer.csv', 'a+', newline='', encoding='utf-8') as f:
            writer = csv.writer(f)
            writer.writerow(('id', 'name', 'title'))
            writer.writerow((tag[0], tag[1], title[0]))
        print('finish spider {}'.format(url))

完整程式碼：

import requests
import re
import csv
import json


class SingerSpider(object):
    def __init__(self):
        self.headers = {
            'Accept': 'text/html,application/xhtml+xml,application/xml;q=0.9,image/webp,image/apng,*/*;q=0.8',
            'Accept-Encoding': 'gzip, deflate',
            'Accept-Language': 'zh-CN,zh;q=0.9',
            'Connection': 'keep-alive',
            'Host': 'music.163.com',
            'Referer': 'http://music.163.com/',
            'Upgrade-Insecure-Requests': '1',
            'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) '
                          'Chrome/66.0.3359.181 Safari/537.36'
        }

    def get_index(self, url):
        '請求模組'
        try:
            resp = requests.get(url,headers=self.headers)
            if resp.status_code == 200:
                self.parse_re(resp.text)
            else:
                print('error')
        except ConnectionError:
            self.get_index(url)

    def parse_re(self, resp):
        '解析模組'
        print('start parse {}'.format(url))
        tags = re.findall(r'<a href=".*?/artist\?id=(\d+)" class="nm nm-icn f-thide s-fc0" title=".*?的音樂">(.*?)</a>', resp, re.S)
        title = re.findall(r'<title>(.*?)-.*?</title>', resp, re.S)
        for tag in tags:
            # print(tag[0],tag[1])
            # self.save_json(tag, title)
            self.save_csv(tag, title)

    def save_csv(self, tag, title):
        '儲存模組'
        print('start save {}'.format(url))
        with open('all_singer.csv', 'a+', newline='', encoding='utf-8') as f:
            writer = csv.writer(f)
            writer.writerow((tag[0], tag[1], title[0]))
        print('finish spider {}'.format(url))

    def save_json(self, tag, title):
        print('start save {}'.format(url))
        s = json.dumps({'id': tag[0], 'name': tag[1], 'title': title[0]},ensure_ascii=False)
        with open('all_singer.json', 'a+', newline='', encoding='utf-8') as f:
            f.write(s)
        print('finish spider {}'.format(url))
        print(s)


if __name__ == '__main__':
    # 歌手分類id
    list1 = [1001, 1002, 1003, 2001, 2002, 2003, 6001, 6002, 6003, 7001, 7002, 7003, 4001, 4002, 4003]
    # initial的值
    list2 = [0,65, 66, 67, 68, 69, 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88, 89, 90]
    for i in list1:
        for j in list2:
            url = 'http://music.163.com/discover/artist/cat?id=' + str(i) + '&initial=' + str(j)
            print('start spider {}'.format(url))
            SingerSpider().get_index(url)

網易雲音樂（一）爬取全部歌手及歌手id

動聽的音樂，走心的評論。總會使人不斷的遐想... 本系列將爬取分析網易雲音樂最動聽的音樂，最走心的評論。本次爬取網易雲音樂的所以歌手及歌手id。一、網頁分析 1.標籤通過點選左邊已經分好類的標籤及頂部的ABC等分類標籤，得到網址地址引數。

C# WPF 仿網易雲音樂（PC）左側菜單右側內容效果

ups tle onu urn mar mat 難點 -c nat 我們要做的效果是這樣的，左側是可折疊的菜單欄，右側是內容區域，點擊左側的菜單項右側內容區域則相應地切換。這篇博客標題起得比較隨意了，因為很多軟件、網站都有這種布局效果，所以請忽略。 wpf實現的話，我的辦

C# WPF 低仿網易雲音樂（PC）Banner動畫控制元件

原文: C# WPF 低仿網易雲音樂（PC）Banner動畫控制元件由於技術有限沒能做到一模一樣的動畫，只是粗略地做了一下。動畫有點生硬，還有就是沒做出網易雲音樂的立體感。程式碼非常簡單粗暴，而且我也寫有很多註釋，這裡就不多囉嗦了，直接貼程式碼。算了，囉嗦幾句。原理是這樣的，在自定義使用者控制元件內新

C# WPF 低仿網易雲音樂（PC）歌詞控制元件

原文: C# WPF 低仿網易雲音樂（PC）歌詞控制元件提醒：本篇部落格記錄了修改的過程，廢話比較多，需要專案原始碼和看演示效果的直接拉到文章最底部~ 網易雲音樂獲取歌詞的api地址 http://music.163.com/api/song/media?id=歌曲ID 填

史上最牛逼的音樂播放器—仿網易雲音樂（已開源）

前言：音樂播放器倒見過不少，做到幾乎和官方網易雲音樂安卓版差不多的，還是頭第一回見。aa112901 的這款仿網易雲音樂安卓版客戶端，很多地方值得我們學習。無論是下載模組，還是換膚模組，還是炫麗的UI介面。等。用心在每一個細節。aa112901 本專案的github為:

畢業後就是程式設計師——我的阿里、金山、中華、騰訊、360、網易面試總結（一）

再開始我的部落格之旅。東奔西跑的忙了一個多月，找工作的事算是告一段落；這段時間有興奮，有失落，有迷惘，也有開心，是一個讓自己得到鍛鍊，得到提升的好機會，是一段難忘的時光，記錄下留作紀念，也希望能給同樣要走這一段路的人一點提醒，免得像我一樣，當碰得頭破血流之時才不得不去承認

Python爬蟲實例（一）爬取百度貼吧帖子中的圖片

選擇圖片查看負責 targe mpat wid agent html headers 程序功能說明：爬取百度貼吧帖子中的圖片，用戶輸入貼吧名稱和要爬取的起始和終止頁數即可進行爬取。思路分析：一、指定貼吧url的獲取例如我們進入秦時明月吧，提取並分析其有效url如下

Python爬蟲入門實戰系列（一）--爬取網路小說並存放至txt檔案

執行平臺： Windows Python版本： Python3.x 一、庫檔案

網易雲音樂“王牌冤家”使用者評論：評論爬蟲及情感分析(SnowNLP)

李榮浩上週發的《耳朵》專輯，你萌聽了嗎？小編真的超級喜歡“王牌冤家”這首歌，在新說唱聽了李老師的那幾句就一直念念不忘，這一週可是一直單曲迴圈中。恰好前兩天看了SnowNLP的一點東西，所以，這一次基於這首歌的評論，來做個非常easy的情感分析。文字資訊是選取的網易雲音樂下的評

scrapy入門實戰練習（一）----爬取豆瓣電影top250

轉自知乎網工具和環境語言：python 2.7IDE： Pycharm瀏覽器：Chrome爬蟲框架：Scrapy 1.2.1教程正文觀察頁面結構通過觀察頁面決定讓我們的爬蟲獲取每一部電影的排名、電影名稱、評分和評分的人數。宣告ItemItems爬取的主要目標就是從非結構性的資

PyQt5與爬蟲（一）——爬取某站動畫每週列表

某站動畫列表PyQt程式截圖，可以點選圖片按鈕，然後會開啟谷歌瀏覽器到你選擇的動漫介面。貼程式碼：main.pyfrom PyQt5.QtWidgets import QWidget,QApplication import sys from MyWidget import W

python爬蟲（一）爬取豆瓣電影Top250

提示：完整程式碼附在文末一、需要的庫 requests：獲得網頁請求 BeautifulSoup：處理資料，獲得所需要的資料二、爬取豆瓣電影Top250 爬取內容為：豆瓣評分前二百五位電影的名字、主演、

python爬蟲學習筆記（一）—— 爬取騰訊視訊影評

前段時間我忽然想起來，以前本科的時候總有一些公眾號，能夠為我們提供成績查詢、課表查詢等服務。我就一直好奇它是怎麼做到的，經過一番學習，原來是運用了爬蟲的原理，自動登陸教務系統爬取的成績等內容。我覺得挺好玩的，於是自己也琢磨了一段時間，今天呢，我為大家分享一個爬蟲

python 爬蟲實戰（一）爬取豆瓣圖書top250

import requests from lxml import etree with open('booktop250.txt','w',encoding='utf-8') as f: f

Python爬蟲學習6：scrapy入門（一）爬取汽車評論並儲存到csv檔案

一、scrapy 安裝：可直接使用Anaconda Navigator安裝，也可使用pip install scrapy安裝二、建立scrapy 爬蟲專案：語句格式為 scrapy startproject project_name生成的爬蟲專案目錄如下，其中spiders

爬取網易雲音樂“三部曲”（一）：爬取歌手資訊！

提到歌神張學友，大家可能不會陌生或者說是如雷貫耳，他可是有著逃犯殺手之稱，這不明天1月11號是他2019世界巡迴演唱會《香港站》的開辦日期，不知香港警方有沒有做好抓逃犯的準備【手動滑稽】。對於歌神明天的演唱會，小編其實挺嚮往的，只是奈何年底了，天天要工作，作為一個程式猿，這也是沒辦法的，為了排遣內心

Scrapy爬取網易雲音樂和評論（一、思路分析）

目錄：前提： scrapy這個框架很多人用過，網上教程也很多，但大多就是爬爬小說這種比較簡單且有規律的，網易雲音樂也有很多人寫過，也有API，不過大多是爬取了熱門歌曲，或是從歌單下手，但是考慮到歌單會有很多重複的。當然，從歌手頁的話，如果

網易雲音樂評論爬蟲（三）:爬取歌曲的全部評論

用過網易雲音樂聽歌的朋友都知道，網易雲音樂每首歌曲後面都有很多評論，熱門歌曲的評論更是接近百萬或者是超過百萬條．現在我就來分享一下如何爬取網易雲音樂歌曲的全部評論，由於網易雲音樂的評論都做了混淆加密處理，因此我們需要深入瞭解它的加密過程之後才能爬取到網易雲音樂歌曲的全部評論．一，首

爬取網易雲音樂“三部曲”（三）：輕鬆下載網易音樂歌曲！

本文是承接前兩文章而來，前兩篇文章我們收集了歌手資訊和歌詞，可是光有歌手資訊和歌詞沒有歌曲怎麼行，沒有歌曲怎麼知道音調，這讓人怎麼學？怎麼聽？這不耍流氓嘛？為了向大家證明小編不是耍流氓，是耍無賴，我決定教大家直接把網易雲音樂歌手的熱門歌曲全部免費下載下來。除了已經下架不在網易資料庫的，其他的都能全部

爬取網易雲音樂“三部曲”（二）：獲取網易雲音樂歌手歌詞！

上一篇文章爬取了歌手的姓名和歌手的 id ，這篇文章根據上篇爬取的歌手 id 來直接下載對應歌手的歌詞。這些我其實可以寫成一個大專案，把這個大專案拆成小專案一來方便大家的理解，二來小專案都會了的話，拼在一起就是一個完整的專案了。上篇文章沒學會的也不要緊，私信小編可以獲取上次的爬取結果 c

網易雲音樂（一）爬取全部歌手及歌手id

1.標籤

2、爬取架構

3.構建請求

4.解析內容

5.資料儲存

完整程式碼：

相關推薦