爬取網易雲音樂所有歌單資訊

阿新 • • 發佈：2018-12-24

可以結合下一篇文章實現歌曲下載
python 爬蟲下載網易歌單歌曲

使用 python + requests + lxml + selenium

使用 requests 發起請求，獲取到所有分類的 url
使用 selenium 傳送請求取到每頁的每個歌單資訊
點選下一頁，爬取下一頁的歌單資訊
儲存資訊

import requests, time
from selenium import webdriver
from lxml import etree
from requests.utils import unquote
from 
 selenium.webdriver.common.keys import Keys


class WangyiMusic:
    def __init__(self):
        self.start_url = "https://music.163.com/discover/playlist/"
        self.url_temp = "https://music.163.com"
        self.headers = {
            "Referer": "https://music.163.com/",
            "User-Agent": "Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/72.0.3608.4 Safari/537.36" 

        }
        self.session = requests.Session()
        self.driver = webdriver.Chrome()

    def parse_get_url(self):
        resp = self.session.get(self.start_url, headers=self.headers)
        return resp.content.decode()

    def get_category_list(self, html_str):
        el = etree.HTML(html_str) 

        dl_list = el.xpath("//div[@class='bd']/dl")
        category_list = []
        for dl in dl_list:
            a_list = dl.xpath(".//a[@class='s-fc1 ']")
            for a in a_list:
                items = {}
                items["cate_name"] = a.xpath("./text()")[0]
                items["cate_url"] = self.url_temp + a.xpath("./@href")[0]
                print(items)
                category_list.append(items)

        cate_url_list = [category["cate_url"] for category in category_list]
        print(cate_url_list)
        return category_list, cate_url_list

    def save_category_list(self, category_list):
        pass

    def get_playlist_list(self):
        li_list = self.driver.find_elements_by_xpath("//ul[@id='m-pl-container']/li")
        playlist_list = []
        for li in li_list:
            items = {}
            items["playlist_name"] = li.find_element_by_xpath(".//a[@class='tit f-thide s-fc0']").text
            items["playlist_url"] = li.find_element_by_xpath(".//a[@class='tit f-thide s-fc0']").get_attribute("href")
            items["playlist_author"] = li.find_element_by_xpath(".//a[@class='nm nm-icn f-thide s-fc3']").text
            items["playlist_num"] = li.find_element_by_xpath(".//span[@class='nb']").text
            print(items)
            playlist_list.append(items)

        next_url = self.driver.find_elements_by_xpath(".//a[@class='zbtn znxt']")
        # next_url = self.driver.find_elements_by_link_text("下一頁")
        next_url = next_url[0] if len(next_url) > 0 else None
        print(next_url)
        return playlist_list, next_url

    def save_playlist_list(self, playlist_list):
        for playlist in playlist_list:
            with open("music_163.txt", 'a', encoding="utf-8") as f:
                f.write(
                    "歌單名：" + playlist["playlist_name"] + " | | " + "歌單作者: " + playlist[
                        "playlist_author"] + " | | " + "歌單播放量：" + playlist["playlist_num"] + " | | " + "歌單地址：" +
                    playlist["playlist_url"])
                f.write("\n\n")

    def run(self):
        # 先取到所有分類的名稱和 url
        # 發起請求
        html_str = self.parse_get_url()
        # 提取分類名和 url 資料
        category_list, cate_url_list = self.get_category_list(html_str)
        # 儲存分類名和 url 資料
        self.save_category_list(category_list)

        # 遍歷請求每個分類 url，取到分類中的歌單名稱與 url
        for cate_url in cate_url_list:
            # 請求每個分類 url
            self.driver.get(cate_url)
            # 進入到 iframe 框架中
            self.driver.switch_to.frame(self.driver.find_elements_by_tag_name("iframe")[0])
            # 設定等待時間
            time.sleep(5)
            # 取到資料
            print("*" * 100)
            print(unquote(self.driver.current_url))  # 輸出當前 url

            playlist_list, next_url = self.get_playlist_list()  # 取到第一頁的歌單資料
            # 儲存資料
            self.save_playlist_list(playlist_list)
            # 請求下一頁
            while next_url is not None:
                next_url.send_keys(Keys.ENTER)  # 元素被覆蓋，無法點選  用Enter代替click
                time.sleep(5)
                # 提取資料
                playlist_list, next_url = self.get_playlist_list()
                # 儲存資料
                self.save_playlist_list(playlist_list)

            print("*" * 100)

        self.driver.quit()


if __name__ == '__main__':
    wangyimusic = WangyiMusic()
    wangyimusic.run()

效果

在這裡插入圖片描述

中間遇到的問題

selenium 獲取到了下一頁的元素資訊，但是點選失敗

原因：元素被覆蓋，無法點選

解決：

用Enter代替click

匯入from selenium.webdriver.common.keys import Keys

next_url.send_keys(Keys.ENTER) # 元素被覆蓋，無法點選用Enter代替click

發現用Enter代替click後，如果不是下拉載入的頁面的話，不用下拉滾動條就能用enter點到

也有其他的解決辦法：

手動將頁面拉到最下面、

使用載入頁面的方法等。

爬取網易雲音樂所有歌單資訊

可以結合下一篇文章實現歌曲下載 python 爬蟲下載網易歌單歌曲使用 python + requests + lxml + selenium 使用 requests 發起請求，獲取到所有分類的 url 使用 selenium 傳送請求取到

Python爬取網易雲音樂歌單內所有歌曲

一、目標：下載網易雲音樂熱門歌單二、用到的模組： requests，multiprocessing，re。三、步驟：（1）頁面分析：首先開啟網易雲音樂，選擇熱門歌單，可以看到以下歌單列表，然後開啟開發者工具本人對於Python學習建立了一個小小的學習圈子，為

python爬取網易雲音樂歌單音樂

string attrs default textarea bsp color read contents dom 在網易雲音樂中第一頁歌單的url：http://music.163.com/#/discover/playlist/ 依次第二頁：http://music.1

我用Python爬取網易雲音樂上的Hip-hop歌單，分析rapper如何押韻

line gone 謠言大致 -i 態度大眾其中當前緣起《中國有嘻哈》這個節目在這個夏天吸引了無數的目光，也讓嘻哈走進了大眾的視野。作為我今年看的唯一一個綜藝節目，它對我的影響也蠻大。這個夏天，我基本都在杭州度過，在上下班的taxi上，我幾乎都在刷這個節目，最後

爬取網易雲音樂評論並使用詞雲展示

referer top readlines target ner ads 詞雲 pos 參考最近聽到一首很喜歡的歌，許薇的《我以為》，評論也很有趣，遂有想爬取該歌曲下的所有評論並用詞雲工具展示。我們使用chrome開發者工具，發現歌曲的評論都隱藏在以 R_S

爬取網易雲音樂(包括歌詞和評論)

輸入 random 字節 sim main dal 需要 ssi wow # http://music.163.com/discover/playlist/?order=hot&cat=%E5%85%A8%E9%83%A8&limit=35&off

如何用Python網絡爬蟲爬取網易雲音樂歌曲

今天 http 分享圖片分享圖片分分鐘參考 down 技術今天小編帶大家一起來利用Python爬取網易雲音樂，分分鐘將網站上的音樂down到本地。跟著小編運行過代碼的筒子們將網易雲歌詞抓取下來已經不再話下了，在抓取歌詞的時候在函數中傳入了歌手ID和歌曲名兩個參數

如何用Python網絡爬蟲爬取網易雲音樂歌詞

網易雲歌詞 Python網絡爬蟲網絡爬蟲前幾天小編給大家分享了數據可視化分析，在文尾提及了網易雲音樂歌詞爬取，今天小編給大家分享網易雲音樂歌詞爬取方法。本文的總體思路如下：找到正確的URL，獲取源碼；利用bs4解析源碼，獲取歌曲名和歌曲ID；調用網易雲歌曲API，獲取歌詞；將歌詞寫入

python爬取網易雲音樂歌曲評論信息

webkit fun 數據包 cond bubuko ret value selenium apple 　　網易雲音樂是廣大網友喜聞樂見的音樂平臺，區別於別的音樂平臺的最大特點，除了“它比我還懂我的音樂喜好”、“小清新的界面設計”就是它獨有的評論區了——————各種故事匯

python3.基礎爬取網易雲音樂【超詳細版】

簡單學習了python爬蟲之後，我們就可以嘿咻嘿咻了...因為平時就是用網易雲聽的歌，也喜歡看歌裡的評論，所以就爬網易雲音樂評論吧！正式進入主題首先還是去找目標網頁並開始分析網頁結構，如下上面的三個箭頭都是所要找的資料，分別是評論使用者，評論和點贊數，都可以用正則表示式找出來，接下來繼續找怎樣

python爬取網易雲音樂資料

1.首先匯入2個第三方庫，json庫是標準庫，用到的有Requests庫，Beautisoup庫，json庫 2.分析網站，當然是f12 開發者工具了，firefox瀏覽器的開發者工具個人用著比chrome的好用一點。用開發者工具之前要先明白你要找什麼資料，我想抓取的是霹靂布袋戲的

爬取網易雲音樂MP3連結指令碼

程式碼部分 #Python 3.5 #Author: A_lPha #Blog: http://blog.csdn.net/a_lpha import json from urllib.request import urlopen from ur

python爬取網易雲音樂，python下載網易雲音樂

import requests import time import os from urllib import request from bs4 import BeautifulSoup import urllib class Wy: page = 0 wymusic = {}

爬取網易雲音樂“三部曲”（一）：爬取歌手資訊！

提到歌神張學友，大家可能不會陌生或者說是如雷貫耳，他可是有著逃犯殺手之稱，這不明天1月11號是他2019世界巡迴演唱會《香港站》的開辦日期，不知香港警方有沒有做好抓逃犯的準備【手動滑稽】。對於歌神明天的演唱會，小編其實挺嚮往的，只是奈何年底了，天天要工作，作為一個程式猿，這也是沒辦法的，為了排遣內心

爬取網易雲音樂“三部曲”（三）：輕鬆下載網易音樂歌曲！

本文是承接前兩文章而來，前兩篇文章我們收集了歌手資訊和歌詞，可是光有歌手資訊和歌詞沒有歌曲怎麼行，沒有歌曲怎麼知道音調，這讓人怎麼學？怎麼聽？這不耍流氓嘛？為了向大家證明小編不是耍流氓，是耍無賴，我決定教大家直接把網易雲音樂歌手的熱門歌曲全部免費下載下來。除了已經下架不在網易資料庫的，其他的都能全部

爬取網易雲音樂“三部曲”（二）：獲取網易雲音樂歌手歌詞！

上一篇文章爬取了歌手的姓名和歌手的 id ，這篇文章根據上篇爬取的歌手 id 來直接下載對應歌手的歌詞。這些我其實可以寫成一個大專案，把這個大專案拆成小專案一來方便大家的理解，二來小專案都會了的話，拼在一起就是一個完整的專案了。上篇文章沒學會的也不要緊，私信小編可以獲取上次的爬取結果 c

Scrapy爬取網易雲音樂和評論（一、思路分析）

目錄：前提： scrapy這個框架很多人用過，網上教程也很多，但大多就是爬爬小說這種比較簡單且有規律的，網易雲音樂也有很多人寫過，也有API，不過大多是爬取了熱門歌曲，或是從歌單下手，但是考慮到歌單會有很多重複的。當然，從歌手頁的話，如果

用python爬取網易雲音樂，新手看了也能操作

今天小編帶大家一起來利用Python爬取網易雲音樂，分分鐘將網站上的音樂down到本地。跟著小編執行過程式碼的筒子們將網易雲歌詞抓取下來已經不再話下了，在抓取歌詞的時候在函式中傳入了歌手ID和歌曲名兩個引數，其實爬取歌曲也是同樣的道理，也需要傳入這兩個引數，只不過網易雲歌曲的

使用python-aiohttp爬取網易雲音樂

通過上文《使用python-aiohttp搭建微信公眾平臺》，我們已經可以響應來自微信伺服器的請求，接下來，我們為公眾號增加一個線上點歌的功能。由於本人平時聽歌用的是網易雲音樂，所以就在網上搜了一下，還真找到不少，再考慮到這裡只需要用到網易雲音樂的關鍵詞搜尋

Python爬取網易雲音樂熱門評論

import requests import json def get_hot_comments(res): comments_json = json.loads(res.text) hot_comments = comments_json['hotComm

爬取網易雲音樂所有歌單資訊

效果

中間遇到的問題

selenium 獲取到了下一頁的元素資訊，但是點選失敗

相關推薦