用Python製作詞雲——————python

阿新 • • 發佈：2019-01-04

昨天利用某個網站做了一個詞雲，感覺效果不錯，

在這裡插入圖片描述

於是想到之前看過有人用Python製作類似的圖片

我的環境：

Windows 10 教育版
Python 版本：Python 3.7.1
編譯器：Pycharm

簡單的詞雲

第一步，找到一段文字，這個是英劇"Yes, minister"的，維基百科上這部劇的介紹詞條。然後命名為 yes-minister.txt，將其和程式碼儲存在同一個資料夾下
在這裡插入圖片描述

第二步，安裝wordcloud庫
點選file->Settings…->Project:python->Project Interpreter
在這裡插入圖片描述

然後點選那個加號
在這裡插入圖片描述

點選之後，在搜尋欄裡輸入wordcloud，選中wordcloud，點選安裝
在這裡插入圖片描述

安裝成功後，就是來分析程式碼了(如果安裝失敗，請自行百度錯誤原因)
另外，我們還需要具有PIL庫

PIL：Python Imaging Library，python影象處理庫，這個庫支援多種檔案格式，並提供了強大的影象處理和圖形處理能力

程式碼如下，結果如下：

import PIL.Image as image
from wordcloud import WordCloud
filename = "yes-minister.txt"
with open(filename, 
'rb') as f:
    text = f.read()
text = text.decode('utf-8')
wordcloud = WordCloud().generate(text)
image_produce = wordcloud.to_image()
image_produce.show()

生成的圖雲是這樣子的：
在這裡插入圖片描述

怎麼樣，僅僅由九行的程式碼做成的，是不是很酷！

如果你是Python的初學者，或者對上邊的程式碼有不理解的地方，請繼續往下看（大佬請忽略）

讓我們一句一句的分析程式碼(自己也複習一下Python哈哈)：

import PIL.Image as 
 image
from wordcloud import WordCloud

import PIL.Image as image其中，as 保留字與 import 一起使用能夠改變後續程式碼中庫的名稱空間，有助於提高程式碼的可讀性。簡單地說，在程式的後續部分，image代替PIL.Image
from wordcloud import WordCloud,對wordcloud庫中的WordCloud函式可以直接採用WordCloud()形式使用

filename = "yes-minister.txt"
with open(filename) as f:
    text = f.read()

filename是需要開啟檔案的路徑，
點選檢視 python 使用 with open（） as，這個語句簡化了讀寫檔案的操作，詳情請點選檢視

text = text.decode('utf-8')
wordcloud = WordCloud().generate(text)
image_produce = wordcloud.to_image()
image_produce.show()

decode() 方法以 encoding 指定的編碼格式解碼字串。預設編碼為字串編碼。此處encoding是’utf-8’,點選檢視Python decode()方法

用 wordcloud.generate(text) 可以完成三項工作。

文字預處理
詞頻統計
將高頻詞以圖片形式進行彩色渲染

然後轉化為圖片(image_produce = wordcloud.to_image())，顯示(image_produce.show())就能看到了

在這裡插入圖片描述

自定義蒙版詞雲製作

import PIL.Image as image
from wordcloud import WordCloud
import imageio
file = "yes-minister.txt"
bg_pic = imageio.imread('water1.jpg')
#背景圖片
with open(file,'rb') as f:
    text = f.read()
text = text.decode('utf-8')
wordcloud = WordCloud(mask=bg_pic , background_color='white').generate(text)
wordcloud.to_file('3.jpg')
image_produce = wordcloud.to_image()
image_produce.show()

bg_pic = imageio.imread('water1.jpg') 讀入背景圖片
wordcloud = WordCloud(mask=bg_pic , background_color='white').generate(text)，設定詞雲的蒙版為bg_pic，背景為白色，然後根據text生成詞雲，效果如下
wordcloud.to_file('3.jpg') 儲存為名字為3.jpg的圖片
當然還有其他形式的

中文詞雲製作

來來來，先看一下程式碼，然後分析


# wordcloud 生成中文詞雲

import PIL.Image as image
import jieba
import matplotlib.pyplot as plt
from wordcloud import WordCloud
from imageio import imread

# 讀入妖神記的檔案 all.txt
with open("all.txt",'rb') as f:
    comment_text = f.read()
comment_text = comment_text.decode('utf-8')
# 結巴分詞，生成字串，如果不通過分詞，無法直接生成正確的中文詞雲
cut_text = " ".join(jieba.cut(comment_text))
color_mask = imread("water1.jpg")
cloud = WordCloud(
    # 設定字型，不指定的話會亂碼
    font_path="STSONG.TTF",
    # 設定背景色
    background_color="white",
    # 詞雲形狀
    mask=color_mask
)
# 產生詞雲
word_cloud = cloud.generate(cut_text)
# 儲存圖片
word_cloud.to_file("1.jpg")
image_produce = word_cloud.to_image()
image_produce.show()

效果如下：
在這裡插入圖片描述

附WordCloud的所有引數

font_path : string  //字型路徑，需要展現什麼字型就把該字型路徑+字尾名寫上，如：font_path = '黑體.ttf'
width : int (default=400)  //輸出的畫布寬度，預設為400畫素
height : int (default=200)  //輸出的畫布高度，預設為200畫素
prefer_horizontal : float (default=0.90) //詞語水平方向排版出現的頻率，預設 0.9 （所以詞語垂直方向排版出現頻率為 0.1 ）
mask : nd-array or None (default=None) //如果引數為空，則使用二維遮罩繪製詞雲。如果 mask 非空，設定的寬高值將被忽略，遮罩形狀被 mask 取代。除全白（#FFFFFF）的部分將不會繪製，其餘部分會用於繪製詞雲。如：bg_pic = imread('讀取一張圖片.png')，背景圖片的畫布一定要設定為白色（#FFFFFF），然後顯示的形狀為不是白色的其他顏色。可以用ps工具將自己要顯示的形狀複製到一個純白色的畫布上再儲存，就ok了。
scale : float (default=1) //按照比例進行放大畫布，如設定為1.5，則長和寬都是原來畫布的1.5倍。
min_font_size : int (default=4) //顯示的最小的字型大小
font_step : int (default=1) //字型步長，如果步長大於1，會加快運算但是可能導致結果出現較大的誤差。
max_words : number (default=200) //要顯示的詞的最大個數
stopwords : set of strings or None //設定需要遮蔽的詞，如果為空，則使用內建的STOPWORDS
background_color : color value (default=”black”) //背景顏色，如background_color='white',背景顏色為白色。
max_font_size : int or None (default=None) //顯示的最大的字型大小
mode : string (default=”RGB”) //當引數為“RGBA”並且background_color不為空時，背景為透明。
relative_scaling : float (default=.5) //詞頻和字型大小的關聯性
color_func : callable, default=None //生成新顏色的函式，如果為空，則使用 self.color_func
regexp : string or None (optional) //使用正則表示式分隔輸入的文字
collocations : bool, default=True //是否包括兩個詞的搭配
colormap : string or matplotlib colormap, default=”viridis” //給每個單詞隨機分配顏色，若指定color_func，則忽略該方法。
fit_words(frequencies) //根據詞頻生成詞雲
generate(text) //根據文字生成詞雲
generate_from_frequencies(frequencies[, ...]) //根據詞頻生成詞雲
generate_from_text(text) //根據文字生成詞雲
process_text(text) //將長文字分詞並去除遮蔽詞（此處指英語，中文分詞還是需要自己用別的庫先行實現，使用上面的 fit_words(frequencies) ）
recolor([random_state, color_func, colormap]) //對現有輸出重新著色。重新上色會比重新生成整個詞雲快很多。
to_array() //轉化為 numpy array
to_file(filename) //輸出到檔案

用Python製作詞雲——————python

昨天利用某個網站做了一個詞雲，感覺效果不錯，於是想到之前看過有人用Python製作類似的圖片我的環境： Windows 10 教育版 Python 版本：Python 3.7.1 編譯器：Pycharm 簡單的詞雲第一步，找到一段

如何用Python 製作詞雲-對1000首古詩做詞雲分析

> **公號：碼農充電站pro** > **主頁：** ![在這裡插入圖片描述](https://img-blog.csdnimg.cn/20201212230904594.png?) 今天來介紹一下如何使用 **Python** 製作**詞雲**。詞雲又叫文字雲，它可以統計文字中頻率較高的詞，並將這

海賊王、火影和死神三大經典動漫，用Python做詞雲視覺化帶你分析

這篇文章，要帶你們去一個神奇的國度，一個可以在二維生活的神奇國度。你準備好了嗎？對於動漫愛好者來說，海賊王、火影、死神三大動漫神作你肯定肯定不陌生了。小編身邊很多的同事仍然深愛著這些經典神作，可見“中毒”至深。今天小編利用Python大法帶大家分析一下這些神作，看看這些神作到底在講些神馬

Python生成詞雲的製作

本文出自部落格Vander丶CSDN部落格，如需轉載請標明出處，尊重原創謝謝什麼是詞雲? 詞雲又叫文字雲,是對文字資料中出現頻率較高的”關鍵字”在視覺上的突出呈現,形成

python生成詞雲

cloud arr 文本 [0 mas func word .text ges 期末復習比較忙過段時間來專門寫scrapy框架使用，今天介紹如何用python生成詞雲，雖然網上有很多詞雲生成工具，不過自己用python來寫是不是更有成就感。今天要生成的是勵誌歌曲的詞雲，百

Ubuntu的中文是哪種字型？python的詞雲分析和三國演義人物出場統計

Ubuntu的預設中文是哪種呢？ fc-list :lang=zh 用這個命令查看出來 NotoSerifCJK-Bold.ttc 為什麼要知道這個呢？來看一塊python3程式碼 import jieba import wordcloud f = op

一步一步教你如何用Python做詞雲

前言在大資料時代，你竟然會在網上看到的詞雲，例如這樣的。 Python學習資料或者需要程式碼、視訊加Python學習群：960410445 看到之後你是什麼感覺?想不想自己做一個？如果你的答案是正確的，那就不要拖延了，現在我們就開始，做一個詞雲分析圖，Python是一個當下

Python生成詞雲——WordCount入門

主要內容：介紹詞雲用Python的WordCount包實現詞雲詞雲關鍵詞的視覺化描述；圖形視覺化；用於彙總使用者生成的標籤或一個網站的文字內容；重要程度能通過改變字型大小或顏色來表現；大多數標籤本身就是超級連結，直接指向與標籤相聯

Python之詞雲學習筆記

需要的主要模組：jieba中文分詞 wordcloud構建詞雲英文詞雲 from wordcloud import WordCloud string = 'Importance of relative word frequencies for font-size. With rela

一步一步教你如何用Python做詞雲！

前言在大資料時代，你竟然會在網上看到的詞雲，例如這樣的。看到之後你是什麼感覺?想不想自己做一個？如果你的答案是正確的，那就不要拖延了，現在我們就開始，做一個詞雲分析圖，Python是一個當下很流行的程式語言，你不僅可以用它做資料分析和視覺化，還能用來做網站、

python製作詞雲圖

開局10分鐘關於wordcloud庫的安裝問題在上一篇的部落格中已經介紹了，這篇主要和大家分享我學習使用wordcloud庫的一些經歷。 tips:需要注意的是使用wordcloud庫是依賴numpy庫和PIL庫的，因此需要提前安裝好這兩個庫。證據如下：開啟wordcloud.py

python實現詞雲效果

一、說明 wordcloud是Python中的一個小巧的詞雲生成器。繪製圖片是也通過第三方模組 pillow和matplotlib 實現的，因此需要安裝matplotlib和wordcloud模組 pip install wordcloud pip install matplot

python生成詞雲簡單案例

環境：python3.6 第三方庫：matplotlib、wordcloud、PIL 所需材料：一份英文love.txt檔案(裡面包含一篇英文文章)，一張心形圖片love.jpg 程式碼如下： from wordcloud import WordCloud imp

從安卓手機ROOT提取微信聊天記錄到利用Python進行詞雲分析全過程

剛剛來到了2018年，正值女票生日將近。想想這一年來我倆的聊天記錄也不少（匯出後一看十個月的微信文字聊天記錄將近8萬條 ^-^）,於是就有了將我們的聊天記錄匯出來製作成詞雲，或者分析一下她說的最多的一句話是什麼？還打算做個預測模型，輸入一個句子然後讓模型預測下是她說的還是我說的，哈哈，想想還有點小激

新技能 get —— 使用 python 生成詞雲

什麼是詞雲（word cloud）呢？詞雲又叫文字雲，是對文字資料中出現頻率較高的“關鍵詞”在視覺上的突出呈現，形成關鍵詞的渲染形成類似雲一樣的彩色圖片，從而一眼就可以領略文字資料的主要表達意思。 0. 常見詞雲生成工具從技術上來看，詞雲是一種有趣的資

Matplotlib學習---用wordcloud畫詞雲（Word Cloud）

tps named open 字符等等 png min 其余 https 畫詞雲首先需要安裝wordcloud（生成詞雲）和jieba（中文分詞）。先來說說wordcloud的安裝吧，真是一波三折。首先用pip install wordcloud出現錯誤，說需要安裝

統計QQ聊天記錄進階版（分詞+統計關鍵字出現的次數+根據詞頻製作詞雲）

繼上個部落格統計關鍵字次數的進階，將關鍵詞的次數製作成詞雲儲存到圖片。之前說過的部分現在就不說了，這裡主要講根據詞頻製作詞雲。1.安裝wordcloud（這裡要注意坑）這個安裝的過程比jieba複雜，因為直接用pip install wordcloud會安裝失敗，要先下載對應

python 3 阿里雲python sdk， PyCrypto無法安裝解決方法

開發環境：系統: w7 64位 python：python 3.6 32位步驟： 1、pip 安裝阿里雲核心sdk pip install aliyun-python-sdk-cor

用pyecharts繪製詞雲WordCloud

詞雲圖詞雲圖主要用熱詞的熱度進行視覺化。 WordCloud.add() 方法簽名 add(name, attr, value, shape=”circle”, word_gap=20, word_size_range=

用python爬取微博數據並生成詞雲

font 意思 extra 很多返回 json 自己技術分享 pre 很早之前寫過一篇怎麽利用微博數據制作詞雲圖片出來，之前的寫得不完整，而且只能使用自己的數據，現在重新整理了一下，任何的微博數據都可以制作出來，放在今天應該比較應景。一年一度的虐汪節，是繼續蹲在角落默

用Python製作詞雲——————python

簡單的詞雲

自定義蒙版詞雲製作

中文詞雲製作

相關推薦