python第七週,二維資料的格式化和處理
阿新 • • 發佈:2019-01-04
二維資料的表示:
類表型別可以表示二維資料
[ [424,23423,2342],[131,535,3646] ]
使用兩層for迴圈可以便利每個元素
外層列表中每個元素可以對應一行,也可以對應一列
一維資料分為列表和集合型別,二維資料只有列表型別
CSV資料儲存格式
國際通用的一二維資料儲存格式,一般.csv副檔名,每行一個一維資料,採用逗號分隔,無空行
Excel軟體可讀入輸出,一般編輯軟體都可以產生,如果某個元素缺失,逗號仍要保留,
二維資料的表頭可以作為資料儲存,也可以另行儲存,
一般索引習慣,ls[row][cokumn],先行後列
二維資料的處理:
從CSV格式的檔案中讀入資料
fo = open(fname)
ls = []
for line in fo:
line = line.replace("\n","")
ls.append(line.split(","))
fo.close()
二維資料的寫入處理
ls = [[],[],[]]
f = open (fname,'w')
for item in ls:
f.write(','.join(item) + '\n')
f.close()
二維資料的逐一處理:
ls = [[],[],[]] for row in ls: for column in row: print(ls[row][column])
wordcloud庫的使用:
cmd 命令列:pip install wordcloud
wordcloud.WordCloud()代表一個文字對應的詞雲
wordcloud庫常規方法
w=wordcloud.WordCloud()
方法 | 描述 |
w.generate(txt) |
向物件w中載入文字txt, >>>w.generate("afwawfawf") |
w.to_file(filename) |
將詞雲輸出為影象檔案,.png或.jpg >>>w.to_file("outfile.png") |
配置物件引數:
引數 | 描述 |
width |
指定詞雲物件生成圖片的寬度,預設400畫素 >>>w = wordcloud.WordCloud(width=600) |
height | 高度,預設200 |
min_font_size | 指定詞雲中字型的最小字號,預設4號 |
max_font_size | 最大字號,根據高度自動調節 |
fount_step | 指定詞雲中字型字號的步進間隔預設為1 |
fount_path |
指定字型檔案的路徑,預設None >>>w =wordcloud.WordCloud(font_path="msyh.ttc") |
max_words | 指定詞雲最大單詞數量,預設20 |
stop_words | 指定詞雲的排除詞列表, |
mask |
指定詞雲形狀,預設為長方形,需要引用imread()函式 >>>from scipy.misc import imread >>>mk = imread("pic.png") >>>w = wordcloud.WordCloud(mask=mk) |
background_color | 指定詞雲圖片的背景顏色,預設為黑色 |