1. 程式人生 > >python第七週,二維資料的格式化和處理

python第七週,二維資料的格式化和處理

二維資料的表示:

類表型別可以表示二維資料

[   [424,23423,2342],[131,535,3646]  ]

使用兩層for迴圈可以便利每個元素

外層列表中每個元素可以對應一行,也可以對應一列

一維資料分為列表和集合型別,二維資料只有列表型別

CSV資料儲存格式

國際通用的一二維資料儲存格式,一般.csv副檔名,每行一個一維資料,採用逗號分隔,無空行

Excel軟體可讀入輸出,一般編輯軟體都可以產生,如果某個元素缺失,逗號仍要保留,

二維資料的表頭可以作為資料儲存,也可以另行儲存,

一般索引習慣,ls[row][cokumn],先行後列

二維資料的處理:

從CSV格式的檔案中讀入資料

fo = open(fname)
ls = []
for line in fo:
    line = line.replace("\n","")
    ls.append(line.split(","))
fo.close()

二維資料的寫入處理

ls = [[],[],[]]
f = open (fname,'w')
for item in ls:
    f.write(','.join(item) + '\n')
f.close()

二維資料的逐一處理:

ls = [[],[],[]]
for row in ls:
    for column in row:
        print(ls[row][column])

wordcloud庫的使用:

cmd 命令列:pip install wordcloud

wordcloud.WordCloud()代表一個文字對應的詞雲

wordcloud庫常規方法

w=wordcloud.WordCloud()

方法 描述
w.generate(txt)

向物件w中載入文字txt,

>>>w.generate("afwawfawf")

w.to_file(filename)

將詞雲輸出為影象檔案,.png或.jpg

>>>w.to_file("outfile.png")

配置物件引數:

引數 描述
width

指定詞雲物件生成圖片的寬度,預設400畫素

>>>w = wordcloud.WordCloud(width=600)

height 高度,預設200
min_font_size 指定詞雲中字型的最小字號,預設4號
max_font_size 最大字號,根據高度自動調節
fount_step 指定詞雲中字型字號的步進間隔預設為1
fount_path

指定字型檔案的路徑,預設None

>>>w =wordcloud.WordCloud(font_path="msyh.ttc")

max_words 指定詞雲最大單詞數量,預設20
stop_words 指定詞雲的排除詞列表,
mask

指定詞雲形狀,預設為長方形,需要引用imread()函式

>>>from scipy.misc import imread

>>>mk = imread("pic.png")

>>>w = wordcloud.WordCloud(mask=mk)

background_color 指定詞雲圖片的背景顏色,預設為黑色