1. 程式人生 > >數據挖掘與算法 第三次作業

數據挖掘與算法 第三次作業

分享圖片 get 數據挖掘 遍歷 div 出現的次數 性別 重復 索引

練習一:總結列表,元組,字典,集合的聯系與區別

列表:是Python中最基本的數據結構,序列中的每個元素都分配一個數字- 它的位置,或索引,第一個索引是0,第二個索引是1,依此類推。列表元素可以修改,允許重復項存在,它是有序的:排列順序不同,兩個列表就判定為不相等

集合:1.set()為可改集合,frozenset() 是不可改集合 2.不同類型的變量組合 3.不允許重復項 4.無序的:排列順序不同,只要包含內容相同,就判定為兩集合相等

元組:元組也是存一組數據,只是一旦創建,便不能修改,所以又叫只讀列表。元組創建很簡單,只需要在括號中添加元素,並使用逗號隔開即可,包含零個或多任意類型元素

字典:字典是另一種可變容器模型,且可存儲任意類型對象,字典的每個鍵值對()用冒號(:)分割,每個對之間用逗號(,)分割,整個字典包括在花括號({})中 ,鍵值對集合,鍵必須唯一

練習二:列表,元組,字典,集合的遍歷

代碼:

#(1)遍歷列表
print(列表的遍歷:)
a=[5,4,6];
for i in a:
    print(i);

#(2)遍歷元組
print(元組的遍歷:)
a=(4,5,8);
for i in a:
   print(i);

#(3)遍歷集合
print(集合的遍歷:)
a={3,7,4}
for i in a:
    print(i);

#(4)遍歷字典 print(字典的遍歷:) a={"姓名":"張三","性別":"","學號":20160605556}; for key in a.keys(): print(key,":",a.get(key));

運行結果:

技術分享圖片

練習三:英文詞頻統計

代碼:

#下載一首英文的歌詞或文章str
str=‘‘‘Baby, baby, baby nooo 
My baby, baby, baby noo 
My baby, baby, baby nooo 
I thought youd always be mine mine 
Baby, baby, baby nooo 
My baby, baby, baby noo 
My baby, baby, baby nooo
‘‘‘ print(str); #把單詞全部變成小寫 print(str.lower()); #分隔出一個一個的單詞 list print(str.split()) #統計每個單詞出現的次數 print("統計每個單詞出現的次數為:") strSet=set(str.split()) for word in strSet: print(word,str.split().count(word))

運行結果:

技術分享圖片

數據挖掘與算法 第三次作業