1. 程式人生 > >複習小結3-資料結構

複習小結3-資料結構

Series資料結構
    實際上是介紹一些Series的基本屬性,和結構之間的關聯並不大
    
    #製造Series  
    #可以直接用list傳入資料,或者傳入字典或標量  
    import pandas as P
    import numpy as N

    s1 = P.Series([1,2,3,4])
    s2 = P.Series({'A':1,'B':2,'C':3})
    s3 = P.Series(N.random.randn(10))
    #索引
    s[tag or location]
    #加入新資料,類似dataframe加入新列的操作(本質接近,都是加入一個低緯度的單位資料)
    #s3[10]=100

    #標籤對齊
    我覺得這個翻譯也不太好,這個更接近與一些標籤的匹配特性
    實際意義就是如果兩個Series相結合,index相同的會放在一起處理,不同的會分開並且與nan一起處理
#DataFrame資料結構
    #傳入DataFrame,可以傳入行列表,字典或者多維元祖
        #d1 = [1,2,3,4]
        d = [[1,2,3,4],[5,6,7]]
        d_1 = P.DataFrame(d,index = ['one','two'],columns = ['a','b','c','d'])

        d_2= {'A':[1,2,3],'B':[1,2,4],'C':[6,1,7]}#key為列標籤元素的維度必須相同,否則報錯
        d2 = P.DataFrame(d_2,index)

        d_3 = {('a','b'):{('A','B'):3,('A','C'):4},
       ('a','c'):{('A','B'):3,('A','D'):5}
    
        }
        d3 = P.DataFrame(d_3)#用多維元祖有點抽象,大概意思是字典內的key是分類,value的字典也是分類,傳入後,pandas會自動對有分類的填充對應值,沒有對應值的則填入nan