1. 程式人生 > >python資料分析常用函式

python資料分析常用函式

for語句的基本格式

python for迴圈的一般格式:第一行是要先定義一個賦值目標(迭代變數),和要遍歷(迭代)的對像;首行後面是要執行的語句塊。

for 目標 in 對像:
    print 賦值目標


1.for迴圈字串操作

>>>a = 'iplaypython.com'
>>>for i in a:
>>>    print i

案例中的 i 相當於目標,字串變數a是遍歷(迭代)對像。當執行for迴圈語句時,每一次迭代時,i 都會從遍歷(迭代)對像a中接收一個新值輸出。結束迴圈後,目標(迭代變數)會保留最後一個值。

2.for 迴圈元組賦值

in後面的是一個元祖陣列,比如這種 [(1,2),(3,4),(5,6)]

>>>x =[('hello','python'),('very','good')]
>>>for (a,b) in x:
>>>    print (a,b)
('hello', 'python')
('very', 'good')

3.scipy匯入檔案

scipy.io.loadmat(file_name, mdict=None, appendmat=True, **kwargs)

4.numpy.mean()陣列求均值計算

numpy.mean(a, axis=None
, dtype=None, out=None, keepdims=<class numpy._globals._NoValue at 0x40b6a26c>

a--------------運算矩陣

axis----axis後面的值是指定一個軸做運算
eg:
>>> a = np.array([[1, 2], [3, 4]])
>>> np.mean(a)
2.5
>>> np.mean(a, axis=0)
array([ 2.,  3.])
>>> np.mean(a, axis=1)
array([ 1.5,  3.5])


5.python中enumerate()函式的使用

  • enumerate()是python的內建函式
  • enumerate在字典上是列舉、列舉的意思
  • 對於一個可迭代的(iterable)/可遍歷的物件(如列表、字串),enumerate將其組成一個索引序列,利用它可以同時獲得索引和值
  • enumerate多用於在for迴圈中得到計數
5.1----------如果對一個列表,既要遍歷索引又要遍歷元素時,首先可以這樣寫:
list1 = ["這", "是", "一個", "測試"]
for i in range (len(list1)):
    print i ,list1[i]
5.2---------------------上述方法有些累贅,利用enumerate()會更加直接:
list1 = ["這", "是", "一個", "測試"]
for index, item in enumerate(list1):
    print index, item
>>>
012 一個
3 測試
5.3-----------------enumerate還可以接收第二個引數,用於指定索引起始值,如:
list1 = ["這", "是", "一個", "測試"]
for index, item in enumerate(list1, 1):
    print index, item
>>>
123 一個
4 測試

5.4------------若統計檔案的行數,可以這樣寫:

count = len(open(filepath, 'r').readlines())

這種方法簡單,但是可能比較慢,當檔案比較大時甚至不能工作。

可以利用enumerate():

count = -1 
for index, line in enumerate(open(filepath,'r')): 
    count += 1