1. 程式人生 > >資料分析入門

資料分析入門

資料分析的概念

1.字面的意思就是對資料進行分析,專業的解釋是:利用適當統計利用適當統計分析方法對大量資料進行分析,總結出內在規律,為未來提供判斷和決策

2.資料分析的6部曲:

  • 明確分析目的和內容

  • 資料收據

  • 資料處理

  • 資料分析

  • 資料展現

  • 資料撰寫

常用分析庫的介紹

  

  • numpy;最基礎的庫,高效的操作矩陣/多維陣列;比list 更加高效

  • Scipy;升級科學運算庫

  • Pandas

    • 科學運算工具

    • 檔案操作工具

  • Matplotlib:繪圖工具

Anaconda的安裝和使用

  

  一.虛擬環境管理 和安裝:virtualenv (windows)

  1. pip install virtualenv

  2. pip install virtualenvwrapper-win

  3. 建立 mkvirtualenv 環境名字

  4. 編列/切換:workon 名字

  5. 退出: deactivate

  6. 進入虛擬環境:workon 環境名

  7. 刪除:rmvirtualenv 名字

  8. 列出所有:lsvirtualenv或workon

  9. 進入所在目錄:cdvirtualenv

  10. 安裝軟體:pip install /remove/update 包名=版本號

  二,Anaconda的優點

python的升級版

  1. 優點包管理,內建180多個數據分析和人工智慧相關的庫

  2. 優點;管理虛擬環境

  3. 3.anaconda 環境變數操作步驟:
      1. 建立 conda create -n 環境名 python=3/2
      2. 列表 conda env list
      3. 進入/退出 activate 名 deactivate
      4. 檢視包列表: conda list
      5. 安裝: conda install 包名=版本號 (不指定預設最新版)
      6. 刪除/更新包: conda remove/update 包名
      7. 刪除虛擬環境: 直接刪除虛擬環境檔案!!conda remove -n 名字 --all