1. 程式人生 > >資料分析入門(一)

資料分析入門(一)

資料分析入門

什麼是資料分析

  1. 字面:對資料進行分析;專業解釋:利用適當統計分析方法對大量資料進行分析,總結出內在規律,為未來提供判斷和決策

  2. 資料分析6部驟:

    • 明確分析目的和內容

    • 資料收據

    • 資料處理

    • 資料分析

    • 資料展現

    • 資料撰寫

    常用資料分析庫的介紹

    numpy;最基礎的庫,高效的操作矩陣/多維陣列;比list 更加高效

  • Scipy;升級科學運算庫

  • Pandas

    • 科學運算工具

    • 檔案操作工具

  • Matplotlib:繪圖工具

    Anaconda的安裝和使用

    • python基礎的開發環境:python3.x/python2.7

    • py36作用

      • python語法支援

        包管理:

        #安裝爬蟲框架
        pip install requests
        #web開發框架
        pip install django/Flak/Tornada
        • 虛擬環境管理 ;:virtualenv (windows)

          1. pip install virtualenv

          2. pip install virtualenvwrapper-win

          3. 建立 mkvirtualenv 環境名字

          4. 編列/切換:workon 名字

          5. 退出: deactivate

          6. 進入虛擬環境:workon 環境名

          7. 刪除:rmvirtualenv 名字

          8. 列出所有:lsvirtualenv或workon

          9. 進入所在目錄:cdvirtualenv

          10. 安裝軟體:pip install /remove/update 包名=版本號

    • Anaconda

      的優點

      python的升級版

      1. 優點包管理,內建180多個數據分析和人工智慧相關的庫

      2. 優點;管理虛擬環境

    • Anaconda值得是一個開源的python發行版本

    • 下載地址:https://www.anaconda.com/

    各種IDE切換虛擬環境

    1. pychar

    2. Anaconda

    3. Spyder