1. 程式人生 > >python進階之資料分析與展示(一)

python進階之資料分析與展示(一)

資料分析之前奏

Anaconda IDE的使用方法


  • 一個數據表達一個含義,一組資料表達一個或多個含義。

  • 摘要

    • 有損地提取資料特徵的過程。
    • 基本統計(含排序)。
    • 分佈/累計統計。
    • 資料特徵。
    • 相關性、週期性等。
    • 資料探勘(形成知識)。
  • Anaconda(下載地址

    • 開源免費
    • 支援近800個第三方庫
    • 包含多個主流工具
    • 適合資料計算領域開發
    • Win/Linux/OS X
    • Anaconda是一個整合各類Python工具的整合平臺。
    • anaconda:一個集合,包括conda、某版本Python、一批第三方庫等。
  • conda

    • 用於包管理和環境管理的工具。
    • 包管理與pip類似,管理Python第三方庫。
    • 環境管理能夠允許使用者使用不同版本Python,並能靈活切換。
    • conda將工具、第三方庫、 Python版本、 conda都當作包,同等對待。
    • Win平臺:cmd,執行 conda ‐‐version 獲取conda版本。
    • Win平臺:cmd,執行 conda update conda 升級conda。
  • IPython

    • 一個功能強大的互動式shell。
    • 適合進行互動式資料視覺化和GUI相關應用。
    • 變數前或後增加?號,將顯示一些通用資訊,包括函式對應的原始碼。
    • %run用於執行.py程式,%run在一個空的名稱空間執行%。
    • IPython的%魔術命令
      • %magic
        • 顯示所有魔術命令。
      • %hist
        • IPython命令的輸入歷史 。
      • %pdb
        • 異常發生後自動進入偵錯程式。
      • %reset
        • 刪除當前名稱空間中的全部變數或名稱
      • %who
        • 顯示Ipython當前名稱空間中已經定義的變數。
      • %time statement
        • 給出程式碼的執行時間, statement表示一段程式碼。
      • %timeit statement
        • 多次執行程式碼,計算綜合平均執行時間。