1. 程式人生 > >管理統計學第一次作業

管理統計學第一次作業

mac 2010年 services 標準 數組 項目 封裝 wid science

一、軟件簡介

1 .SPSS

SPSS簡介:SPSS全稱Statistical Product and Service Solutions,是一款"統計產品與服務解決方案"軟件。最初軟件全稱為"社會科學統計軟件包"(SolutionsStatistical Package for the Social Sciences),但是隨著SPSS產品服務領域的擴大和服務深度的增加,SPSS公司已於2000年正式將英文全稱更改為"統計產品與服務解決方案",標誌著SPSS的戰略方向正在做出重大調整。為IBM公司推出的一系列用於統計學分析運算、數據挖掘、預測分析和決策支持任務的軟件產品及相關服務的總稱SPSS,有Windows和Mac OS X等版本。

技術分享

SPSS發展歷史:

1968年:斯坦福大學三位學生創建了SPSS

1968年:誕生第一個用於大型機的統計軟件

1975年:在芝加哥成立SPSS總部

1984年:推出用於個人電腦的SPSS/PC+

1992年:推出Windows版本,同時全球自SPSS 11.0起,SPSS全稱為"Statistical Product and Service Solutions",即"統計產品和服務解決方案"

2009年:SPSS公司宣布重新包裝旗下的SPSS產品線,定位為預測統計分析軟件(Predictive Analytics Software)PASW,包括四部分:

PASW Statistics (formerly SPSS Statistics):統計分析

PASW Modeler (formerly Clementine) :數據挖掘

Data Collection family (formerly Dimensions):數據收集

PASW Collaboration and Deployment Services (formerly Predictive Enterprise Services):企業應用服務

2010年:隨著SPSS公司被IBM公司並購,各子產品家族名稱前面不再以PASW為名,修改為統一加上IBM SPSS字樣

SPSS頁面一覽:

技術分享技術分享技術分享

2.R語言

R語言簡介:R是用於統計分析、繪圖的語言和操作環境。R是屬於GNU系統的一個自由、免費、源代碼開放的軟件,它是一個用於統計計算和統計制圖的優秀工具。

R語言發展歷史:R是統計領域廣泛使用的誕生於1980年左右的S語言的一個分支。可以認為R是S語言的一種實現。而S語言是由AT&T貝爾實驗室開發的一種用來進行數據探索、統計分析和作圖的解釋型語言。最初S語言的實現版本主要是S-PLUS。S-PLUS是一個商業軟件,它基於S語言,並由MathSoft公司的統計科學部進一步完善。後來Auckland大學的Robert Gentleman和Ross Ihaka及其他誌願人員開發了一個R系統。由"R開發核心團隊"負責開發。 R是基於S語言的一個GNU項目,所以也可以當作S語言的一種實現,通常用S語言編寫的代碼都可以不作修改的在R環境下運行。 R的語法是來自Scheme。R的使用與S-PLUS有很多類似之處,這兩種語言有一定的兼容性。S-PLUS的使用手冊,只要稍加修改就可作為R的使用手冊。所以有人說:R,是S-PLUS的一個"克隆"。

R語言功能:

R是一套完整的數據處理、計算和制圖軟件系統。其功能包括:數據存儲和處理系統;數組運算工具(其向量、矩陣運算方面功能尤其強大);完整連貫的統計分析工具;優秀的統計制圖功能;簡便而強大的編程語言:可操縱數據的輸入和輸出,可實現分支、循環,用戶可自定義功能。技術分享貝爾實驗室

與其說R是一種統計軟件,還不如說R是一種數學計算的環境,因為R並不是僅僅提供若幹統計程序、使用者只需指定數據庫和若幹參數便可進行一個統計分析。R的思想是:它可以提供一些集成的統計工具,但更大量的是它提供各種數學計算、統計計算的函數,從而使使用者能靈活機動的進行數據分析,甚至創造出符合需要的新的統計計算方法。

該語言的語法表面上類似 C,但在語義上是函數設計語言(functional programming language)的變種並且和Lisp以及APL有很強的兼容性。特別的是,它允許在"語言上計算"(computing on the language)。這使得它可以把表達式作為函數的輸入參數,而這種做法對統計模擬和繪圖非常有用。

R是一個免費的自由軟件,它有UNIX、LINUX、MacOS和WINDOWS版本,都是可以免費下載和使用的。在那兒可以下載到R的安裝程序、各種外掛程序和文檔。在R的安裝程序中只包含了8個基礎模塊,其他外在模塊可以通過CRAN獲得。

R的原代碼可自由下載使用,亦有已編譯的執行檔版本可以下載,可在多種平臺下運行,包括UNIX(也包括FreeBSD和Linux)、Windows和MacOS。 R主要是以命令行操作,同時有人開發了幾種圖形用戶界面。

R內含多種統計學及數字分析功能。因為S的血緣,R比其他統計學或數學專用的編程語言有更強的物件導向(面向對象程序設計)功能。

R的另一強項是繪圖功能,制圖具有印刷的素質,也可加入數學符號。

雖然R主要用於統計分析或者開發統計相關的軟體,但也有人用作矩陣計算。其分析速度可媲美GNU Octave甚至商業軟件MATLAB。

R的功能能夠通過由用戶撰寫的套件增強。增加的功能有特殊的統計技術、繪圖功能,以及編程界面和數據輸出/輸入功能。這些軟件包是由R語言、LaTeX、Java及最常用C語言和Fortran撰寫。下載的執行檔版本會連同一批核心功能的軟件包,而根據CRAN紀錄有過千種不同的軟件包。其中有幾款較為常用,例如用於經濟計量、財經分析、人文科學研究以及人工智能。

3.STATA

STATA簡介:新版本的STATA采用最具親和力的窗口接口,使用者自行建立程序時,軟件能提供具有直接命令式的語法。Stata提供完整的使用手冊,包含統計樣本建立、解釋、模型與語法、文獻等超過一萬余頁的出版品。

除此之外,Stata軟件可以透過網絡實時更新每天的最新功能,更可以得知世界各地的使用者對於STATA公司提出的問題與解決之道。使用者也可以透過Stat技術分享軟件logoa Journal獲得許許多多的相關訊息以及書籍介紹等。另外一個獲取龐大資源的管道就是Statalist,它是一個獨立的listserver,每月交替提供使用者超過1000個訊息以及50個程序。

STATAS功能:1.STATA統計功能很強,除了傳統的統計分析方法外,還收集了近20年發展起來的新方法,如Cox比例風險回歸,指數與Weibull回歸,多類結果與有序結果的logistic回歸,Poisson回歸,負二項回歸及廣義負二項回歸,隨機效應模型等。具體說, Stata具有如下統計分析能力:

數值變量資料的一般分析:參數估計,t檢驗,單因素和多因素的方差分析,協方差分析,交互效應模型,平衡和非平衡設計,嵌套設計,隨機效應,多個均數的兩兩比較,缺項數據的處理,方差齊性檢驗,正態性檢驗,變量變換等。

分類資料的一般分析:參數估計,列聯表分析 ( 列聯系數,確切概率 ) ,流行病學表格分析等。

等級資料的一般分析:秩變換,秩和檢驗,秩相關等

相關與回歸分析:簡單相關,偏相關,典型相關,以及多達數十種的回歸分析方法,如多元線性回歸,逐步回歸,加權回歸,穩鍵回歸,二階段回歸,百分位數 ( 中位數 ) 回歸,殘差分析、強影響點分析,曲線擬合,隨機效應的線性回歸模型等。

其他方法:質量控制,整群抽樣的設計效率,診斷試驗評價, kappa等。

2.Stata的作圖功能,主要提供如下八種基本圖形的制作 : 直方圖(histogram),條形圖(bar),百分條圖 (oneway),百分圓圖(pie),散點圖(two way),散點圖矩陣(matrix),星形圖(star),分位數圖。這些圖形的巧妙應用,可以滿足絕大多數用戶的統計作圖要求。在有些非繪圖命令中,也提供了專門繪制某種圖形的功能,如在生存分析中,提供了繪制生存曲線圖,回歸分析中提供了殘差圖等。

3.Stata的矩陣運算功能。矩陣代數是多元統計分析的重要工具, Stata提供了多元統計分析中所需的矩陣基本運算,如矩陣的加、積、逆、 Cholesky分解、 Kronecker內積等;還提供了一些高級運算,如特征根、特征向量、奇異值分解等;在執行完某些統計分析命令後,還提供了一些系統矩陣,如估計系數向量、估計系數的協方差矩陣等。

4.PYTHON

Python簡介:是一種面向對象、解釋型計算機程序設計語言,由Guido van Rossum於1989年底發明,第一個公開發行版發行於1991年,Python 源代碼同樣遵循 GPL(GNU General Public License)協議。Python語法簡潔而清晰,具有豐富和強大的類庫。它常被昵稱為膠水語言,能夠把用其他語言制作的各種模塊(尤其是C/C++)很輕松地聯結在一起。常見的一種應用情形是,使用Python快速生成程序的原型(有時甚至是程序的最終界面),然後對其中有特別要求的部分,用更合適的語言改寫,比如3D遊戲中的圖形渲染模塊,性能要求特別高,就可以用C/C++重寫,而後封裝為Python可以調用的擴展類庫。需要註意的是在您使用擴展類庫時可能需要考慮平臺問題,某些可能不提供跨平臺的實現。

Phtyon特點:1簡單:Python是一種代表簡單主義思想的語言。閱讀一個良好的Python程序就感覺像是在讀英語一樣。它使你能夠專註於解決問題而不是去搞明白語言本身。

易學:Python極其容易上手,因為Python有極其簡單的語法。

2免費、開源:Python是FLOSS(自由/開放源碼軟件)之一。使用者可以自由地發布這個軟件的拷貝、閱讀它的源代碼、對它做改動、把它的一部分用於新的自由軟件中。FLOSS是基於一個團體分享知識的概念。

3高層語言:用Python語言編寫程序的時候無需考慮諸如如何管理你的程序使用的內存一類的底層細節。

4可移植性:由於它的開源本質,Python已經被移植在許多平臺上(經過改動使它能夠工作在不同平臺上)。這些平臺包括Linux、Windows、FreeBSD、Macintosh、Solaris、OS/2、Amiga、AROS、AS/400、BeOS、OS/390、z/OS、Palm OS、QNX、VMS、Psion、Acom RISC OS、VxWorks、PlayStation、Sharp Zaurus、Windows CE、PocketPC、Symbian以及Google基於linux開發的android平臺。

5解釋性:一個用編譯性語言比如C或C++寫的程序可以從源文件(即C或C++語言)轉換到一個你的計算機使用的語言(二進制代碼,即0和1)。這個過程通過編譯器和不同的標記、選項完成。

運行程序的時候,連接/轉載器軟件把你的程序從硬盤復制到內存中並且運行。而Python語言寫的程序不需要編譯成二進制代碼。你可以直接從源代碼運行 程序。

在計算機內部,Python解釋器把源代碼轉換成稱為字節碼的中間形式,然後再把它翻譯成計算機使用的機器語言並運行。這使得使用Python更加簡單。也使得Python程序更加易於移植。

6面向對象:Python既支持面向過程的編程也支持面向對象的編程。在“面向過程”的語言中,程序是由過程或僅僅是可重用代碼的函數構建起來的。在“面向對象”的語言中,程序是由數據和功能組合而成的對象構建起來的。

7可擴展性:如果需要一段關鍵代碼運行得更快或者希望某些算法不公開,可以部分程序用C或C++編寫,然後在Python程序中使用它們。

8可嵌入性:可以把Python嵌入C/C++程序,從而向程序用戶提供腳本功能。

9豐富的庫:Python標準庫確實很龐大。它可以幫助處理各種工作,包括正則表達式、文檔生成、單元測試、線程、數據庫、網頁瀏覽器、CGI、FTP、電子郵件、XML、XML-RPC、HTML、WAV文件、密碼系統、GUI(圖形用戶界面)、Tk和其他與系統有關的操作。這被稱作Python的“功能齊全”理念。除了標準庫以外,還有許多其他高質量的庫,如wxPython、Twisted和Python圖像庫等等。

10規範的代碼:Python采用強制縮進的方式使得代碼具有較好可讀性。而Python語言寫的程序不需要編譯成二進制代碼。

二、操作演示

1打開文件

技術分享

技術分享

2排序

技術分享

3新增變量

技術分享

4合並文件

技術分享

5使用函數

技術分享

管理統計學第一次作業