【數據挖掘】數據集獲取
UCI:加州大學歐文分校開放的經典數據集,被很多數據挖掘實驗室采用。
http://archive.ics.uci.edu/ml/datasets.html
CEIC:超過128個國家的經濟數據,能精確查找GDP、進出口零售,銷售等深度數據。
http://www.ceicdata.com/zh-hans
國家數據:數據來源於中國國家統計局,包含了我國經濟民生等多個方面的數據。
http://data.stats.gov.cn/
中國統計信息網:國家統計局官方網站,匯集了國民經濟和社會發展統計信息。
http://www.tjcn.org/
優易數據:由國家信息中心發起,國內領先的數據交易平臺,很多免費數據。
http://www.youedata.com/
【數據挖掘】數據集獲取
相關推薦
【數據挖掘】數據集獲取
數據挖掘 零售 htm 銷售 ref cdata href 包含 stats UCI:加州大學歐文分校開放的經典數據集,被很多數據挖掘實驗室采用。 http://archive.ics.uci.edu/ml/datasets.html CEIC:超過128個國家的經濟數據,
【數據結構】並查集
tro 算法導論 src html target style 導論 span tony 【並查集】 為實現 在 不相交集合 上的操作 (1.合並兩個集合 2.查詢某個元素屬於哪個集合)而定義的一種數據結構 其實現有兩種方式:鏈表和有根樹
【數據結構】數據結構的概述
邏輯關系 安排 線性表 markdown 一個 ava auto nbsp log 一、概述 什麽是數據結構:數據:由有限的符號(比如,"0"和"1",具有其自己的結構、操作、和相應的語義)組成的元素的集合。結構:元素之間的關系的集合。數據結構:信息的一種組織方式,其目
【python之路】數據庫
pla mon 符號 lis student 5.1 cal 指定 cit 一、數據庫的簡介 1.數據庫 數據庫(database,DB)是指長期存儲在計算機內的,有組織,可共享的數據的集合。數據庫中的數據按一定的數字模型組織、描述和存儲,具有較小的冗余,較高的數據
【SQL server初級】數據庫性能優化三:程序操作優化
地球 解釋 spa 記錄 employ it168 等於 bsp 實現 數據庫優化包含以下三部分,數據庫自身的優化,數據庫表優化,程序操作優化.此文為第三部分 數據庫性能優化三:程序操作優化 概述:程序訪問優化也可以認為是訪問SQL語句的優化,一個好的SQL語句是
【計算機網絡基礎】數據鏈路層(目錄)
計算機網絡 劃分 靜態 控制 網橋 透明 回退 csma/cd 廣播 數據鏈路層知識結構 數據鏈路層組幀和透明傳輸 數據鏈路層差錯檢驗 奇偶校驗 循環冗余校驗(CRC) 海明碼 數據鏈路層可靠傳輸(ARQ協議) 停止-等待協議 回退N幀協議(GBN協議) 選擇重傳協
【開發者的精進】 數據驅動下的程序設計
數據庫數據 aaa bsp 服務器 就是 準備 結束 符號 int 寫在前面 大雪至,風紛飛,夜裏嗚聲伴秋葉,轉眼2017也快要過去了,時間在不停的走,事情在不停的做,今年的秋葉落盡了,明年的春芽也就不遠了吧。 縱觀程序千萬,ui、功能、語法、運算、框架,
數據挖掘的數據集資源 --轉載
ear odi inb 關於 cef lib exe int class 來自互聯網:1、氣候監測數據集 http://cdiac.ornl.gov/ftp/ndp026b 2、幾個實用的測試數據集下載的網站 http://www.cs.toronto
【數據倉庫】——數據倉庫概念篇
數據表示 數據抽取 tegra lock 變化 因此 sub 如果 一般來說 一、簡介 1.什麽是數據倉庫 數據倉庫(Data Warehouse)是一個面向主題的(Subject Oriented )、集成的(Integrated)、相對穩定的(Non-V
【數據倉庫】——數據倉庫命名規範
bus 分析工具 log enc 基礎 pos 同時 body 數據 一、概述 數據模型是數據管理的分析工具和交流的有力手段;同時,還能夠很好地保證數據的一致性,是實現商務智能(Business Intelligence)的重要基礎。因此建立、管理一個企業級的數據模型
【每日一學】數據倉庫之全量表、增量表、拉鏈表、流水表
水表 打開 tails 開始 當我 net 最大的 閱讀 增量 每日一悟 數據倉庫之全量表、增量表、拉鏈表、流水表 背景 從使用MySQL階段,到前陣子跳槽到新公司開始使用hive,面對的表變多,數據量也完全超過之前。基本是隨便核查個問題都已經不是Excel能承擔得起的了
【Flask學習筆記】數據模型設計
odi span ase doc href 評論 pre 和數 ont 【前言】對於像我一樣的新手來說,我覺得此環節難點主要是相關依賴包的安裝和Flask-SQLAlchemy的使用,下面將一一講解: 所謂數據模型,百度的解釋是:“數據模型(Data Mode
【復習筆記】數據結構-檢索
磁盤訪問 span 不同 數字分析 clas temp 分析法 區間 再次 性能用ASL(查找成功時的平均查找長度)來衡量 線性表檢索 順序檢索 逐個比較 優點:插入元素可以直接加在表尾 缺點:檢索時間太長 二分檢索法 條件:序列必須有序
【Spark調優】數據本地化
很多 ref proc 運行 配置參數 一段 exec tro 建議 數據本地化對於Spark Job性能有著巨大的影響,如果數據以及要計算它的代碼是在一起的,那麽性能當然會非常高。但是,如果數據和計算它的代碼是分開的,那麽其中之一必須到另外一方的機器上。移動代碼到其匹
數據挖掘在大數據中的應用綜述
算法 深入 生物 原來 試圖 gre diag dia 激發 數據挖掘在大數據中的應用綜述 *** (上海海事大學 上海 201306) 摘 要: 面對大規模多源異構的數據,數據挖掘的方法不斷的得到改善與發展,同時對於數據挖掘體系的完善也提出了新的挑戰。針對當前數
【大數據實戰】Logstash采集->Kafka->ElasticSearch檢索
arc https last elastics www logs 采集 tle .com 【大數據實戰】Logstash采集->Kafka->ElasticSearch檢索 https://www.cnblogs.com/snova/p/9203425.html
數據挖掘-認識數據
中位數 standard 處的 實現 上大 相似性 描述 str 圖片 數據對象與屬性類型 數據集由數據對象組成。一個數據對象代表一個實體。例如銷售數據庫中,對象可以是顧客、商品。屬性是一個數據字段,表示數據對象的一個特征。 屬性類型 標稱屬性(nominal attri
數據挖掘:數據(數據對象與屬性類型)
實體 計算 頭發 相同 對稱 attr binary 特征 定義 一、概述 現實中的數據一般有噪聲、數量龐大並且可能來自異種數據源。 數據集由數據對象組成,一個數據對象代表一個實體。 數據對象:又稱樣本、實例、數據點或對象。 數據對象以數據元組的形式存放在數據庫中,數據庫
【劍指offer】數組中僅僅出現一次的數字(1)
tdi eof 一個 ase pos acc -s ret n) 轉載請註明出處:http://blog.csdn.net/ns_code/article/details/27649027題目描寫敘述:一個整型數組裏除了兩個數字之外,其它的數字都出現了兩次。請敲代碼找出這
【劍指offer】數組中的逆序對。C++實現
AC strong HR mage ont color 數組中的逆序對 master blog 原創文章,轉載請註明出處!博客文章索引地址博客文章中代碼的github地址# 題目# 思路 基於歸並排序的思想統計逆序對:先把數組分割成子數組,再子數組合並的過程中統計