1. 程式人生 > >大數據到底從何而來?你知道幾個數據源供應平臺?

大數據到底從何而來?你知道幾個數據源供應平臺?

比較 interface 因此 api文檔 缺點 個人理解 移動開發者 技術 大米

國內外比較知名的數據API產品,基礎性的可能更多會選擇百度APIStore、聚合數據、Haoservice;而對於行業、專業有特別需求的用戶來說,通聯數據、Apix會使不錯的選擇;如果是需求國內社交、電商、資訊平臺的數據,可以考慮數說聚合;如果是要國外數據,小編則比較推薦Datasift。讀者可根據自身的需求,選擇最適合的API。我們都知道一句話“巧婦難為無米之炊”,數據源就是讓數據產生價值中的那些大米。那大數據時代企業需要哪些數據呢?根據我個人理解我覺得可以大致分為以下幾類:

1、(內部)企業自身業務生產經營環節產生的內部數據,包括銷售、客服、倉儲、財務等;

2、(運營)可以理解為企業發展過程中掌握在第三方手中的數據,如企業的廣告供應商以及一些傳播與媒體數據,新媒體、H5、app等;

3、(外部)包括傳統調研數據和機器數據,搜索、電商、社交等。而對於外部數據的獲取上,企業往往會覺得有難度,這時候就可以借助API供應商的力量來補充自己的數據源。

先來科普個概念,開放應用程序的API(即Application Program Interface,應用程序接口)可以讓開發者在無需訪問源碼,或理解內部工作機制細節的情況下,調用他人共享的功能和資源。在數據源的獲取上API是個好夥伴。本文將介紹7款API供應平臺:百度APIStore、Apix、數說聚合、通聯數據、HaoService、聚合數據、datasift (排名不分先後)。

一、功能對比

技術分享圖片

二、詳細介紹

1、百度API Store

技術分享圖片

百度旗下的API Store,能夠滿足大部分個人應用開發者,特別是其最近推出的Android和IOS SDK。其接口分類較細,但是感覺有一些分類之間存在交集,沒有明顯的邊界區分。接口、數據更新速度也比較快,支持個人發布與定制化服務,上千的接口量基本可以滿足一般開發者的需求。提供移動開發SDK,移動開發者可調用API Store服務所開發的SDK包,加上API文檔清晰明了,上手簡單。

缺點就是由於接口雜亂繁多且來源不一,部分接口的質量、穩定性沒有保證。

2、Apix

技術分享圖片

Apix更多是面向小貸機構、互聯網金融、租賃保理等行業客戶,除了提供身份核驗、工商信息、失信名單、支付繳費等接口,還有包括電商、學歷信息、運營商記錄、信用卡賬單等分析服務。其數據分類包括征信風控、支付繳費和常用數據,而征信風投是其主打數據。由於這類數據具有專業性,因此收費相比其他API會稍微偏高。

接口大多數是Apix自主開發,質量有保證,部分核查接口的高級版還能聯網檢測,就是接口的數量確實有點少。

3、聚合數據

技術分享圖片

聚合數據跟百度的APIStore有點像,接口包括生活、旅遊、金融、開發、咨詢等分類,還比較全面,更加適合對接口質量和穩定性有較高要求的公司或企業級應用的開發者。但是並不支持個人發布,因此接口的質量和穩定性會比較好,但也正因為這樣接口量大大減少。

聚合數據給我的感覺更像是致力於打造高質量API,不求廣而求精。不過申請使用接口需要實名認證和審核,算是雙刃劍吧,對於買賣雙方來說是一個保障,但是對於試用者來說是一個不太好的體驗。

4、HaoService

技術分享圖片

Haoservice近期更新後推出了源碼商城,用戶可在上面直接購買商城、管理系統、UDP通訊源、發布系統等源碼。總體來說比較適合公司或企業級應用的開發者。其主打生活服務類接口,主推基站、定位、地址解析、坐標服務等API,目前僅支持企業用戶發布接口,因此接口的質量和穩定性有保障,但接口數量也是一個痛點。VIP級別以上用戶可進行個性化定制,且有專人24小時技術支持,服務到位。

5、通聯數據

技術分享圖片

通聯數據提供行情、滬深股市/期權、債券、基金、咨詢、研究報告等API,適合金融類應用和金融咨詢網站、平臺的開發者,以及從事金融行業的分析、業務人員。通聯數據主要做金融大數據,上千的數據接口可以滿足金融行業的大部分需求。

數據有API和研報兩種格式,接口來源於自主研發或恒生聚源、九次方大數據、華通人、朝陽永續、中誠信資訊、巨靈財經等企業。

6、數說聚合

技術分享圖片

數說聚合跟上面的數據API不同,面向的客戶不只是大數據應用開發者,對互聯網數據有強烈需求的各行業分析師、業務人員、運營人員同樣可以通過數說聚合拿到你們想要的數據。數據覆蓋範圍廣泛,包括國內社交、新聞、電商、互聯網垂直領域等多平臺多維度的數據。用戶可以通過接口調用、文件下載等方式獲取數據。接口完全自主研發,質量、穩定性十分有保障,且支持個性化定制。

不過目前只面向企業用戶,個人用戶想要使用可能還需要一段時間。

7、Datasift

技術分享圖片

Datasift的性質與數說聚合相似,其數據基本覆蓋國外主流網站,包括Facebook、Tumblr、Google+、YouTube、Instagram等,且提供數據分析服務。來源於國外站點的數據質量較好,不過可能是服務器在國外的原因,響應會有明顯的延遲;而國內站點數據的話,小編曾經在datasift購買微博數據(當時在國外無法通過國內公司購買微博的數據),數據質量只能說一般。

其業務目前暫未向國內市場開放,只能通過特殊途徑購買。

以上是國內外比較知名的數據API產品,基礎性的可能更多會選擇百度APIStore、聚合數據、Haoservice;而對於行業、專業有特別需求的用戶來說,通聯數據、Apix會使不錯的選擇;如果是需求國內社交、電商、資訊平臺的數據,可以考慮數說聚合;如果是要國外數據,小編則比較推薦Datasift。讀者可根據自身的需求,選擇最適合的API。

以上就是數據源的供應平臺,在大數據時代企業更加關註數據的價值,如何采用並從中獲得商業性的利益至關重要。

結語

感謝您的觀看,如有不足之處,歡迎批評指正。

為了幫助大家讓學習變得輕松、高效,給大家免費分享一大批資料,幫助大家在成為大數據工程師,乃至架構師的路上披荊斬棘。在這裏給大家推薦一個大數據學習交流圈:658558542 歡迎大家進群交流討論,學習交流,共同進步。

當真正開始學習的時候難免不知道從哪入手,導致效率低下影響繼續學習的信心。

但最重要的是不知道哪些技術需要重點掌握,學習時頻繁踩坑,最終浪費大量時間,所以有有效資源還是很有必要的。

最後祝福所有遇到瓶疾且不知道怎麽辦的大數據程序員們,祝福大家在往後的工作與面試中一切順利。

大數據到底從何而來?你知道幾個數據源供應平臺?