author/Python資料科學

用Python實現資料結構之樹

樹 樹是由根結點和若干顆子樹構成的。樹是由一個集合以及在該集合上定義的一種關係構成的。集合中的元素稱為樹的結點,所定義的關係稱為父子關係。父子關係在樹的結點之間建立了一個層次結構。在這種層次結構中有一個結點

Cisco Live:思科讓資料中心基礎設施更靠近資料

思科推出了一款新的網路架構以應對日益增長的資料,該架構旨在將企業的資料中心擴充套件到資料所在的任何地方以及應用部署的任何位置。 思科今天早些時候在巴塞羅那舉行的Cisco Live活動上宣佈,將首次在AWS

你會用Python做資料預處理嗎?

前戲 在拿到一份資料準備做挖掘建模之前,首先需要進行初步的資料探索性分析(你願意花十分鐘系統瞭解資料分析方法嗎?),對資料探索性分析之後要先進行一系列的資料預處理步驟。因為拿到的原始資料存在不完整、不一致、

基於python語言的大資料搜尋引擎

搜尋是大資料領域裡常見的需求。Splunk和ELK分別是該領域在非開源和開源領域裡的領導者。本文利用很少的Python程式碼實現了一個基本的資料搜尋功能,試圖讓大家理解大資料搜尋的基本原理。 布隆過濾器

用 Python 實現一個大資料搜尋引擎

搜尋是大資料領域裡常見的需求。Splunk和ELK分別是該領域在非開源和開源領域裡的領導者。本文利用很少的Python程式碼實現了一個基本的資料搜尋功能,試圖讓大家理解大資料搜尋的基本原理。 布隆過濾器 (

一文看懂機器學習3種類型的概念、根本差別及應用

[導 讀]機器學習是使資料具有意義的演算法的應用和科學,也是電腦科學中最令人興奮的領域!在資料豐沛的時代,計算機可以通過自我學習獲得演算法把資料轉化為知識。近年來湧現出了許多強大的機器學習開源軟體庫,現在是進

用 Python 做機器學習不得不收藏的重要庫

Python通常被應用統計技術或者資料分析人員當做工作中的首選語言。資料科學家也會用python作為連線自身工作與WEB 應用程式/生產環境整合中。 Python在機器學習領域非常出色。它具有一致的語法、更

time date datetme timestamp 傻傻分不清楚

時間格式對於任何一個工程師來說都是繞不開的知識,爬蟲工程師同樣如此。爬蟲工程師要將不同網站的相同型別內容存放在同一個資料表當中,常見的有: * 站點 A 的時間格式為 “2018-5” * 站點 B 的時間

1746028999.3892