author/新材料探路者

一種基於群體特徵的比例偏差糾正方案

前言: 2018年10月,TalkingData組織了面向內部員工的第二屆黑客鬆大賽。其中一個賽題是“如何消除資料的各類偏差,從而產生無偏差的洞察?”針對該題目,本文作者所在的參賽小組提

圖說十大資料探勘演算法(一)K最近鄰演算法

用官方的話來說,所謂K近鄰演算法,即是給定一個訓練資料集,對新的輸入例項,在訓練資料集中找到與該例項最鄰近的K個例項(也就是上面所說的K個鄰居), 這K個例項的多數屬於某個類,就把該輸入例項分類到這個

一文看懂機器學習3種類型的概念、根本差別及應用

[導 讀]機器學習是使資料具有意義的演算法的應用和科學,也是電腦科學中最令人興奮的領域!在資料豐沛的時代,計算機可以通過自我學習獲得演算法把資料轉化為知識。近年來湧現出了許多強大的機器學習開源軟體庫,現在是進

7大類深度CNN架構創新綜述

深度卷積神經網路(CNN)是一種特殊型別的神經網路,在各種競賽基準上表現出了當前最優結果。深度 CNN 架構在挑戰性基準任務比賽中實現的高效能表明,創新的架構理念以及引數優化可以提高 CNN 在各種視覺相關任

亞馬遜AWS開源機器學習服務平臺SageMaker Neo

新浪科技訊 北京時間1月25日早間訊息,據美國科技媒體GeekWire報道,亞馬遜AWS決定釋出其一個重要的機器學習服務的程式碼,使其成為開源專案。此前一直有批評人士稱亞馬遜的開源軟體數量過少。

啟用函式 sigmoid、tanh、relu

啟用函式(activation functions)的目標是,將神經網路非線性化。啟用函式是連續的(continuous),且可導的(differential)。 連續的:當輸入值發生較小的改變時,

機器學習之NumPy篇(一)

前言 之前為大家介紹了Pandas中常用的一些語句,熟練掌握的話足夠使我們應對實際生活中的大多數問題。在Pandas之後,今天來為大家介紹一下NumPy的內容及一些基本語句。

數加平臺在資料探勘專案中的實踐

目錄 1. 背景 隨著越來越多的公司開始重視資料的積累和產品的敏捷開發,資料量的不斷增加和開發週期的不斷縮短,就形成了一對明顯的矛盾。所以一些列高效的開發工具,就變得尤為重要。 對於業務資料已經

“增強人性”再次成為安索帕2019數字趨勢關鍵詞

近日,全球領先的數字代理商安索帕釋出了《增強人性:安索帕2019趨勢報告》,預測了2019年五大數字技術發展趨勢,並展望了人性與科技在2019年將如何融合、擴充套件和豐富人類生活。這已經是安索帕第二年釋出同一主

1754220011.0292