人工智慧工程師學習路線及具備的5項基本技能

阿新 • • 發佈：2018-11-01

摘要

學習路線

這裡寫圖片描述

你是否對機器學習充滿興趣呢?其實到目前為止，每天有越來越多的工程師開始將好奇的目光轉向機器學習領域。實際上，你會發現現在沒有哪一個領域比機器學習能引起更多的曝光率和關注度。機器學習已經以一種高調姿態闖入廣大民眾的意識當中，無論是採用機器學習等相關技術的Google AlphaGo以5局4勝的戰績打敗人類世界的圍棋冠軍，還是採用了機器學習技術的Twitter能夠鑑定是否你在酩酊大醉的時候釋出了推文，無論你通過怎樣的方式發現並知道機器學習技術的存在，有一件事不言而喻：機器學習的時代已經到來。

儘管機器學習技術看起來這般神器，但是對於機器學習技術的好奇心是一碼事兒，而想要讓該技術在相關產業當中發揮作用實際上又是另外一碼事兒。這篇文章將會幫助你瞭解作為一名機器學習工程師具備怎樣的思維方式以及需要什麼樣的專業技能才可以開展工作。
如果你正在考慮投身機器學習工程師的職業生涯，那麼在一開始的時候，你必須弄清楚兩件非常重要的事情。首先，機器學習工程師的崗位並不是一個“純粹的”學術角色，你不需要具備科學研究經驗或者專業的學術教育背景。其次，如果你僅僅具備軟體工程師的能力或者僅僅具備資料科學的經驗還遠無法成為一名合格的機器學習工程師，除非你同時掌握以上兩方面的技術經驗。

資料分析 Vs. 機器學習工程師

如果想成為一名機器學習工程師，那麼你必須弄清楚前者和資料分析師之間的區別，而且這非常重要。簡單來講，兩者之間最為關鍵的區別就是他們最終的目標大相徑庭。作為一位資料分析師，你的主要職責就是分析資料，並從這些抽象的資料當中提煉出具體的能讓大家明白的故事，並從中產生具有可行性的洞察。資料分析工作的重點就是向公眾傳播並展示圖表、模型已經視覺化效果。資料的分析和展示由人類執行，並且其他人會根據你展示的資料做出商業決策。尤其是這一點必須引起你足夠的重視——你資料分析後產生的結果的“受眾”是人。但是從機器學習工程師的角度來看的話，他們最終輸出的結果是一種可以工作的軟體(而不是你一路以來建立的分析結果或者視覺化圖形)，並且你所輸出結果的“受眾”通常由其他軟體外掛組成，只需很少在少量人力勞動的監護下這些軟體外掛就可以自行運轉。軟體的智慧性意味著可行性，但是在機器學習模型中，決策的制定由系統來決定，並且系統可以影響產品或者服務的行為方式。這就是軟體工程技術為什麼對機器學習工程師而言如此重要。
　　

Understanding The Ecosystem——弄懂軟體的生態系統

在你開始著手學習具體技能之前，我還要再向大家闡明另外一個概念。成為一名機器學習工程師必須要求你自己能夠清楚地瞭解你所設計的整個軟體系統。
　　讓我們打個比方，如果你正在為一個連鎖店專案工作，並且公司需要根據客戶以往的購買歷史開始有針對性的發放優惠券，目的是想生成能夠讓消費者可以實際使用的優惠券。在資料分析模型當中，你可以收集消費者的採購資料，對這些資料分析之後可以觀察出消費者的採購行為趨勢，並據此提出響應的策略。機器學習的方法是編寫一個可以自動生成優惠券的系統。但是學習採取什麼方式才能編寫出這樣一種系統呢?這種方式奏效嗎?你不得不去通盤瞭解專案開發所處的生態系統——包括商品庫存、商品類目、價格、採購訂單、銷售點終端軟體、CRM管理系統等等。
　　歸根結底，專案的處理流程和機器學習演算法的理解關係不大，或者和應用他們的方式和時間也沒有太多關係，但是卻需要你能夠對系統的相互關聯性有很深入的瞭解，並需要你可以成功編寫一個具有高度整合和介面功能的軟體。請切記，機器學習輸出的結果實際上是一個可以有效執行的軟體!
　　現在，就讓我們開始瞭解成為一名機器學習工程師所需要注意的各種細節方面的事宜。我們會把這些資訊分成兩個基本點進行闡述：技能簡介以及語言和庫。首先我們將從技能介紹開始，在日後的內容中我們將介紹機器學習的語言和庫。

技能簡介

1. Computer Science Fundamentals and Programming

電腦科學基礎和程式設計

對機器學習工程師而言，電腦科學基礎的重要性包括資料結構(資料堆疊、佇列、多位陣列、樹形以及影象等等)、演算法(搜尋、分類、優化、動態程式設計等)、科計算性與複雜性(P對NP、NP完全問題、大O符號以及近似演算法等)和計算機架構(儲存、快取、頻寬、死鎖和分散式處理等等)。
　　當你在程式設計的時候必須能夠對以上提到的這些基礎知識進行應用、執行、修改或者處理。課後練習、編碼競賽還有黑客馬拉松比賽都是你不可或缺的磨練技能的絕佳途徑。
　　

2. Probability and Statistics

概率論和數理統計

概率的形式表徵(條件概率、貝葉斯法則、可能性、獨立性等)和從其中衍生出的技術(貝葉斯網、馬爾科夫決策過程、隱藏式馬可夫模型等)是機器學習演算法的核心，這些理論可以用來處理現實世界中存在的不確定性問題。和這個領域密切相關的還有統計學，這個學科提供了很多種衡量指標(平均值、中間值、方差等)、分佈(均勻分佈、正態分佈、二項式分佈、泊松分佈等)和分析方法(ANOVA、假設實驗等)，這些理論對於觀測資料模型的建立和驗證非常必要。很多機器學習演算法的統計建模程式都是可以擴充套件的。

3. Data Modeling and Evaluation

資料建模及評估

資料建模就是對一個給定的資料庫的基本結構進行評估的過程，目的就是發現其中所蘊含的有用模式(相互關係，聚合關係、特徵向量等)和/或者預測以前案例(分類，迴歸、異常檢測等)的特徵。評估過程的關鍵就是不斷地對所給模型的優良效能進行評價。根據手中的任務，你需要選取一種恰當的精準/誤差衡量指標(比如日誌分類的損失、線性迴歸的誤差平方和等等)和求值策略(培訓測試、連續Vs. 隨機交叉驗證等)。通過對演算法的反覆學習，我們可以發現其中會存在很多誤差，而我們可以根據這些誤差對模型(比如神經網路的反相傳播演算法)進行細微的調整，因此即使你想能夠運用最基本的標準演算法，也需要你對這些測量指標有所瞭解。
　　

4. Applying Machine Learning Algorithms and Libraries

應用機器學習演算法和庫

儘管通過程式庫/軟體包/API(比如scikit-learn,Theano, Spark MLlib, H2O, TensorFlow等)可以廣泛地實現機器學習演算法的標準化執行，但是演算法的應用還包括選取合適的模型(決策、樹形結構、最近鄰點、神經網路、支援向量機器、多模型整合等)、適用於資料的學習程式(線性迴歸、梯度下降法、基因遺傳演算法、袋翻法、模型特定性方法等)，同時還需要你能夠了解超引數對學習產生影響的方式。你也需要注意不同方式之間存在的優勢和劣勢，以及那些可能會讓你受牽絆的大量陷阱(偏差和方差、高擬合度與低擬合度、資料缺失、資料丟失等)。對於資料科學和機器學習所帶來的這些方面的挑戰，大家可以去Kaggle網站獲取很多學習參考，你可發現不同的問題當中存在的細微差別，從而可以讓你更好的掌握機器學習的演算法。

5. Software Engineering and System Design

軟體工程和系統設計

在每天工作結束的時候，機器學習工程師通常產生的成果或者應交付的產品就是一種軟體。這種軟體其實也是一種小型外掛，它可以適用於相對更大型的產品或者服務的生態系統。你需要很好地掌握如何才能讓這些彼此不同的小外掛協同工作，並與彼此進行流暢的溝通(使用庫函式呼叫、資料介面、資料庫查詢等)的方法，為了讓其他的外掛可以依附你的外掛進行很好的工作，你也得需要為你的差價建立合適的介面。精心設計的系統可以避免以後可能出現的瓶頸問題，並讓你的算法系統滿足資料量激增時候的擴充套件效能。軟體工程的最佳的實踐經驗(需求分析、系統設計、模組化、版本控制、測試以及歸檔等)對於產能、協作、質量和可維護性而言是不可獲取的無價之寶。

Machine Learning Job Roles——機器學習的工作角色

由於現在越來越多的公司開始嘗試採用新興技術為自己挖掘更多的利潤，於是和機器學習相關的崗位需求也在不斷的增加。下面這幅圖片為大家展示了和資料分析師相比，對於一名典型的機器學習工程師而言，相對重要的核心技能包含以下內容：

The Future of Machine Learning——機器學技術的發展展望

機器學習工程師最讓人慾罷不能的特徵或許就是這個崗位角色擁有看起來無所不能的廣泛適應性。包括教育行業、電腦科學還有更多領域在內的很多行業已經受到了機器學習的積極影響。實際上你會發現沒有哪個領域不會應用機器學習技術。對於某些行業案例而言，他們對機器學習技術有極其迫切的需求。健康醫療產業就是一個顯而易見的例子。機器學習技術已經在健康醫療長夜中的很多重要領域得到了廣泛的應用，無論是致力於減少護理差異，還是醫學掃描分析，機器學習技術正在潛移默化地為這些領域帶來改變。來自紐約大學的數學科學克朗學院和資料科學中心的助理教授David Sontag先生最近發表了關於機器學習技術和健康醫療系統的演講，在演講中他討論了機器學習是如何通過自己的潛力改變了整個醫療產業。
　　毫無疑問，這個世界正在發生著快速和戲劇性的轉變。對於機器學習工程師的需求正在呈現指數型的增長趨勢。世間充滿了複雜的挑戰，並因此需要更加複雜的系統才可以將這些挑戰迎刃而解。而機器學習工程師們就是可以建造這些系統的最佳人選。如果你的未來需要藉助機器學習技術獲得更好的發展，那麼此時此刻就是你邁出腳步掌握相關技能並開發你思維的最佳時機!

人工智慧工程師學習路線及具備的5項基本技能

摘要學習路線你是否對機器學習充滿興趣呢?其實到目前為止，每天有越來越多的工程師開始將好奇的目光轉向機器學習領域。實際上，你會發現現在沒有哪一個領域比機器學習能引起更多的曝光率和關注度。機器學習已經以一種高調姿態闖入廣大民眾的意識當中，無論是採用機器學習等相關技術的Googl

人工智慧工程師要具備的5項基本技能

技能簡介 1. Computer Science Fundamentals and Programming 電腦科學基礎和程式設計對機器學習工程師而言，電腦科學基礎的重要性包括： 1、資

嵌入式工程師學習路線

指令 arm aid 要求等等系統開發周期學習原理參考：嵌入式工程師學習路線關於這個方向，我認為大概分3個階段：1、嵌入式linux上層應用，包括QT的GUI開發2、嵌入式linux系統開發3、嵌入式linux驅動開發嵌入式目前主要面向的幾個操作系統是，LIN

大資料工程師-學習路線-轉

原文地址 https://blog.csdn.net/gitchat/article/details/78341484 【不要錯過文末彩蛋】申明：本文旨在為普通程式設計師（Java程式設計師最佳）提供一個入門級別的大資料

網路工程師都學什麼？網路工程師學習路線內容

大家在備考軟考的時候肯定想著選擇那些科目報名比較好，比較有發展前途，這裡給大家整理了網路工程師的學習路線以及學習內容，僅供大家參考。網路工程師是從事計算機資訊系統的設計、建設、執行和維護工作，掌握網路技術的理論知識和操作技能。在軟考中屬中級資格，那麼怎樣才能具備這些技術呢?當然是需要進

安全工程師學習路線

參考1：《安全工程師學習路線》前言職位描述職位要求學習路線基本技能前期安全知識的補充學習安全工具使用滲透測試安全基線檢查應急響應程式碼審計安全邊界建設安全規範具體參考內容連結：https://blog.csdn.ne

web安全工程師學習路線

下面的學習路線是來自: secWiKi 前言一直想學習滲透測試工程師，但找不到比較適合我的學習路線，以前零碎的學習不僅效果奇差又堅持不下去。最近突然想起這個web安全工程師的學習路線，感覺還挺合適我這種難以堅持又不會規劃的人，而且學習的內容也符合滲透測試工程師的要求，所以目前

大資料開發技術學習路線及內容

不管是現在，還是在未來很長的時間內，IT行業都將處於網際網路的領頭位置，市場和企業對於IT人才素質的要求將更加嚴格，更加面向現實需求和未來規劃。首先，注重的是IT人才的專業知識和專案操作能力。IT行業涉獵領域極廣，尤其在現在這個時代，必將大範圍覆蓋製造、服務、金融、石化等各個時代；其次，

嵌入式工程師學習路線，嵌入式培訓機構哪家好

很多人以為搞嵌入式就是隨便找本書看看，借鑑書本上的內容在電腦上編寫幾個程式就完事兒了，但事實並非如此，其實嵌入式的門檻還是比較高的，但只要我們找到合適的應對方法，同樣可以很好地掌握所學知識和相關內容。基礎學習1——Linux入門目前嵌入式主要開發環境有

Hadoop及Spark學習路線及資源收納

title: Hadoop及Spark學習路線及資源收納 date: 2018-11-18 16:19:54 tags: Hadoop categories: 大資料 toc: true 點選檢視我的部落格：Josonlee’s Blog 版權宣告：本文為博主原創文章，未經博主允許

Java工程師學習路線

1. 基礎主要看《java核心技術：卷一》的重點章節掌握java常用技術，io、多執行緒、反射、常用集合框架資料結構看一遍，作用至少要清楚。如hash衝突解決辦法，常用排序演算法的應用場

0基礎怎麼學習大資料，大資料學習路線及學習資料

資料科學並沒有一個獨立的學科體系，統計學，機器學習，資料探勘，資料庫，分散式計算，雲端計算，資訊視覺化等技術或方法來對付資料，一起來看看資料大咖的分享。但從狹義上來看，我認為資料科學就是解決三個問題： 1. data pre-processing;(資料預處理) 2.

大資料學習路線及重要名稱解釋

Java(Java se,javaweb) Linux(shell,高併發架構,lucene,solr) Hadoop(Hadoop,HDFS,Mapreduce,yarn,hive,hbase,sqoop,zookeeper,flume) 機器學習(R,mahout) Storm(Storm

大資料開發工程師學習路線分享

引言最近有很多人問我如何學習大資料？我也是思考了很多時日才動筆寫下此文。一方面我自己還只是大資料學習中的一個小學生，貿然動筆怕貽笑大方；另一方面大資料本身領域博大精深，其涵蓋領域之廣技術種類之多確實很難用一篇文章囊括。怎奈“下雨天打孩子，閒著也是

史上最全面的C語言的學習路線及方法

UNIX下C語言的學習路線。工具篇“公欲善其事，必先利其器”。程式設計是一門實踐性很強的工作，在你以後的學習或工作中，你將常常會與以下工具打交道, 下面列出學習C語言程式設計常常用到的軟體和工具。(一)作業系統在UNIX或Linux系統中學習C很方便，所以在開始您的學習旅程前

java詳細學習路線及路線圖（來自大神的總結）

java詳細路線：圖片來源：https://blog.csdn.net/hao65103940/article/details/78478472 本文將告訴你學習Java需要達到的30個目標，學習過程中可能

IT職業技能圖譜：IT工程師學習路線

程式開發語言綜述前端工程師 IOS開發工程師嵌入式開發大資料工程師微服務架構安全工程師雲端計算工程師移動無線

java學習：Web前端開發學習路線及建議

1.第一階段——HTML的學習　　超文字標記語言(HyperText Mark-up Language 簡稱HTML)是一個網頁的骨架，無論是靜態網頁還是動態網頁，最終返回到瀏覽器端的都是HTML程式碼，瀏覽器將HTML程式碼解釋渲染後呈現給使用者。因此，我們必須

零基礎學Python不迷茫——基本學習路線及教程

什麼是Python？在過去的2018年裡，Python成功的證明了它自己有多火，它那“簡潔”與明瞭的語言成功的吸引了大批程式設計師與大資料應用這的注意，的確，它的實用性的確是配的上它的熱度。 Python語言的優勢是什麼？ Pyt

阿里大資料告訴你不可不看的零基礎學習大資料人工智慧，學習路線篇！

大資料處理技術怎麼學習呢?首先我們要學習Python語言和Linux作業系統，這兩個是學習大資料的基礎，學習的順序不分前後。 Python：Python 的排名從去年開始就藉助人工智慧持續上升，現在它已經成為了語言排行第一名。從學習難易度來看，作為一個為“優雅”而生的語

人工智慧工程師學習路線及具備的5項基本技能

摘要

學習路線

資料分析 Vs. 機器學習工程師

Understanding The Ecosystem——弄懂軟體的生態系統

技能簡介

1. Computer Science Fundamentals and Programming

2. Probability and Statistics

3. Data Modeling and Evaluation

4. Applying Machine Learning Algorithms and Libraries

5. Software Engineering and System Design

Machine Learning Job Roles——機器學習的工作角色

The Future of Machine Learning——機器學技術的發展展望

相關推薦