1. 程式人生 > >入門機器學習的第一個程式!(python版)

入門機器學習的第一個程式!(python版)

一. 前言

前兩天看到了網上一個叫做機器學習中的hello world的入門視訊。覺得非常有意思,也進一步對機器學習有了感性認識,覺得非常適合我們瞭解和認識機器學習這一當前的熱門領域。這篇文章是對它的大概描述。

 本次實驗使用的是python語言以及Scikit-learn庫,實驗環境使用的是Linux下的iPython。

(關於下載和安裝在這裡就不贅述了,百度上有詳細的教程)

本次實驗使用的是python語言以及Scikit-learn庫,實驗環境使用的是Linux下的iPython。(關於下載和安裝在這裡就不贅述了,百度上有詳細的教程)

二. 一起動手吧!

首先將新增sklearn庫中的決策樹tree

接著引入一些模型特徵,我這裡使用認的身高和是否有鬍子來作為特徵(features),而性別來作為標籤(labels)。建立如下:

(tips:資料量越大,模型越好,那麼結果就會越精確,這裡只引入3男3女的特徵來做個示範)

程式碼如下:



有了資料模型之後,接下來的活就只需要交給機器去做就行了。

首先建立一個決策樹物件clf。


接下來將這一句將資料交給決策去去判斷!


上面就是所有需要做的準備,接下來就可以使用clf來進行判定啦。

假設此時有一個身高158的沒有鬍子的人,那麼機器會判斷TA是男人還是女人呢?


顯然,此時機器人判定這是一個女人‘female’。

再試一次,這次是一個172有鬍子的人


這一次機器判定為男性~

大家可以嘗試著自己寫一下其他象徵意義的程式,輸入的訓練資料越大,那麼輸出正確的可能性就越大~

作者是機器學習的入門學習者。歡迎大家指出錯誤,相互交流~

相關推薦

入門機器學習第一程式python

一. 前言 前兩天看到了網上一個叫做機器學習中的hello world的入門視訊。覺得非常有意思,也進一步對機器學習有了感性認識,覺得非常適合我們瞭解和認識機器學習這一當前的熱門領域。這篇文章是對它的

從零單排入門機器學習:線性回歸linear regression實踐篇

class rom enter instr function ont 線性 gin 向量 線性回歸(linear regression)實踐篇 之前一段時間在coursera看了Andrew ng的機器學習的課程,感覺還不錯,算是入門了。這次打算以該課程的作業

收藏超全機器學習資料合集附下載

最近在群裡發現一些小夥伴在尋找資料的時候總是無處可找,網上出現很多收集免費資料再去打包收錢的人,我看不慣這樣的人,所以把自己收集的檔案分享給大家。 百度雲經常抽風,如果大家遇到了失效的連結,請在評論區給我評論,我會很快的更新。 1:資料探勘:概念與技術(中文第三版) 連結: https

LeetCode題目--字串中的第一唯一字元python實現

題目 給定一個字串,找到它的第一個不重複的字元,並返回它的索引。如果不存在,則返回 -1。 案例: s = "leetcode" 返回 0. s = "loveleetcode", 返回 2. 注意事項:您可以假定該字串只包含小寫字母。   p

二,機器學習演算法之邏輯迴歸python實現

邏輯迴歸(Logistic Regression)是目前流行最廣泛的演算法之一。 1. 何為邏輯迴歸:        邏輯迴歸主要思想是根據現有的訓練集(資料)進行分類,判斷這些資料屬於哪一個類別,通

機器學習 | 吳恩達機器學習第八週程式設計作業(Python

實驗指導書   下載密碼:higl 本篇部落格主要講解,吳恩達機器學習第八週的程式設計作業,主要包含KMeans實驗和PCA實驗兩部分。原始實驗使用Matlab實現,本篇部落格提供Python版本。 目錄 1.實驗包含的檔案 2.KMeans實驗 3.K-me

機器學習 | 吳恩達機器學習第六週程式設計作業(Python

實驗指導書  下載密碼:4t4y 本篇部落格主要講解,吳恩達機器學習第六週的程式設計作業,作業內容主要是實現一個正則化的線性迴歸演算法,涉及本週講的模型選擇問題,繪製學習曲線判斷高偏差/高方差問題。原始實驗使用Matlab實現,本篇部落格提供Python版本。 目錄 1.實驗包

android的第一程式helloworld 有圖有真相

1、建立工程 2、都不需要編寫程式碼 非常簡單  AndroidhelloActivity.java package com.mrjing.org; import android.app.Activity; import android.os.Bundle; pub

機器學習三--分類--鄰近取樣Nearest Neighbor

post 個數 均衡 urn learning clas 根據 () end 最鄰近規則分類 K-Nearest Neighbor 步驟:   1、為了判斷未知實例的類別,以所有已知類別的實例作為參考。   2、選擇參數K。   3、計算未知實例與所有已知實例的距離。   

機器學習課程不完全收錄持續更新

google 趨勢 con ash color mooc tar 業界 積極 機器學習已經火遍全球了,目前幾乎所有科技公司都或多或少都在積極地響應AI的趨勢,但是此時需要培養更多的人工智能和機器學習專家,然而優質的學習資源卻相當匱乏。幾大科技巨頭和業界領軍大神也相應提供了各

【深度學習】一文讀懂機器學習常用損失函數Loss Function

back and 們的 wiki 導出 歐氏距離 classes 自變量 關於 最近太忙已經好久沒有寫博客了,今天整理分享一篇關於損失函數的文章吧,以前對損失函數的理解不夠深入,沒有真正理解每個損失函數的特點以及應用範圍,如果文中有任何錯誤,請各位朋友指教,謝謝~

小白python學習——機器學習篇——k-近鄰演算法KNN演算法

一、演算法理解 一般給你一資料集,作為該題目的資料(一個矩陣,每一行是所有特徵),而且每一組資料都是分了類,然後給你一個數據,讓這個你預測這組資料屬於什麼類別。你需要對資料集進行處理,如:歸一化數值。處理後可以用matplotlib繪製出影象,一般選兩個特徵繪製x,y軸,然後核心是計算出預測點到

斯坦福NG機器學習聽課筆記-推薦系統recommender system

推薦系統(recommender system) Problem Formulation: RecommenderSystems:為什麼講它有兩個原因:首先它是一個很重要的機器學習應用方向,在很多公司中佔據了重要作用,像亞馬遜之類網站都是很好的建立推薦系統促進商品銷售。其次推薦系

資源|28本必讀的經典機器學習/資料探勘書籍免費下載

分享一下我老師大神的人工智慧教程!零基礎,通俗易懂!http://blog.csdn.net/jiangjunshow 也歡迎大家轉載本篇文章。分享知識,造福人民,實現我們中華民族偉大復興!        

Keras搭建第一神經網路線性迴歸

Keras介紹: Keras 是一個相容 Theano 和 Tensorflow 的神經網路高階包, 用他來元件一個神經網路更加快速, 幾條語句就能搞定。而且廣泛的相容效能使 Keras 在 Windows 和 MacOS 或者 Linux 上執行無阻礙。 Keras安裝: 首先確認

機器學習——樸素貝葉斯Naive Bayes詳細解讀

在機器學習中,樸素貝葉斯是一個分類模型,輸出的預測值是離散值。在講該模型之前首先有必要先了解貝葉斯定理,以該定理為基礎的統計學派在統計學領域佔據重要的地位,它是從觀察者的角度出發,觀察者所掌握的資訊量左右了觀察者對事件的認知。 貝葉斯公式

求兩鏈表的第一公共節點建模有趣

pub clas ima 時間復雜度 ret img rst nod bsp 題目描述: 析:本題如果采用暴力遍歷方法的話,最大時間復雜度為O((m + n)* (l + n)) 其實這道題可以建模成一個相遇問題,如上圖所示:A和B同時出發,速度均為1,求他們的

機器學習中的優化演算法附程式碼

摘要 > 優化演算法指通過改善訓練方式,來最小化(或最大化)損失函式E(x) 區域性最優問題 區域性最優與鞍點。在神經網路中,最小化非凸誤差函式的另一個關鍵挑戰是避免陷於多個其他區域性最小值中。實際上,問題並非源於區域性極小值,而是來自鞍點,即一個維度向上傾斜且

機器學習——K-均值聚類K-means演算法

本文轉載自:https://www.cnblogs.com/ybjourney/p/4714870.html 一 K-均值聚類(K-means)概述 聚類 “類”指的是具有相似性的集合。聚類是指將資料集劃分為若干類,使得類內之間的資料最為相似,各類之間的資料相

Mybatis第一專案嘗試附程式碼

一、專案佈局如下: 我在mysql資料庫建立的資料庫名為:mybatis 在mybatis建立了一個表,名為users 二、sql檔案users.sql內容如下: DROP TABLE IF EXISTS `users`; CREATE TABLE `users` ( &nbs