《Tensorflow基礎泰坦尼克獲救預測》-- 網易雲課堂

阿新 • • 發佈：2018-12-01

https://study.163.com/course/courseMain.htm?courseId=1004937015

 1 # -*- coding: utf-8 -*-
 2 
 3 import tensorflow as tf
 4 import pandas as pd
 5 import numpy as np
 6 
 7 data = pd.read_csv('train.csv')
 8 data = data[['Survived', 'Pclass', 'Sex', 'Age', 'SibSp', 'Parch', 'Fare', 'Cabin', 'Embarked' 
]]
 9 
10 data['Age'] = data['Age'].fillna(data['Age'].mean())
11 data['Cabin'] = pd.factorize(data['Cabin'])[0]
12 data.fillna(0, inplace=True)
13 data['Sex'] = [1 if x=='male' else 0 for x in data['Sex']]
14 data['p1'] = np.array(data['Pclass']==1).astype(np.int32)
15 data['p2'] = np.array(data['Pclass 
']==2).astype(np.int32)
16 data['p3'] = np.array(data['Pclass']==3).astype(np.int32)
17 del data['Pclass']
18 data['e1'] = np.array(data['Embarked']=='S').astype(np.int32)
19 data['e2'] = np.array(data['Embarked']=='C').astype(np.int32)
20 data['e3'] = np.array(data['Embarked']=='Q').astype(np.int32)
 
21 del data['Embarked']
22 
23 data_train = data[[ 'Sex', 'Age', 'SibSp', 'Parch', 'Fare', 'Cabin', 'p1', 'p2', 'p3', 'e1', 'e2', 'e3']]
24 data_target = data['Survived'].values.reshape(len(data), 1)
25 
26 x = tf.placeholder("float", shape=[None, 12])
27 y = tf.placeholder("float", shape=[None, 1])
28 
29 weight = tf.Variable(tf.random_normal([12, 1]))
30 bias = tf.Variable(tf.random_normal([1]))
31 output = tf.matmul(x, weight) + bias
32 pred = tf.cast(tf.sigmoid(output) > 0.5, tf.float32)
33 
34 loss = tf.reduce_mean(tf.nn.sigmoid_cross_entropy_with_logits(labels=y, logits=output))
35 train_step = tf.train.GradientDescentOptimizer(0.001).minimize(loss)
36 accurary = tf.reduce_mean(tf.cast(tf.equal(pred, y), tf.float32))
37 
38 data_test = pd.read_csv('test.csv')
39 data_test = data_test[['Pclass', 'Sex', 'Age', 'SibSp', 'Parch', 'Fare', 'Cabin', 'Embarked']]
40 data_test['Age'] = data_test['Age'].fillna(data_test['Age'].mean())
41 data_test['Cabin'] = pd.factorize(data_test['Cabin'])[0]
42 data_test.fillna(0, inplace=True)
43 data_test['Sex'] = [1 if x=='male' else 0 for x in data_test['Sex']]
44 data_test['p1'] = np.array(data_test['Pclass']==1).astype(np.int32)
45 data_test['p2'] = np.array(data_test['Pclass']==2).astype(np.int32)
46 data_test['p3'] = np.array(data_test['Pclass']==3).astype(np.int32)
47 del data_test['Pclass']
48 data_test['e1'] = np.array(data_test['Embarked']=='S').astype(np.int32)
49 data_test['e2'] = np.array(data_test['Embarked']=='C').astype(np.int32)
50 data_test['e3'] = np.array(data_test['Embarked']=='Q').astype(np.int32)
51 del data_test['Embarked']
52 
53 test_label = pd.read_csv('gender_submission.csv')
54 test_label = np.reshape(test_label['Survived'].values.astype(np.float32), (418,1))
55 
56 sess = tf.Session()
57 sess.run(tf.global_variables_initializer())
58 loss_train = []
59 train_acc = []
60 test_acc = []
61 
62 data_train = data_train.values
63 for i in range(25000):
64     index = np.random.permutation(len(data_target))
65     data_train = data_train[index]
66     data_target = data_target[index]
67     for n in range(len(data_target)//100 + 1):
68         batch_xs = data_train[n*100:n*100+100]
69         batch_ys = data_target[n*100:n*100+100]
70         sess.run(train_step, feed_dict={x:batch_xs, y:batch_ys})
71         
72     if i%1000 == 0:
73         loss_temp = sess.run(loss, feed_dict={x:batch_xs, y:batch_ys})
74         loss_train.append(loss_temp)
75         train_acc_temp = sess.run(accurary, feed_dict={x:batch_xs, y:batch_ys})
76         train_acc.append(train_acc_temp)
77         test_acc_temp = sess.run(accurary, feed_dict={x:data_test, y:test_label})
78         test_acc.append(test_acc_temp)
79         print(loss_temp,train_acc_temp,test_acc_temp)
80         
81 import matplotlib.pyplot as plt
82 
83 plt.plot(loss_train, 'k-')
84 plt.title('train loss')
85 plt.show()
86 
87 plt.plot(train_acc, 'b-', label='train_acc')
88 plt.plot(test_acc, 'r--', label='test_acc')
89 plt.title('train and test accuracy')
90 plt.legend()
91 plt.show()

《Tensorflow基礎泰坦尼克獲救預測》-- 網易雲課堂

https://study.163.com/course/courseMain.htm?courseId=1004937015 1 # -*- coding: utf-8 -*- 2 3 import tensorflow as tf 4 import pandas as pd 5 imp

tensorflow實現泰坦尼克號生存率預測（邏輯迴歸）

目錄 1 邏輯迴歸介紹其實我們可以把邏輯迴歸當成只有一層的神經網路。關於邏輯迴歸的具體知識可以參考我的上一邊部落格，地址：https://mp.csdn.net/postedit/82929291。使用交叉熵損失函式

Spark學習筆記——泰坦尼克生還預測

cti build case model 學習筆記 classes gre dict path package kaggle import org.apache.spark.SparkContext import org.apache.spark.SparkConf i

Python進行泰坦尼克生存預測——數據探索分析！

lar 探索 3.2 比較參考浮點型 AR image 位與 1 數據預覽 1.1 head() 預覽數據集的前面幾條數據可以大致看看每個字段的值究竟長什麽樣。 1.2 info() 可以看每個字段有多少非空值，字段的類型是什麽樣的 1.3 describe()

kaggle競賽：泰坦尼克倖存者預測

kaggle競賽：泰坦尼克倖存者預測——(一） import pandas as pd import numpy as np import matplotlib.pyplot as plt import seaborn as sns import os import warnin

泰坦尼克號預測學習總結

一明確課題：在泰坦尼克號之災事件中，建立乘客獲救情況（是/否）與其諸背景特徵之間的量化模型，並且依據此模型來預測有某些背景的人在該海難中能否獲救。二課題分析： 2.1 一個二分類問題。常用的分類演算法有邏輯迴歸、隨機森林、支援向量機（SVM）等等。

通過使用各種演算法（線性迴歸，邏輯迴歸，隨機森林，繼承演算法）預測泰坦尼克號上的某個人是否獲救

Python原始碼: #!/usr/bin/env python # encoding: utf-8 """ @Company：華中科技大學電氣學院聚變與等離子研究所 @version: V1.0 @author: Victor @contact: [email protected]

二分類問題（泰坦尼克號獲救預測）

# -*- coding: utf-8 -*- # @Time : 2018/12/13 10:46 # @Author : WenZhao # @Email : [email protected] # @File : tt.py # @Software: PyCha

使用sklearn進行kaggle案例泰坦尼克Titanic船員獲救預測

python程式碼: #-*- coding: UTF-8 -*- """ Created on Mon Mar 27 20:26:43 2017 @author: Administrator """ #!/usr/bin/python #-*- coding: U

機器學習專案實戰----泰坦尼克號獲救預測(一)

一、任務基礎泰坦尼克號沉沒是歷史上最著名的沉船事故之一。1912年4月15日，在她的處女航中，泰坦尼克號在與冰山相撞後沉沒，在2224名乘客和機組人員中造成1502人死亡。這場聳人聽聞的悲劇震驚了國際社會，併為船舶制定了更好的安全規定。造成海難失事的原因之一是乘客和機組人員沒有足夠的救生艇。儘管倖存下沉有

機器學習專案實戰----泰坦尼克號獲救預測(二)

四、特徵重要性衡量通過上面可以發現準確率有小幅提升，但是似乎得到的結果還是不太理想。我們可以發現模型似乎優化的差不多了，使用的特徵似乎也已經使用完了。準確率已經達到了瓶頸，但是如果我們還想提高精度的話，還是要回到最原始的資料集裡面。對分類器的結果最大的影響還是輸入的資料本身。接下來採用的方法一般是從原始的

小丸子踏入python之路：python_day05（用Pandas處理泰坦尼克船員獲救數據titanic_train.csv）

為什麽 pre known mba 否則 app () 功能 urn 泰坦尼克船員獲救數據：　　　　titanic_train.csv 用excel打開數據集。顯示如下：寫在前邊：　　為了方便以後運用numpy和pandas的庫，分別造它們的別名np和pd. im

機器學習之路: python 決策樹分類預測泰坦尼克號乘客是否幸存

現象 info n) 指標 ssi 直觀 learn 保持 afr 使用python3 學習了決策樹分類器的api 涉及到特征的提取，數據類型保留，分類類型抽取出來新的類型需要網上下載數據集，我把他們下載到了本地，可以到我的git下載代碼和數據集: https

kaggle練習項目—泰坦尼克乘客生還預測

sans 練習 missing 中文 ces 大寫 param show ont 一、問題復述　　泰坦尼克號是一艘英國皇家郵輪，在當時是全世界最大的海上船舶。1912年4月，該郵輪在首航中碰撞上冰山後沈沒。造成船上2224名人員中1514人罹難。　　現在根據乘客的船艙等

泰坦尼克號生存預測（python）

scores k近鄰 ace gbdt dom png 記錄 inline sse 1 數據探索對數據進行一個整體的理解 1.1 查看數據都有一些什麽特征 import pandas as pd import seaborn as sns %matplotlib inl

(決策樹)泰坦尼克號生還者簡單預測

import pandas as pd titanic=pd.read_csv('http://biostat.mc.vanderbilt.edu/wiki/pub/Main/DataSets/titanic.txt') X=titanic[['pclass','age','sex']] y=

ML之SVM：基於Js程式碼利用SVM演算法的實現根據Kaggle資料集預測泰坦尼克號生存人員

ML之SVM：基於Js程式碼利用SVM演算法的實現根據Kaggle資料集預測泰坦尼克號生存人員實驗資料設計思路實現程式碼(部分程式碼) /** js程式碼實現SVM演算法 */ //ML之SVM：基於Js程式碼利用SVM演算法的實現根據Kagg

機器學習之泰坦尼克號遇難預測

思路：一、資料預處理 1、資料讀取 2、可以用data.head（）來顯示資料的前幾行，date.info（）來顯示資料的資訊 3、缺失值的處理 4、挑選特徵 5、分離特徵和標籤二、train 1、選取模型（可以先簡單後複雜，如果兩個模型效果差不多，簡單的節約時間

kaggle 泰坦尼克預測案例

kaggle 泰坦尼克預測準確率79%。 #!/usr/bin/Python # -*- coding: utf-8 -*- # This Python 3 environment comes with many helpful analytics libraries installed # I

機器學習--決策樹及泰坦尼克號生存預測

決策樹是一個類似於流程圖的樹結構，分支節點表示對一個特徵進行測試，根據測試結果進行分類，樹葉節點代表一個類別。要判斷從哪個特徵進行分裂，就要對資訊進行量化，量化的方式有： ID3: 資訊增益條件熵：其中pi=P(X=xi)，X,Y代表了兩個事件，而它們之間有

《Tensorflow基礎泰坦尼克獲救預測》-- 網易雲課堂

相關推薦