第六章（酸奶飲料新產品口味測試案例研究）

阿新 • • 發佈：2019-01-29

分析目的

在10中種樣品中，最受歡迎的是哪幾種
消費者的口味在不同城市有什麼不同
分析城市和品牌是否存在互動作用

交叉表

不同因素下均值描述

步驟：分析——比較均值——均值

條圖顯示不同品牌的口味評分均值（帶誤差線）

不同品牌評分分析

避免城市因素的干擾（可能存在互動項），對每個城市的樣本分別進行分析

按城市分割檔案

步驟：資料——拆分檔案——選擇城市作為分組依據

單因素方差分析

由於品牌的值為字串變數，無法在比較均值——單因素ANONA分析中顯示，因此採用一般線性模型——單因素即可

由上圖可知，p<0.05,拒絕原假設：沒有差異。推出在成都不同品牌間的評分是有顯著性差異的（其他城市與上表類似，不再贅述）。

兩兩比較到底是哪幾種品牌有明顯的差異

S-N-K檢驗

不同子集的個體是有顯著差異的，例如子集1中的"三*"和子集2中的"試製品2"

不同兩兩比較的檢驗選擇：

單因素方差分析需要滿足方差齊性檢驗

P>0.05，接受原假設，認為方差是相等的，滿足方差齊性

建立包含互動效應的飽和模型的方差分析

步驟：分析——一般線性模型——單因素

互動項的的p值>0.05，表明互動相關不顯著。

剔除互動項，建立主效應的方差分析模型

因為互動項的影響不顯著，因此可以直接選擇city和brand兩兩比較

由上圖可知，廣州的評分比成都評分小好多，其他城市兩兩差異不明顯；10種樣品種，試製品1的評分最好，且香*、海*、子*、試製品1、試製品2的評分五明顯差異。

python實現

交叉表

import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
plt.style.use("ggplot")

data = pd.read_csv(r"C:\Users\Administrator\Desktop\city&brand.csv",encoding = "utf-8")

data.groupby(["city","brand"]).count().unstack()

	result
brand	E	F	G	H	I	J	K	L	M	N
city										
1	40	40	37	45	37	51	48	48	43	46
2	44	41	42	44	36	47	42	46	53	52
3	33	43	46	51	57	36	48	38	36	37
4	45	38	44	38	43	48	44	44	55	45

不同城市、品牌的評分均值

data.groupby(["city"]).result.mean()

city
1    6.222989
2    6.165548
3    5.920000
4    6.306306
Name: result, dtype: float64

data.groupby(["brand"]).result.mean()

brand
E    5.845679
F    5.598765
G    6.692308
H    5.679775
I    5.895954
J    5.736264
K    6.747253
L    6.409091
M    6.385027
N    6.494444
Name: result, dtype: float64

不同品牌的評分均值柱狀圖

brand_std = data.groupby(["brand"]).result.mean().std()
data_brand = data.groupby(["brand"]).result.mean()
data_brand.plot(kind = "bar",yerr = brand_std,error_kw ={'ecolor':"k","elinewidth":1,"capsize":4})

選取成都做單因素方差分析

from statsmodels.formula.api import ols
from statsmodels.stats.anova import anova_lm

data_chengdu = data[data["city"]==4]
model = ols("result ~ brand",data_chengdu).fit()
anovat = anova_lm(model)
print(anovat)

             df       sum_sq    mean_sq         F    PR(>F)
brand       9.0   129.160998  14.351222  4.205042  0.000031
Residual  434.0  1481.181344   3.412860       NaN       NaN

和spss的方差分析結果一樣。

s-n-k檢驗沒有在python相應的庫中找到。。。。。。。。

建立包含互動效應的飽和模型（在python裡，分類變數的值必須為字串格式，後面改了過來，檢驗才正確）

tra_dict = {1:"上海",2:"北京",3:"廣州",4:"成都"}
data.city = data.city.map(tra_dict)

formula = 'result ~ brand + city + brand:city'
anova_results = anova_lm(ols(formula,data).fit())
print(anova_results)



                df       sum_sq    mean_sq         F        PR(>F)
brand          9.0   303.967975  33.774219  8.746265  6.030751e-13
city           3.0    32.674024  10.891341  2.820452  3.769134e-02
brand:city    27.0   120.666503   4.469130  1.157338  2.633372e-01
Residual    1711.0  6607.127820   3.861559       NaN           NaN

除了sum_sq有些差別外，其他值都是和spss檢驗一樣的。

剔除互動項

formula = 'result ~ brand + city '
anova_results = anova_lm(ols(formula,data).fit())
print(anova_results)

              df       sum_sq    mean_sq         F        PR(>F)
brand        9.0   303.967975  33.774219  8.724939  6.486587e-13
city         3.0    32.674024  10.891341  2.813575  3.803745e-02
Residual  1738.0  6727.794323   3.870998       NaN           NaN

完。

第六章（酸奶飲料新產品口味測試案例研究）

分析目的在10中種樣品中，最受歡迎的是哪幾種消費者的口味在不同城市有什麼不同分析城市和品牌是否存在互動作用交叉表不同因素下均值描述步驟：分析——比較均值——均值條圖顯示不同品牌的口味評分均值（帶誤差線）不同品牌評分分析

UNP學習第六章（二）

默認 clas 套接字 post 討論默認值第六章數據當前一、描述符就緒條件對於引起select返回套接字“就緒”的條件我們必須討論得更明確：（1）滿足一下塞個條件中的仍和一個時，一個套接字準備好讀。 a）該套接字接收緩沖區中的數據字節數不大於等於套接字接收緩

PMBOK(第六版) PMP筆記——《六》第六章（專案進度管理）

專案進度管理專案進度管理包括為管理專案按時完成所需的各個過程。專案進度計劃（Schedule）說明了專案如何以及何時交付專案範圍中定義的產品、服務和成果。建立 WBS 最底層得到的是工作包，但是為了更好的估算活動持續時間和活動成本。把最底層的工作包繼續分解，就得到活動。活

第六章（隨機梯度下降）

測試資料1： 5,1 1 7,2 1 9,3 2 11,4 1 19,5 3 18,6 2 測試程式碼1： import org.apache.spark.mllib.linalg.Vectors import org.apache.spark.mllib.regression

SQL第六章（儲存過程）

1、儲存過程的優點 ①允許模組化程式設計 ②執行速度更快 ③減少網路流通量 ④提高系統安全性 2、儲存過程的分類 ①系統儲存過程 ②使用者自定義儲存過程 3、常用的系統儲存過程 4、使用儲存過程 ①定義儲存過程分語法 cr

Python入門筆記—第六章（面向物件之OOP）

第六章：面向物件之OOP 1.面向物件的概述（Object Oriented,OO） 1.1 名詞解釋 OO(Object Oriented):面向物件 OOA(Object Oriented Analysis):面向物件的分析 OOD(Object Oriente

《C語言的科學與藝術》課後習題答案第六章（部分）

6.2//素數分解，並顯示各因子，列60，2*2*3*5 #include <stdio.h> #include <genlib.h> #include <simpio.h> #include <math.h> bool

周志華《機器學習》之第六章（支援向量機）概念總結

在之前就一直總是零零碎碎瞭解過這個熱及一時的統計學方法對樣本進行分類的支援向量機演算法。一直想系統的瞭解一下支援向量機這個很強的分類演算法，有幸在周老師的機器學習這本書中進行系統的學習。這裡我只列出一些需要重點理解的概念，以方便以後自己進行回顧，在部落格中也

機器學習實戰-第六章（支援向量機）

1 拉格朗日乘子法(等式約束)：目標函式：f(x)=b+wTxi+∑(αihi),s.t.hi=0 最優解條件：∂h∂xi=0 2 kkt(不等式約束)：目標函式：f(x)=b+wTxi+∑(αigi)+∑(βihi),s.t.hi=0,gi≤0

第六章（1.3）自然語言處理實戰——使用tf-idf演算法實現簡單的文字聚類

一、原理使用jieba切詞用td-idf計算文字的詞頻和逆文件詞頻排序選出最重要的2個或3個詞作為這段文字的id 具有相同id的文字被歸為一類二、使用python實現簡單的文字聚類，其中使用了tf-idf演算法，jieba分詞，把相似的文字聚合在

C++ 第六章（多型性和虛擬函式）上篇

目錄多型性多型性的定義例子虛擬函式虛擬函式的作用什麼情況下使用虛擬函式虛解構函式純虛擬函式和抽象類什麼是多型性面對不同的物件傳送同一個訊息，不同的物件

C++ 第六章（多型性和虛擬函式）下篇（虛解構函式和純虛擬函式）

一，虛解構函式如果用new運算子建立了臨時物件，若基類中有解構函式並且定義了一個指向該基類的指標變數。在程式用帶指標引數的delete運算子撤銷物件時，會發生：系統只執行基類的解構函式，而不執行派生類的解構函式。 #include<iostream> using

JAVAOOP—第六章（集合框架）學習筆記

1.什麼是集合框架？集合框架是為表示和操作而規定的一種統一的標準體系結構，它包含大塊內容：對外的介面、介面的實現和對集合運算的演算法。它們都位於java.util包中。(1)介面：表示集合的抽象資料型別，在上面的圖中以虛線表示，如Collection、List、Set、Map

演算法導論第六章（堆排序）

維護堆的性質（MAX-HEAPIFY）：每一步從A[i]，A[LEFT(i)]，A[RIGHT(i)]中選出最大的。如果A[i]是最大的，程式結束。如果不是，則A[i]和最大的那一個交換。以原來最大的節點為根的字數又可能違反最大堆的性質，因此，對該子樹遞迴呼叫MAX-HE

第六章（1.2）自然語言處理實戰——打造屬於自己的中文word2vector工具

一、環境二、實戰演練訓練語料source.txt 9月12日隨著頒獎典禮的結束,我院獲得了商委系統運動會系列活動之一——足球比賽的季軍,本次比賽立時十天,十二隻球隊分成兩個小組比賽。我院代表隊以小組第二名的成績出現,在和另一小組第二名石油公

第六章（1.4）自然語言處理實戰——時間語義抽取

一、簡介本工具是由復旦NLP中的時間分析功能修改而來，做了一些細節和功能的優化，經SpringBoot封裝成web工具。泛指時間的支援，如：早上、晚上、中午、傍晚等。時間未來傾向。如：在週五輸入“週一早上開會”，則識別到下週一早上的時間；在下午

Win32API學習筆記第六章（二）

這次記錄的是一部分選單的內容（由於VS生成的已經比較全面了，所以這裡主要是講使用） // Win32ProjectRc.cpp : 定義應用程式的入口點。 // #include "stdafx.h" #include "Win32ProjectRc.h

鳥哥的Linux私房菜筆記第六章（二）

檔案內容查詢直接查詢檔案內容查閱一個檔案的內容可以使用指令cat/tac/nl。 # [cat|tac|nl] 檔案區別： 1.cat是直接把檔案內容輸出到螢幕上，並且從第一行開始輸出到末行 2.tal和cat相同，只不過tal是從末行反過來開始輸出到第一行 3.nl則是可以新增行號列印，第一行可以顯示

MySQL第六天（主從同步，數據讀寫分離）

dsfaday05一、數據備份與恢復-增量備份和增量恢復a.binlog日誌介紹（二進制文件）：使用Mysql數據庫服務日誌文件類型的一種。記錄除查詢之外的sql命令。默認沒啟用查詢的sql包括：select desc show 不是查詢的命令：insert update delete create dr

敏捷開發系列終極之旅第六站（像橄欖球運動一樣富有激情的SCRUM）

適用的專案剛剛瞭解Scrum的朋友，經常會有這樣的疑問：到底什麼樣的專案適合使用Scrum呢？我們也一直在探討。首先，我們來看一下關於過程的定義。過程控制通常有兩種形式，一種是預定義過程，另一種則是經驗性過程。預定義過程每一項工作都可以被完全理解給予合理的輸入定義，每次便可以得到相同的輸出過

第六章（酸奶飲料新產品口味測試案例研究）

相關推薦