1. 程式人生 > >怎樣合併資料,用兩個關鍵字合併資料

怎樣合併資料,用兩個關鍵字合併資料

#在旗艦店商品表中的店鋪ID轉換成編號
setwd("C:/Users/11565/Desktop/合併二")
xqijian <- read.csv("旗艦店商品正確合併.csv",header = T)#讀取旗艦店資料
x3 <- read.csv("旗艦店店鋪連結.csv",header = T)#讀取店鋪的id,即最後一天所有的旗艦店店鋪ID
x4 <- read.csv("旗艦店商品連結187.csv",header = T)
x12 <- factor(xqijian$store_id,labels = c(1:59),levels = x3[,1])#將商品表中的店鋪ID轉換成編號
x121 <- as.data.frame(factor(xqijian$store_id,labels = c(1:59),levels = x3[,1]))#將商品表中的店鋪ID轉換成編號

#有些商品的store_id只存在於商品中,對應的店鋪資料沒有蒐集,所以才會出現na的資料
#也就是此類資料商品可以刪除
#原因商品對應店鋪的資料沒有蒐集,有750個數據沒有匹配大致750/45/3=6,大概六個店鋪的資料沒有蒐集
write.table(x121,"x121.csv",sep = ",",row.names = F,col.names = T)#用於檢視有多少na(不匹配)資料
x13 <- factor(xqijian$commodity_ip,labels = c(1:187),levels = x4[,1])#將商品表中的店鋪ID轉換成編號
x131 <- as.data.frame(factor(xqijian$commodity_ip,labels = c(1:187),levels = x4[,1]))
#出現na的原因可能是這個商品原表中,商品本身是下架或者是殭屍商品,
#蒐集的時候個別同學把這一行的資料全部刪除了,包括商品連結,有24條資料無法匹配
write.table(x131,"x131.csv",sep = ",",row.names = F,col.names = T)
xqijian$s_bianhao <- paste("s",x12,sep = "")#將編號前面加入s,表示店鋪;並且將編號加入到資料框
xqijian$c_bianhao <- paste("c",x13,sep = "")#將編號前面加入c,表示商品;並且將編號加入到資料框
write.table(xqijian, "旗艦店商品加編號.csv", sep =",", row.names =FALSE, col.names =TRUE)#將加了

#在淘寶店店商品表中的店鋪ID轉換成編號
setwd("C:/Users/11565/Desktop/合併二")
xtaobao<- read.csv("淘寶店商品正確合併.csv",header = T)#讀取淘寶店店資料
x5 <- read.csv("淘寶店店鋪連結.csv",header = T)#讀取店鋪的id,即最後一天所有的淘寶店店店鋪ID
x6 <- read.csv("淘寶店商品連結188-306.csv",header = T)
x14 <- factor(xtaobao$store_id,labels = c(60:135),levels = x5[,1])#將商品表中的店鋪ID轉換成編號
x141 <- as.data.frame(factor(xtaobao$store_id,labels = c(60:135),levels = x5[,1]))
write.table(x141,"x141.csv",sep = ",",row.names = F,col.names = T)
#淘寶商品和店鋪是一一對應關係,不存在有商品無店鋪的情況
x15 <- factor(xtaobao$commodity_ip,labels = c(188:306),levels = x6[,1])#將商品表中的店鋪ID轉換成編號
x151 <- as.data.frame(factor(xtaobao$commodity_ip,labels = c(188:306),levels = x6[,1]))
write.table(x151,"x151.csv",sep = ",",row.names = F,col.names = T)
#出現na的原因可能是這個商品原表中,商品本身是下架或者是殭屍商品,
#蒐集的時候個別同學把這一行的資料全部刪除了,包括商品連結,有111條資料無法匹配
xtaobao$s_bianhao <- paste("s",x14,sep = "")#將編號前面加入s,表示店鋪;並且將編號加入到資料框
xtaobao$c_bianhao <- paste("c",x15,sep = "")#將編號前面加入s,表示店鋪;並且將編號加入到資料框
write.table(xtaobao, "淘寶店加編號.csv", sep =",", row.names =FALSE, col.names =TRUE)#將加了
#給旗艦店店鋪加編碼
setwd("C:/Users/11565/Desktop/合併二")
xqijiandian <- read.csv("旗艦店店鋪分開篩選.csv",header = T)#讀取旗艦店店鋪資料
x3 <- read.csv("旗艦店店鋪連結.csv",header = T)#讀取店鋪的id,即最後一天所有的旗艦店店鋪ID
x17 <- factor(xqijiandian$store_id,labels = c(1:59),levels = x3[,1])#將商品表中的店鋪ID轉換成編號
x171 <- as.data.frame(factor(xqijiandian$store_id,labels = c(1:59),levels = x3[,1]))
write.table(x171,"x171.csv",sep = ",",col.names = T,row.names = F)#沒有出現NA資料
xqijiandian$s_bianhao <- paste("s",x17,sep = "")#將編號前面加入s,表示店鋪;並且將編號加入到資料框
write.table(xqijiandian,"旗艦店店鋪加編號.csv", sep =",", row.names =FALSE, col.names =TRUE)#將加了
#給淘寶店店鋪加編碼
xtaobaodian <- read.csv("淘寶店鋪合併分開篩選.csv",header = T)#讀取淘寶店店鋪資料
x3 <- read.csv("淘寶店店鋪連結.csv",header = T)#讀取店鋪的id,即最後一天所有的淘寶店店店鋪ID
x18 <- factor(xtaobaodian$store_id,labels = c(60:135),levels = x3[,1])#將商品表中的店鋪ID轉換成編號
x181 <- as.data.frame( factor(xtaobaodian$store_id,labels = c(60:135),levels = x3[,1]))
write.table(x181,"x181.csv",sep = ",",col.names = T,row.names = F)#沒有出現NA資料
xtaobaodian$s_bianhao <- paste("s",x18,sep = "")#將編號前面加入s,表示店鋪;並且將編號加入到資料框
write.table(xtaobaodian,"淘寶店店鋪加編號.csv", sep =",", row.names =FALSE, col.names =TRUE)#將加了
#說明店鋪合併資料正常