【python pandas】資料框行轉列,列轉行
測試資料:
context_id subject_gmt differtime browse_count click_count like_count commet_count reply_count score_value
last1 2018/8/12 10:35 2920.066 150 78 55 15 46 5
last2 2018/8/11 15:02 4093.066 68 57 42 6 10 4
last3 2018/8/13 15:10 1205.066 54 12 5 0 10 4
last4 2018/7/13 10:10 46145 .066 853 833 556 358 665 8
last5 2018/8/12 9:35 2980.066 12 5 1 0 7 2
last6 2018/8/13 14:02 1273.066 8 2 0 2 6 2
last7 2018/8/10 15:10 5525.066 812 765 589 652 234 12
last8 2018/7/13 9:10 46205.066 87 82 65 79 86 3
last9 2018/8/12 13:05 2770.066 189 135 102 132 84 4
last10 2018/8/11 15:55 4040.066 335 226 188 220 175 8
我們常常需要將DataFrame物件中的某列或某幾列作為索引,或者將索引轉化為物件的列。
pandas提供了set_index()/reset_index() 來供我們使用。
# -*- encoding=utf-8 -*-
import pandas as pd
ceshi = pd.read_csv(u'F:/下載/context_data.csv')
# print(ceshi)
# melt行轉列
bd = pd.melt(ceshi, id_vars=['context_id','subject_gmt' ],value_vars=['browse_count','click_count','like_count','commet_count','reply_count','score_value'], var_name='count_type',value_name='count_value')
# print(bd)
# pivot_table 列轉行
mdd = pd.DataFrame(pd.pivot_table(bd, index = ['context_id','subject_gmt'],columns = 'count_type', values = 'count_value'))
# 索引轉換為列
mdd.reset_index(inplace=True)
print(mdd)
E:\laidefa\python.exe "E:/Program Files/pycharmproject/線上模型/行轉列.py"
context_id subject_gmt count_type count_value
0 last1 2018/8/12 10:35 browse_count 150
1 last2 2018/8/11 15:02 browse_count 68
2 last3 2018/8/13 15:10 browse_count 54
3 last4 2018/7/13 10:10 browse_count 853
4 last5 2018/8/12 9:35 browse_count 12
5 last6 2018/8/13 14:02 browse_count 8
6 last7 2018/8/10 15:10 browse_count 812
7 last8 2018/7/13 9:10 browse_count 87
8 last9 2018/8/12 13:05 browse_count 189
9 last10 2018/8/11 15:55 browse_count 335
10 last1 2018/8/12 10:35 click_count 78
11 last2 2018/8/11 15:02 click_count 57
12 last3 2018/8/13 15:10 click_count 12
13 last4 2018/7/13 10:10 click_count 833
14 last5 2018/8/12 9:35 click_count 5
15 last6 2018/8/13 14:02 click_count 2
16 last7 2018/8/10 15:10 click_count 765
17 last8 2018/7/13 9:10 click_count 82
18 last9 2018/8/12 13:05 click_count 135
19 last10 2018/8/11 15:55 click_count 226
20 last1 2018/8/12 10:35 like_count 55
21 last2 2018/8/11 15:02 like_count 42
22 last3 2018/8/13 15:10 like_count 5
23 last4 2018/7/13 10:10 like_count 556
24 last5 2018/8/12 9:35 like_count 1
25 last6 2018/8/13 14:02 like_count 0
26 last7 2018/8/10 15:10 like_count 589
27 last8 2018/7/13 9:10 like_count 65
28 last9 2018/8/12 13:05 like_count 102
29 last10 2018/8/11 15:55 like_count 188
30 last1 2018/8/12 10:35 commet_count 15
31 last2 2018/8/11 15:02 commet_count 6
32 last3 2018/8/13 15:10 commet_count 0
33 last4 2018/7/13 10:10 commet_count 358
34 last5 2018/8/12 9:35 commet_count 0
35 last6 2018/8/13 14:02 commet_count 2
36 last7 2018/8/10 15:10 commet_count 652
37 last8 2018/7/13 9:10 commet_count 79
38 last9 2018/8/12 13:05 commet_count 132
39 last10 2018/8/11 15:55 commet_count 220
40 last1 2018/8/12 10:35 reply_count 46
41 last2 2018/8/11 15:02 reply_count 10
42 last3 2018/8/13 15:10 reply_count 10
43 last4 2018/7/13 10:10 reply_count 665
44 last5 2018/8/12 9:35 reply_count 7
45 last6 2018/8/13 14:02 reply_count 6
46 last7 2018/8/10 15:10 reply_count 234
47 last8 2018/7/13 9:10 reply_count 86
48 last9 2018/8/12 13:05 reply_count 84
49 last10 2018/8/11 15:55 reply_count 175
50 last1 2018/8/12 10:35 score_value 5
51 last2 2018/8/11 15:02 score_value 4
52 last3 2018/8/13 15:10 score_value 4
53 last4 2018/7/13 10:10 score_value 8
54 last5 2018/8/12 9:35 score_value 2
55 last6 2018/8/13 14:02 score_value 2
56 last7 2018/8/10 15:10 score_value 12
57 last8 2018/7/13 9:10 score_value 3
58 last9 2018/8/12 13:05 score_value 4
59 last10 2018/8/11 15:55 score_value 8
count_type context_id subject_gmt browse_count click_count \
0 last1 2018/8/12 10:35 150 78
1 last10 2018/8/11 15:55 335 226
2 last2 2018/8/11 15:02 68 57
3 last3 2018/8/13 15:10 54 12
4 last4 2018/7/13 10:10 853 833
5 last5 2018/8/12 9:35 12 5
6 last6 2018/8/13 14:02 8 2
7 last7 2018/8/10 15:10 812 765
8 last8 2018/7/13 9:10 87 82
9 last9 2018/8/12 13:05 189 135
count_type commet_count like_count reply_count score_value
0 15 55 46 5
1 220 188 175 8
2 6 42 10 4
3 0 5 10 4
4 358 556 665 8
5 0 1 7 2
6 2 0 6 2
7 652 589 234 12
8 79 65 86 3
9 132 102 84 4
Process finished with exit code 0
相關推薦
【python pandas】資料框行轉列,列轉行
測試資料: context_id subject_gmt differtime browse_count click_count like_count commet_count reply_count score_value last1
【Python學習】程序運行完發送郵件提醒
直接 登錄 word 提醒 地址 install python3 ont world 有時候我們運行一個需要跑很長時間的程序,不管是在雲主機還是本地主機上運行,我們都不可能一直守在電腦面前等。所以想到使用郵件來通知提醒。 示例代碼如下 # -*- coding: utf-8
【Python求助】在eclipse和pycharm中,通過adb install安裝中文名字APK時老是報錯,如何解決
style com all auto RoCE mod python lin sage 1 # -*- coding: utf-8 -*- 2 import os 3 import sys 4 import subprocess 5 import time 6 from
【Unity&UGUI】輸入框程式碼控制InputField,並顯示輸入文字
----------------- using System.Collections; using System.Collections.Generic; using UnityEngine; using UnityEngine.UI;//使用 該引用,才能獲得 Text
【Python實戰】Pandas:讓你像寫SQL一樣做資料分析(二)
1. 引言 前一篇介紹了Pandas實現簡單的SQL操作,本篇中將主要介紹一些相對複雜一點的操作。為了方便後面實操,先給出一份簡化版的裝置統計資料: 0 android NLL 387546520 2099457911 0 ios NLL 52877990 916421755 1 and
【Python實戰】Pandas:讓你像寫SQL一樣做資料分析(一)
1. 引言 Pandas是一個開源的Python資料分析庫。Pandas把結構化資料分為了三類: Series,1維序列,可視作為沒有column名的、只有一個column的DataFrame; DataFrame,同Spark SQL中的DataFrame一樣,其概念來自於R語言,為多column並sch
網頁格式gbk轉utf-8【python requests】
sts url ont content req utf nic tex ext resp = requests.get(url) resp.content 是str格式 resp.text是unicode格式 如果返回的中文使用gbk編碼,需要轉換成utf-8的時候:
【Python學習】解決pandas中打印DataFrame行列顯示不全的問題
需要 pandas pre pytho 如果 clas panda 顯示不全 可能 在使用pandas的DataFrame打印時,如果表太長或者太寬會自動只給前後一些行列,但有時候因為一些需要,可能想看到所有的行列。 所以只需要加一下的代碼就行了。 #顯示所有列 pd.se
【Python-GPU】GPU資料科學加速包——RAPIDS
英偉達開源GPU加速庫RAPIDS RAPIDS是一個支援在GPU上進行端到端資料科學和分析流程的包,在後端CUDA的支援下利用簡單的python介面供資料科學家和工程師使用。 Rapids主要致力於通用的資料預處理階段,包含了對於DataFrame的API。同時也
【Python程式設計】Pycharm如何設定自動換行
Pycharm如何設定自動換行 在寫這篇IDE文章之前我在網上找了幾個文件做了參考。 我按照以上圖中找到了相關的配置選項並勾選如下: 設定完成後我測試是否可以換行,如下: 並沒有發現可以換行,於是我重新打開了pycharm再次嘗試,神奇的事情發生了,它還是沒有自動換行,找
Python Pandas 做資料分析之玩轉 Excel 報表分析
Python Pandas 是大資料分析的基礎,這裡將分享和Excel報表相關的分析技巧,都是工作中的實戰內容。 本場 Chat 主要內容: Excel、CSV 資料的讀、寫、儲存; DataFrame 的 Index、Columns 相關操作; loc、iloc、XS 和 Mul
【Python開發】Python中資料分析環境的搭建
注:無論是任何一門語言,剛開始入門的時候,語言執行環境的搭建都是一件不輕鬆的事情。 Python的執行環境 要執行或寫Python程式碼,就需要Python的執行環境,主要的Python有以下三類: 原生態的Python:就是直接從Python的官網下載,然後安裝使
【Pandas】資料合併和連線
pandas提供了各種工具,可以在連線/合併型別操作的情況下,輕鬆地將Series,DataFrame和Panel物件與索引和關係代數功能的各種設定邏輯組合在一起。 目錄 連線物件 檢查重複鍵 合併指標 加入索引
【Python程式設計】對excel進行資料分析 (mark)
Python對excel進行分析 目前有一個excel表,其中裡面有一個工作薄的名稱為:btc,在這個工作薄中有2013年–2018年的所有交易資料,本文主要實現,將不同的年份的資料儲存至新的工作薄並起名成為:2013,2014等等。 如
【MOOC】Python資料分析與展示-北京理工大學-【第一週】資料分析之表示
單元一:NumPy庫入門 1.1 資料的維度 維度:一組資料的組織形式 一維資料 一維資料由對等關係的有序或無序資料構成,採用線性方式組織,對應列表、陣列和集合等概念 如:3.1413, 3.1398, 3.1404, 3.1401, 3.13
【python Excel】如何使用python將大量資料匯出到Excel中的小技巧之二
最近對python的openpyxl 升級到了__version__ = '2.5.4',發現原先的程式碼不能使用,各種報錯之後,然後重新了寫的版本,故分享給各位同仁。如有錯誤,敬請賜教。# coding:utf-8 """ File Name: Excel.py Func
【Python+OpenCV】實現RGB轉HSI
cv2.cvtColor函式封裝了各種顏色空間之間的轉換,唯獨沒有RGB與HSI之間的轉換,網上查來查去也只有C++或MATLAB版本的,自己要用到python裡,所以就寫寫python版本的。 HSI顏色模型是一個滿足計算機數字化顏色管理需要的高度抽象模
【Python開發】檢視資料型別
import types aaa = 0 print type(aaa) if type(aaa) is types.IntType: print "the type of aaa is int" if isinstance(aaa,int
【廖雪峰Python習題集】資料型別和變數
請打印出一下變數的值: n=123 f=456.789 s1='Hello,world' s2='Hello,\'Adam\" s3=r'Hello,"Bart"' s4=r"'Hello, Lisa
【Python開發】Url中文字元時記得轉碼edcode("utf-8")
在url中使用中文其實是一個壞習慣,會帶來一系列的轉碼問題, 我更喜歡英文譯名或者id來標識某個uri。但是現實往往是殘酷的, 特別是在我們呼叫別人服務時候,有時候被逼無奈使用中文URL。 Python中unicode轉碼一向是讓人頭疼的問題。數次碰壁之後,我也摸出了一