1. 程式人生 > >原始語料庫

原始語料庫

第一步:
判斷資料中是否存在重複資料
建立python檔案–

程式碼框架

'''
author: kzb
time: 2018-12-10
'''

import pandas			as pd
import os,csv

dataPath = os.path.join("音譯原始資料.csv")

def import_data(dataPath):
	'''
	匯入檔案中的資料
	return:dataFrame
	'''
	pass

def find_En_Cn_excess(dataFrame):
	'''
	查出EnName、CnName列中存在多餘資料的項
	例如:“Abaagu,”、“阿布(教名Abijah、Able、Abner、Absalom的暱稱)”
	param:dataFrame
	return:dataFrame
	'''
pass def write_to_file(dataFrame): ''' 將資料寫入檔案中 param:dataFrame ''' pass def main(): ''' 程式入口 ''' pass if __name__ == '__main__': main()