1. 程式人生 > >要考三級了!我用Python把有道詞典單詞轉化成EXCEL!答題小助手

要考三級了!我用Python把有道詞典單詞轉化成EXCEL!答題小助手

要考三級了!我用Python把有道詞典單詞轉化成EXCEL!答題小助手

 

import xml.etree.ElementTree as ET
import pandas as pd
import numpy as np
tree = ET.parse('words.xml')
root = tree.getroot()
words = pd.DataFrame(columns = ['word','trans','phonetic'])
for item in root:
 df = pd.DataFrame({'word': item[0].text,
 'trans': item[1].text,
 'phonetic': item[2].text},
 index = item)
 print(df)
 words = pd.concat([words, df], ignore_index = True)
 words = words.drop_duplicates()
words.to_excel('words1.xlsx', sheet_name = '1')

要考三級了!我用Python把有道詞典單詞轉化成EXCEL!答題小助手

 

進群:548377875    即可獲取小編精心準備的資料全套呢!

在這裡面有兩個問題目前沒有看懂,一個是

words = words.drop_duplicates()

,為什麼要用這個,應為不用他的話每個單詞會列印5遍,沒辦法,我就把重複項去掉了,我也不知道為什麼會列印5遍。另外一個就是在sublime text 3中寫

words.to_excel('words1.xlsx', sheet_name = '1')

的時候,會出現

UnicodeEncodeError: 'gbk' codec can't encode character '\u028c' in position 134: illegal multibyte sequence

可能是因為,‘gbk’搞不定音標吧,我猜的啊,不知道怎麼解決,反正我在jupyter notebook中跑出來了。

是不是非常簡單!趕緊用起來吧~!