1. 程式人生 > >如何用python自動編寫《赤壁賦》word文件

如何用python自動編寫《赤壁賦》word文件

[toc] # 前言 蘇東坡,千古奇才,大家都喜歡他。叔叔也非常喜歡他,畢竟東坡肉外酥裡嫩,肥而不膩,堪稱人間極品。 不過,比起蘇東坡,叔叔更喜歡王維,為什麼捏? 1. 大帥哥。迷倒大唐公主 2. 專一。這樣一個大帥哥,在妻子過世後沒有再娶 3. 有才華。長得帥專一也就算了,居然寫詩、繪畫、音樂、書法還各種會,妥妥的頂級文藝青年。 這樣一個帥氣專一有才的人,試問誰不喜歡呢? 先跑個題,我們來看看王維愛情的名句 ``` 紅豆生南國,春來發幾枝。願君多采擷,此物最相思。 ``` 沒錯了,是心動的感覺!我們再來欣賞一句 ``` 空山新雨後,天氣晚來秋 ``` 再再來一句 ``` 大漠孤煙直,長河落日圓 ``` 臥槽!牛逼! 然而蘇東坡雖然是奇才,也有過“十年生死兩茫茫,不思量,自難忘”這樣的惦念亡妻名句,但是寫完之後繼續娶妻納妾。 回到正題,下面我們用程式來自動建立蘇總的《赤壁賦》word文件,並提取,學會這幾招,以後各種自動化處理word文件如有神助~ # 安裝-python-docx 我們需要用到一個python強大的庫:[python-dox](https://python-docx.readthedocs.io/en/latest/) 我們來安裝一下 ``` pip instal python-docx ``` >注意:不是安裝的docx 簡單介紹下原理: pyhton-docx包建立的文件一個Document物件,然後會在文件上新增各種物件:如段落、行內元素、表格、內容等, 文件層級結構類似下面這樣: > 文件-Document —段落Paragraph ——行內元素Runs ———內容text ———字型font ———顏色color ———字號size —內容text —表格tables ——單元格cell ——段落Paragraph # 一、自動編寫《赤壁賦》 ## 準備資料 ``` name = "赤壁賦" author = "蘇軾" dynasty = "宋" paragraphs = [ '''壬戌之秋,七月既望,蘇子與客泛舟遊於赤壁之下。清風徐來,水波不興。舉酒屬客,誦明月之詩,歌窈窕之章。少焉,月出於東山之上,徘徊於斗牛之間。白露橫江,水光接天。縱一葦之所如,凌萬頃之茫然。浩浩乎如馮虛御風,而不知其所止;飄飄乎如遺世獨立,羽化而登仙。''', '''於是飲酒樂甚,扣舷而歌之。歌曰:“桂棹兮蘭槳,擊空明兮溯流光。渺渺兮於懷,望美人兮天一方。”客有吹洞簫者,倚歌而和之,其聲嗚嗚然:如怨如慕,如泣如訴;餘音嫋嫋,不絕如縷;舞幽壑之潛蛟,泣孤舟之嫠婦蘇子愀然,正襟危坐,而問客曰:“何為其然也?”客曰:“月明星稀,烏鵲南飛,此非曹孟德之詩乎?西望夏口,東望武昌。山川相繆,鬱乎蒼蒼;此非孟德之困於周郎者乎?方其破荊州,下江陵,順流而東也,舳艫千里,旌旗蔽空,釃酒臨江,橫槊賦詩;固一世之雄也,而今安在哉?況吾與子漁樵於江渚之上,侶魚蝦而友糜鹿,駕一葉之扁舟,舉匏樽以相屬;寄蜉蝣與天地,渺滄海之一粟。哀吾生之須臾,羨長江之無窮;挾飛仙以遨遊,抱明月而長終;知不可乎驟得,託遺響於悲風。”''', '''蘇子曰:“客亦知夫水與月乎?逝者如斯,而未嘗往也;盈虛者如彼,而卒莫消長也。蓋將自其變者而觀之,而天地曾不能一瞬;自其不變者而觀之,則物於我皆無盡也。而又何羨乎?且夫天地之間,物各有主。苟非吾之所有,雖一毫而莫取。惟江上之清風,與山間之明月,耳得之而為聲,目遇之而成色。取之無禁,用之不竭。是造物者之無盡藏也,而吾與子之所共適。”''', '''客喜而笑,洗盞更酌,餚核既盡,杯盤狼藉。相與枕藉乎舟中,不知東方之既白。''' ] ``` ## 新建文件 ``` document = Document() document.styles['Normal'].font.name = u'微軟雅黑' document.styles['Normal']._element.rPr.rFonts.set(qn('w:eastAsia'), u'微軟雅黑') ``` 字裡設定了一下字型 ## 新增標題 ``` heading1 = document.add_heading(name, 0) heading1.alignment = WD_ALIGN_PARAGRAPH.CENTER ``` 這裡設定成了居中 ## 新增作者 ``` p = document.add_paragraph("【作者】") p.alignment = WD_ALIGN_PARAGRAPH.CENTER run = p.add_run(author) run.italic = True run.bold = True ``` 字型居中斜體加粗 ## 新增朝代 ``` p.add_run(" 【朝代】") run = p.add_run(dynasty) run.italic = True run.bold = True ``` 字型也是居中斜體加粗 ## 新增圖片 ``` document.add_picture('test.jpeg', width=Inches(2)) last_paragraph = document.paragraphs[-1] last_paragraph.alignment = WD_ALIGN_PARAGRAPH.CENTER ``` 為了讓效果更美觀一點,我們整張圖片潤色一下,圖片是這樣的 ![](https://img2020.cnblogs.com/blog/662544/202102/662544-20210223173148827-178964022.png) ## 新增段落 ``` for paragraph in paragraphs: p = document.add_paragraph(paragraph) # 建立段落物件 p.paragraph_format.first_line_indent = Inches(0.25) ``` 設定了下首行縮排 ## 儲存word文件 ``` document.save(''/Users/chenqionghe/Downloads/赤壁賦.docx'') ``` 大功告成,執行一下 ``` python create-poems.py ``` 看到生成了一個```赤壁賦.docx```,如下 ![](https://img2020.cnblogs.com/blog/662544/202102/662544-20210223173154723-2036890143.png) 開啟如下 ![](https://img2020.cnblogs.com/blog/662544/202102/662544-20210223173208356-1930560423.png) 天吶!這也太棒棒了吧~~ 下面貼出全部程式碼 ``` from docx import Document from docx.shared import Inches from docx.enum.text import WD_ALIGN_PARAGRAPH from docx.oxml.ns import qn titleName = "赤壁賦" author = "蘇軾" time = "宋" paragraphs = [ '''壬戌之秋,七月既望,蘇子與客泛舟遊於赤壁之下。清風徐來,水波不興。舉酒屬客,誦明月之詩,歌窈窕之章。少焉,月出於東山之上,徘徊於斗牛之間。白露橫江,水光接天。縱一葦之所如,凌萬頃之茫然。浩浩乎如馮虛御風,而不知其所止;飄飄乎如遺世獨立,羽化而登仙。''', '''於是飲酒樂甚,扣舷而歌之。歌曰:“桂棹兮蘭槳,擊空明兮溯流光。渺渺兮於懷,望美人兮天一方。”客有吹洞簫者,倚歌而和之,其聲嗚嗚然:如怨如慕,如泣如訴;餘音嫋嫋,不絕如縷;舞幽壑之潛蛟,泣孤舟之嫠婦蘇子愀然,正襟危坐,而問客曰:“何為其然也?”客曰:“月明星稀,烏鵲南飛,此非曹孟德之詩乎?西望夏口,東望武昌。山川相繆,鬱乎蒼蒼;此非孟德之困於周郎者乎?方其破荊州,下江陵,順流而東也,舳艫千里,旌旗蔽空,釃酒臨江,橫槊賦詩;固一世之雄也,而今安在哉?況吾與子漁樵於江渚之上,侶魚蝦而友糜鹿,駕一葉之扁舟,舉匏樽以相屬;寄蜉蝣與天地,渺滄海之一粟。哀吾生之須臾,羨長江之無窮;挾飛仙以遨遊,抱明月而長終;知不可乎驟得,託遺響於悲風。”''', '''蘇子曰:“客亦知夫水與月乎?逝者如斯,而未嘗往也;盈虛者如彼,而卒莫消長也。蓋將自其變者而觀之,而天地曾不能一瞬;自其不變者而觀之,則物於我皆無盡也。而又何羨乎?且夫天地之間,物各有主。苟非吾之所有,雖一毫而莫取。惟江上之清風,與山間之明月,耳得之而為聲,目遇之而成色。取之無禁,用之不竭。是造物者之無盡藏也,而吾與子之所共適。”''', '''客喜而笑,洗盞更酌,餚核既盡,杯盤狼藉。相與枕藉乎舟中,不知東方之既白。''' ] # 新建文件 document = Document() document.styles['Normal'].font.name = u'微軟雅黑' document.styles['Normal']._element.rPr.rFonts.set(qn('w:eastAsia'), u'微軟雅黑') heading1 = document.add_heading('赤壁賦', 0) heading1.alignment = WD_ALIGN_PARAGRAPH.CENTER # 新增作者(居中斜體加粗) p = document.add_paragraph("【作者】") p.alignment = WD_ALIGN_PARAGRAPH.CENTER run = p.add_run(author) run.italic = True run.bold = True # 新增朝代(居中斜體加粗) p.add_run(" 【朝代】") run = p.add_run(time) run.italic = True run.bold = True # 新增圖片(居中) document.add_picture('test.jpeg', width=Inches(2)) last_paragraph = document.paragraphs[-1] last_paragraph.alignment = WD_ALIGN_PARAGRAPH.CENTER # 寫下文章(首行縮排) for paragraph in paragraphs: p = document.add_paragraph(paragraph) # 建立段落物件 p.paragraph_format.first_line_indent = Inches(0.25) document.save(''/Users/chenqionghe/Downloads/赤壁賦.docx') ``` # 二、自動提取《赤壁賦》的文字 既然可以自動編寫word文件,我們也可以自動提取word文件。 比如有人給你發了500個文件,你只是想快速根據文字瞭解一下內容,又不想一個一個開啟,這時候就可以用程式自動提取文字啦~ 下面演示一下把剛剛生成的文件內容全部弄出來 ``` from docx import Document # 指定文件路徑 docFile = '/Users/chenqionghe/Downloads/赤壁賦.docx' # 開啟文件為Document物件 document = Document(docFile) # 遍歷所有的段落儲存到text陣列 text = [] for para in document.paragraphs: text.append(para.text) # 開啟最終結果 print('\n'.join(text)) ``` 我們來執行一下,結果如下 ![](https://img2020.cnblogs.com/blog/662544/202102/662544-20210223173232328-1032820765.png) 哦豁,我們並沒有開啟介過word文件,但系已經愉快地把詞弄出來遼~ 以上內容由chenqionghe提供,是不是超級簡單呀~ 有了這兩張,以後想寫用程式寫啥都可以提示準備好,比如自動生成500首唐詩或作文,又比如一個不開啟一堆word文件就把所有的內容提取出來合併成一個檔案, 又比自動寫作文或自動提取答案啥的,簡直不要太嗨~