1. 程式人生 > >Linux下讀取doc,docx檔案

Linux下讀取doc,docx檔案

docx檔案
利用python-docx包,好像暫時不支援python3。

# -*- coding:utf-8 -*-
import sys
import docx

path = sys.argv[1]

file = docx.Document(path)
for para in file.paragraphs:
	print para.text

使用命令列傳引數

python test.py filename

例子
在這裡插入圖片描述

doc檔案

python-docx不支援doc檔案的
我們可以使用antiword,下載完,解壓,進入該檔案,分別使用makemake install。安裝完後,主目錄會出現bin資料夾

,用命令列進入。使用pwd檢視該目錄的路徑。

使用su,輸入密碼,然後設定環境變數

PATH=$PATH:your's bin path(輸入上面pwd出現的路徑)

echo $PATH檢視PATH是否成功匯入。
成功匯入後,我們就可以在任何的shell和路徑使用antiword了。

EX
在這裡插入圖片描述

相關推薦

Linux讀取doc,docx檔案

docx檔案 利用python-docx包,好像暫時不支援python3。 # -*- coding:utf-8 -*- import sys import docx path = sys.argv[1] file = docx.Document(path

windows和linux讀取檔案換行符的一個坑——\r\n和\n

      拿同事的一個windows下的C程式,在Linux下跑,結果不正確。定位為讀取.ini配置檔案錯誤。該配置檔案是在windows下編輯的,網上查到資料,說是windows和linux下對換行符處理不同導致的。      

Linux讀取Ini檔案

#include "Ini.h" /****************************************************************************** * 功 能:建構函式 * 參 數:無 * 返回值:無 * 備 注: *********************

Linux讀取RFID卡號(C串口編程)

start itl star tor 卡號 字節數 同時 描述符 lag 由於項目需要用到RFID、GPRS、攝像頭等模塊所以便看了一下,整理了一下學習思路,本篇先是整理一下串口讀取RFID卡號的程序思路,後面還會更其他的 RFID模塊: 本次采用的是125K的RF

Linux讀取位圖需要註意什麽

Linux 位圖 在Linux下讀取位圖遇到的問題,很好地體現了linux與Windows操作系統的不同。按理說位圖格式與操作系統無關,讀取也應該無關,實際上在位圖讀到內存中時已經不同。下面主要介紹自己在Linux下操作位圖遇到的問題。 (一)、位圖結構 位圖一開始是兩個結構體,包括位圖的詳細

linux常用標頭檔案

#include <linux/***.h> 是在linux-2.6.29/include/linux下面尋找原始檔。 #include <asm/***.h> 是在linux-2.6.29/arch/arm/include/asm下面尋找原始檔。 #in

LinuxJava執行.class檔案,報錯找不到或無法載入主類

classpath配置的錯誤,所以找不到.class檔案。 原先的etc/profile中的classpath配置 export CLASSPATH=$JAVA_HOME/lib/tools.jar   更改後的: export CLASSPATH=.:$JAVA_HOME

linux批量重新命名檔案

假設資料夾Data裡有幾個資料資料夾, 每個資料資料夾內有多個數據檔案,該檔名稱格式為: 2014.143.20.49.21.0000.YN.BAS.00.BHE.M.SAC 現想要將這些檔名稱改為BAS.E.SAC, 即取原檔名的幾列重新命名,方法如下: #!/bin/bash #將資料檔

解決Linux root使用者刪除檔案提示:Operation not permitted

問題描述 用最高許可權rm檔案,居然報錯Operation not permitted。檢視許可權也沒有問題。可想而知有可能檔案被保護了。用命令lsattr檢查一下就知道。 [[email protected] root]# lsattr a.txt   ---i---------- a.

PHP讀取doc docx xls pdf txt內容

分享一下我老師大神的人工智慧教程!零基礎,通俗易懂!http://blog.csdn.net/jiangjunshow 也歡迎大家轉載本篇文章。分享知識,造福人民,實現我們中華民族偉大復興!        

Linux,grep獲取檔案中的最後一次匹配項

如題:使用grep獲取檔案中的最後一次匹配項 grep '查詢的內容' -A 100 檔名 | tail -n 101 grep獲取檔案中的最後一次匹配項,以及後面100行, 注意是tail -n 101而不是tail -n 100,因為tail -n 100將不會顯示匹配內

Linux校驗下載檔案的完整性(MD5,SHA1,PGP)

  原文:https://www.cnblogs.com/Alight/p/4104070.html 檢視: Linux下校驗下載檔案的完整性(MD5,SHA1,PGP) http://blog.useasp.net/archive/2014/03/29/use-md5-sha1-or-pg

Linux帶空格的檔案刪除方法

實驗模擬: [[email protected] hbk]# touch a" ".txt [[email protected] hbk]# touch a.txt [[email protected] hbk]# ll 總用量 0 -rw-r--r--.

Linux的使用者和檔案許可權管理

一、管理使用者賬號和組帳號 1.使用者帳號和組帳號概述 1.1使用者帳號 使用者賬號 特點 超級使用者 root使用者,負責系統管理和維護 普通使用者 由roo

linux使用者管理及檔案許可權管理

本篇部落格主要講解linux的使用者管理以及檔案的許可權管理,主要是一些命令例子,以實際操作為主。該部落格的命令是在centos6.4上執行的。 一、使用者管理 1 新增使用者 2 刪除使用者

Linuxpasswd和shadow檔案內容詳解

一、/etc/passwd /etc/passwd 檔案是一個純文字檔案,每行採用了相同的格式:  name:password:uid:gid:comment:home:shell  name 使用者登入名  password 使用者口令。此域中的口令是加密的,常用x表示。當用戶登入系統時,系統對輸入的口令採

linux實現doc轉html

1. 概述 windows下藉助.net好解決這個問題. 嘗試python java php 都被坑了,尤其是docx之前的word版本。 最終解決辦法:libreoffice 2. 安裝 yum install libreoffice libreoffice-he

Linux如何開啟appimage檔案

linux下筆記類軟體的首選是為知note了,然而官網提供的安裝包不是tar.gz的,是一個沒有見過的APPIMAGE格式,看起來一頭霧水,看了官網發現很簡單,簡單來說就是可以在linux使用任何一個其他平臺的軟體。 用法:1直接開啟屬性,選擇:作為可執行檔案開啟(接著就像

Linux安裝tar.gz檔案

參考: https://blog.csdn.net/langb2014/article/details/50573656/ https://blog.csdn.net/qq_21383435/article/details/79540117 https://blog.csdn.net/cm_

軟體素材---linux C語言:linux獲取可執行檔案的絕對路徑--getcwd函式

      //標頭檔案:#include <unistd.h>     //定義函式:char * getcwd(char * buf, size_t size);