1. 程式人生 > >C#儀器數據文件解析-RTF文件

C#儀器數據文件解析-RTF文件

for win pre logs 陌生 實現 plain windows系統 doc

RTF格式文件大家並不陌生,但RTF文件的編碼、解碼卻很難,因為RTF文件是富文本格式的,即文件中除了包含文本內容,還包含文本的格式信息,而這些信息並沒有像後來的docx等采用XML來隔離格式和內容,因此解碼很難。

一些儀器的數據報告以RTF格式輸出,因為RTF可以使用寫字板進行編輯,寫字板程序在Windows系統中默認安裝,因此輸出的RTF格式文件易讀寫。

解析RTF文件,難以從解碼入手,但可以依賴Windows的基礎功能實現RTF文本內容的獲取,具體而言就是依靠WinForm類庫來讀取RTF文件內容,當然,此種方式可以讀取其中的文本內容,圖片、表格樣式將被忽略。

以下是示例代碼:

            RichTextBox rtBox = new RichTextBox(); 
            string s = File.ReadAllText(fileName); 
            rtBox.Rtf = s;
            string plainText = rtBox.Text; 
            return plainText;

  

C#儀器數據文件解析-RTF文件