1. 程式人生 > >如何從word、excel、pdf等檔案中提取文字(Tika)

如何從word、excel、pdf等檔案中提取文字(Tika)

Tika-內容分析工具包

官方網站:https://tika.apache.org/

在maven倉庫下載最新版依賴 https://mvnrepository.com/artifact/org.apache.tika/tika-parsers

懶得去的同學,提供一個筆者正在使用的依賴

    <!-- https://mvnrepository.com/artifact/org.apache.tika/tika-parsers -->         
    <dependency>
	  <groupId>org.apache.tika</groupId>
	  <artifactId>tika-parsers</artifactId>
	  <version>1.18</version>
    </dependency>