Dropbox 新的文字辨識技術將帶來更強大的圖片和 PDF 搜尋能力
當一份檔案被拍成照片並放入 PDF 檔案後,要在茫茫的檔案海中找到它,往往是件曠日費時的苦差事,然而昨天 Dropbox公佈的新文字辨識技術,或許多少能幫助你解決這項棘手的問題,至少當檔案存放於該平臺上的時候。據 Dropbox 表示,在他們的服務上共儲存了 200 億張圖片和 PDF 檔案,其中的 10% 到 20% 的比例是檔案的照片,而新的技術將能在搜尋時提供 ofollow,noindex" target="_blank">辨識圖片和 PDF 中文字 的能力,幫助使用者更快速找到需要的檔案。
往後使用者若需要通過關鍵字尋找特定的圖片或是 PDF,只要正常的使用搜索功能,Dropbox 便會顯示包含相關字詞的檔案。Dropbox 向 VentureBeat 表示,由於 PDF 檔案往往帶有不只一頁的內容,其龐大的運算需求大大增加了該功能的開發難度,也讓此成為該公司機器學習團隊成立以來,最複雜的挑戰。然而,為了讓功能順利運作,目前的文字辨識功能只會作用於檔案中前 10 頁的內容。
