一千萬個為什麽

搜索

如何使用可選文本創建DjVu格式?



DjVu在壓縮方面效率很高,但有時文本會變成圖像並且不可選。無論如何要確保文本保持可選狀態嗎?我應該使用哪個程序進行此轉換?

轉載註明原文: 如何使用可選文本創建DjVu格式?

一共有 2 個回答:

DjVu文件通常只是圖像。從這些文件部分可以選擇為圖像而不是文本1。

如果在轉換為DjVu期間或之後應用 OCR 。額外信息存儲在將圖像區域與文本相關聯的文件中。只有這樣,你才能從這樣的文件中選擇文本2。

將OCR應用於DjVu文件可以在線完成。如果您不喜歡,可以嘗試此腳本,該腳本使用Tesseract 。或者您可以購買商業軟件,例如 Document Express

¹ e.g. using the djview program.
² In theory one could do OCR on the fly in the DjVu viewer, but I don't think any of the currently available viewers can do that.

您還可以通過選定的OCR引擎使用 ocrodjvu ,例如正方體。