一千萬個為什麽

搜索

如何將djvu文件轉換為某些文件?



我想將一個djvu文件轉換為六個頁面,例如,

如何將504頁的文件轉換為84頁的6頁文件?

轉載註明原文: 如何將djvu文件轉換為某些文件?

一共有 2 個回答:

有AFAIK不是這樣的實用程序,它完全符合您的需求,但您可以通過重復使用 djvused 實用程序來分解文件:

djvused  file.djvu -e "select ; save-page-with "

where is the pagenumber and the output filename. I have a python utility that does this automatically for all the pages while using incremental filename of the form page_.djvu.

之後,您可以將多個文件與 djvm 命令結合使用:

djvm -c output.djvu page01.djvu page02.djvu ... page06.djvu

為每個頁面的組合。圖像和相關數據(如OCR編輯的文本)將獲得84個文件。該數據是不是解包和重新打包的,因此該過程不會導致任何質量損失。

以下是我的Python程序的一個簡約版本,它調用 djvused 將文件分解為單獨的頁面:

#! /usr/bin/env python

import sys
from subprocess import check_output

page_base = 'page_{:03d}.djvu'
file_name = sys.argv[1]
djvused = 'djvused'  # r'C:\Program Files\DjVuLibre\djvused.exe'
number_of_pages = int(check_output([djvused, file_name, '-e', 'n']))
for x in range(number_of_pages):
    page_name = page_base.format(x)
    check_output([djvused, file_name, '-e',
        'select {}; save-page-with {}'.format(x+1, page_name)])

它看起來像djvu文件基本上是分層的圖像,而不是任何文本。如果事實確實如此,從文本中獲取文本將需要光學字符識別(以及隨後的校對)來制作電子書。這些轉換可能會遇到問題 - 常常會出現格式問題。

話雖如此,看起來有一個叫做 CloudConvert 的按鈕解決方案。不能保證你獲得的文件的質量,但它可能是一個開始的地方。