一千萬個為什麽

搜索

清理轉換後的電子書



我有一些從其他格式轉換成ePub的電子書。有些格式不正確:文字中有強硬的換行符,段落之間存在孤立的頁碼。

Example:
Screenshot from Calibre

我該如何修復這些電子書?我是否必須打開和編輯源文件,還是有更好的方法?

我在Windows上使用Calibre來組織電子書,如果這很重要,但我不會被綁定到那個程序,我也可以使用Linux。

轉載註明原文: 清理轉換後的電子書

一共有 3 個回答:

Calibre有一項功能,允許您將ePub文件解壓到組件部分(通常是章節),然後您可以編輯它們。完成編輯後,Calibre會將它們重新打包回ePub文件。

在主要的Calibre視圖中,右鍵點擊圖書清單。你應該得到一個彈出菜單,並帶有“編輯書籍”選項。選擇此項將為您提供圖書編輯窗口,您可以在其中編輯書籍的各個部分。

不知何故,我錯過了...感謝 Donald.McLean的回答,我發現它。

In the ePub editor, I hit Ctrl+F, and a search & replace tool showed up at the bottom:

enter image description here

我使用了正則表達式模式和以下模式:

  • -

    \n

    ]*> replaced with nothing to remove paragraph breaks within words. I hit Replace all here.

  • \s

    \n

    ]*> replaced with a single space to remove paragraph breaks within sentences. This had to be done manually, unfortunately, because there were some spaces at the end of lines which should stay separated.

  • \n

    ]*>\d+

    replaced with nothing to remove orphaned page numbers. Replace all again.

我還安裝了但尚未測試的插件 修改ePub < /格蘭德雷克的。它提供了一些自動化任務:

enter image description here

我還沒有找到一個優雅的方式來做到這一點。然而,這種不雅的方式起作用: 1.突出顯示epub以清理。 2.點擊轉換。 3.設置轉換設置以清除所有你想要的東西(特別是在啟發式部分中,以掃描和修復東西)並確保輸出文件是epub格式。

它會將原始亂碼文件保存為“original_epub”並創建第二個epub文件。