我有一些從其他格式轉換成ePub的電子書。有些格式不正確:文字中有強硬的換行符,段落之間存在孤立的頁碼。
Example:
我該如何修復這些電子書?我是否必須打開和編輯源文件,還是有更好的方法?
我在Windows上使用Calibre來組織電子書,如果這很重要,但我不會被綁定到那個程序,我也可以使用Linux。
我有一些從其他格式轉換成ePub的電子書。有些格式不正確:文字中有強硬的換行符,段落之間存在孤立的頁碼。
Example:
我該如何修復這些電子書?我是否必須打開和編輯源文件,還是有更好的方法?
我在Windows上使用Calibre來組織電子書,如果這很重要,但我不會被綁定到那個程序,我也可以使用Linux。
Calibre有一項功能,允許您將ePub文件解壓到組件部分(通常是章節),然後您可以編輯它們。完成編輯後,Calibre會將它們重新打包回ePub文件。
在主要的Calibre視圖中,右鍵點擊圖書清單。你應該得到一個彈出菜單,並帶有“編輯書籍”選項。選擇此項將為您提供圖書編輯窗口,您可以在其中編輯書籍的各個部分。
不知何故,我錯過了...感謝 Donald.McLean的回答,我發現它。
In the ePub editor, I hit Ctrl+F, and a search & replace tool showed up at the bottom:
我使用了正則表達式模式和以下模式:
-
\n
]*>
replaced with nothing to remove
paragraph breaks within words. I hit Replace all here.
\s
\n
]*>
replaced with a single space to remove
paragraph breaks within sentences. This had to be done manually,
unfortunately, because there were some spaces at the end of lines
which should stay separated.
\n
]*>\d+
我還安裝了但尚未測試的插件 修改ePub < /格蘭德雷克的。它提供了一些自動化任務:
我還沒有找到一個優雅的方式來做到這一點。然而,這種不雅的方式起作用: 1.突出顯示epub以清理。 2.點擊轉換。 3.設置轉換設置以清除所有你想要的東西(特別是在啟發式部分中,以掃描和修復東西)並確保輸出文件是epub格式。
它會將原始亂碼文件保存為“original_epub”並創建第二個epub文件。