一千萬個為什麽

搜索

如何在epub中查找重復的ID?



Chapter_1.xhtml:</強>

<div id="ch1_sec1">

Section 1


paragraph1, see fig 1

paragraph2, see fig 2

paragraph3

</div>

Chapter_2.xhtml:</強>

<div id="ch2_sec1">

Section 1


paragraph1
paragraph2, see fig 2

paragraph3

</div>

Chapter_3.xhtml:</強>

<div id="ch3_sec1">

Section 1


paragraph1
paragraph2
paragraph3 </div>

In above mentioned source file, All the IDs are same except <div> ID. In this case, how can i find the duplicates with different filenames (using perl, JavaScript or anything else).

If you have solution for this, please help.

Fig. 1. Caption Fig. 2. Caption

轉載註明原文: 如何在epub中查找重復的ID?

一共有 3 個回答:

您最好的選擇是使用 EPUBCheck 進行驗證。這將捕捉到@id和其他錯誤。我在Linux中使用類似於以下命令的命令:

java -jar /home/epubcheck.jar book.epub -out errors.xml

errors.xml文件將為您提供文件名,行號和錯誤說明。

或者,如果您不介意上傳自己的作品,則可以在 IDPF 上使用在線驗證器。

使用EPUB檢查3.0.1驗證ePUB,或者如果文件小於10 MB,則可以使用在線ePUB驗證器驗證文件( http://validator.idpf.org/ )。這一定會有助於識別重復的ID。

download link validator http://lithopssoft.com/hlv/

將文件拖放到驗證器中,然後單擊驗證按鈕。錯誤將顯示在屏幕上。