一千萬個為什麽

搜索

內部結構是如何構建的?



我知道我不記得了,epub文件是一個有效的zip文件,其中包含(其他文件)章節,如 *。xhtml 文件,清單文件 content.opf <�代碼>和目錄文件 toc.ncx 。

  • 解壓縮epub的文件和目錄結構是什麽?
  • 哪些文件必須存在(具有固定名稱?),並且是否有可選文件?
  • 單個文件中存儲了哪些信息?

我要求一個非常基本的epub文件,所以版本應該沒有關系,但是假設epub2會對你有所幫助。

PS:我可能會在稍後詢問這些文件的內容和結構,但現在我只想知道哪些文件是強制性的或可選的,並且概述它們包含的內容,以使問題更具體並且答案更短。

轉載註明原文: 內部結構是如何構建的?

一共有 2 個回答:

EPUB是一種開放格式,因此您可以在線找到標準規格。維基百科有一個好的關於EPUB格式的文章

如果您想簡要描述您剛剛提到的特征,可以在這裏的這篇文章中找到。

目錄結構:

EpubFolderYouWant
   META-INF
      container.xml
   mimetype
   content.opf
   toc.ncx

需要的文件:

mimetype
container.xml
content.opf
toc.ncx

每個文件中包含哪些信息在上面提到的文章中有描述。

EPUB文件的文件和目錄結構在OCF(OpenContainerFormat)中指定。有兩個最有趣的版本: 2.0.1 3.0.1 。兩者都只在特定子目錄中指定一個必需文件,即:

META-INF/container.xml

還有一些可選文件可以進入該目錄( signatures.xmlencrytpion.xmlmetadata.xml而且允許在那裏有一個名為 manifest.xml 的文件。

container.xml 指的是一個或多個文件的完整路徑,這些文件的名稱基本上都是空的,並且也是目錄結構。

Of course some programs generate EPUB files always with the same structure. That is why it might seem that you need a content.opf in the root of the EPUB (zip) file structure, but that is only a valid name in any particular EPUB if and only if it is named in a element in the container.xml.

與電子書一起構成的內容文件(提及個人)HTML文件可以是:

TOC/TableOfContents.opf

和HTML文件可能是

LOTR/The_Fellowship_of_the_Ring.htm
LOTR/The_Two_Towers.htm
LOTR/The_Return_of_the_King.htm

只要內部從 container.xml 開始指定的文件路徑是正確的。

正如Mark指出的, mimetype 文件需要存在。實際上根據 2.0.1 規範(第7頁,底部)該文件必須是EPUB文件的ZIP結構中的第一個文件。

2.0.1 保留的根目錄中的唯一名稱是 mimetypeMETA-INF 。建議使用特定的文件夾(例如 LOTR )(以防止有多個再現時的沖突),但不是必需的。