一千萬個為什麽

搜索

從高度結構化的數據庫內容發布ePub文件最簡單的工作流程是什麽?



我在SQL數據庫中有大量高度結構化的數據(聖經經文翻譯和評論),我希望盡可能提供廣泛可用的電子書格式(或格式)。格式化需要多一點,即平面文本渲染,以包括節標題,詩序編號,內容類型之間的清晰劃分(經文的格式與解說不同),鏈接交叉引用和目錄。

我認為我應該生成某種類型的中間格式,例如基於我的數據集的XML文件,然後可以使用XSLT或類似的系統將其轉換為完成的電子書格式,但我不知道這是什麽應該。我不想重新發明輪子。

  • 這通常是正確的工作流程還是我錯過了某處的船?
  • 中間格式應該是什麽?是否有這樣的標準可以使二次轉換比其他轉換更容易?

我想我應該註意到,這不是一次性項目,我可以使用一些GUI工具或Web服務一起入侵 - 整個過程必須從頭到尾都可以腳本化。我打算通過可定制的數據範圍,翻譯等將現有網站的電子書生成選項作為導出選項。

轉載註明原文: 從高度結構化的數據庫內容發布ePub文件最簡單的工作流程是什麽?

一共有 2 個回答:

我建議您生成一些支持 pandoc (即降價,reST,HTML)輸入的標記格式,並生成從那個EPUB。

您應該對腳本 pandoc 沒有任何問題,但是您需要一些工作來自動化從數據庫生成標記(但不會超過您生成XML的程度)。

我做過這樣的項目。我假設你知道如何從你的數據庫中選擇你需要的數據。我建議你開發一個基於pandoc擴展markdown的模板(以獲得交叉引用),將數據與模板合並,然後腳本pandoc將其轉換為EPUB2和PDF。如果你想提供一個Kindle兼容的電子書(並且你放棄了),那麽你可以編寫Kindlegen(可從亞馬遜網站獲得)將EPUB2轉換為MOBI文件。

這不是一件小事,但它應該是可行的。