一千萬個為什麽

搜索

如何過濾罵人的話?



我讀過的許多作者都喜歡在他們的書中放入詛咒詞,但明智地使用它們。另外,我不喜歡一般的詛咒。

我目前使用Calibre濾除了詛咒詞,但這並不是非常好。一些詛咒詞由於被大寫,連字符,中斷等而未被捕獲。其他非粗俗詞在不需要時被過濾掉:基督教對 * ** ** </強> *伊恩。

也許有預先格式化的cuss詞匯表,我可以將它們導入Calibre並用作過濾器?

轉載註明原文: 如何過濾罵人的話?

一共有 2 個回答:

您遇到的問題也被稱為“ Scunthorpe問題”,這是由wordfilters 發生故障。使長話短說:

Wordfilters do not work. They never did and never will.

如果你真的想刪除任何文本的詛咒,你正在看一個主要的編程任務。沒有切實可行的捷徑。它需要大量的代碼來對其上下文中的每個句子進行語義分析,以查明“公雞”是否實際上指的是一只雄性雞。

如果詛咒如此困擾你,我真的建議你相應地選擇你的作者。那裏有很多優秀的作者,他們沒有明智地使用咒語。我認為有更多人對此感到困擾,所以應該有博客,論壇等等,提供建議。

附:我覺得很有趣,你的篩選器上似乎有“基督”。

I had the same problem and created a plugin to do just this. See https://github.com/jdanders/calibre-plugin-language-cleaner/releases