当前位置: 首页 > 科技观察

Linux下如何使用Pandoc转换文件格式

时间:2023-03-12 03:25:08 科技观察

Pandoc可以将.docx,.odt,.html,.epub,LaTeX,DocBook等格式互相转换,或者转换成其他格式,比如JATS,TEISimple,AsciiDoc等。是的,这意味着Pandoc可以将.docx文件转换为.pdf和.html文件,但您可能会想,“Word也可以将文件导出为.pdf和.html。我为什么需要Pandoc?”好吧,最初,你是对的,但考虑到Pandoc可以转换如此多的格式,它很可能成为你完成所有转换任务的首选工具。例如,我们很多人都知道Markdown编辑器可以将他们的Markdown文件导出为.html。并且使用Pandoc文件还可以转换为许多其他格式。我很少将Markdown导出到HTML。我通常让Pandoc这样做。使用Pandoc转换文件格式在本文中,我将把Markdown文件转换成几种不同的格式。我几乎所有的写作都使用Markdown语法,但我经常需要转换为另一种格式:.docx用于学校作业;.html用于我创建的网页;.epub用于工作;讲义所需的传单和.pdf格式;甚至是大学数字人文项目偶尔需要的TEI简单格式。Pandoc可以轻松处理所有这些格式以及更多格式。首先,您需要安装pandoc。此外,要创建.pdf文件,需要LaTeX。我最喜欢的套件是TeXLive。注意:如果你想在安装前试用pandoc,这里有一个在线试用页面:http://pandoc.org/try/。安装pandoc和texliveUbuntu和其他Debian发行版的用户可以在终端输入以下命令:sudoapt-getupdatesudoapt-getinstallpandoctexlive注意第二行,你将一次性安装pandoc和texlive。apt-get命令允许您执行此操作。不过,我建议您先喝杯咖啡,因为这可能需要几分钟时间。开始转换安装pandoc和texlive后,你可以尝试使用它们做一些工作!该项目的一个示例文档是1894年12月首次发表在《北美评论》上的一篇文章,标题为“如何击退火车劫匪”。我将使用的Markdown文件是前段时间作为本文修复项目的一部分创建的我将这篇文章保存为how_to_repel_train_robbers.md在我的文档目录中名为samples的子目录中。下面是它在Ghostwriter中的样子:在Ghostwriter中查看原始Markdown文件我想创建此文件的.docx、.pdf和.html版本。第一次转换首先,我要制作一份.pdf副本,因为我在安装LaTeX包时遇到了一些问题。在~/Documents/samples/目录中,我输入以下内容以创建一个.pdf文件:pandoc-ohtrtr.pdfhow_to_repel_train_robbers.md以上命令将基于how_to_repel_train_robbers.md文件创建一个名为htrtr.pdf的文件.我使用htrtr作为名称的原因是:好吧,它比how_to_repel_train_robbers短。htrtr实际上是长标题中单词的第一个字母。这是已完成的.pdf文件的屏幕截图:在OcularSecondconversion中查看的已转换PDF文件接下来,我想创建一个.docx文件。该命令与我用来创建.pdf的命令几乎相同,它是:pandoc-ohtrtr.docxhow_to_repel_train_robbers.md快速创建一个.docx文件。这是它在LibreWriter中的样子:在LibreWriter中查看转换后的DOCX文件第三次转换我可能想在线发布它,所以再多一种支持网络的格式会很好。我将使用以下命令创建一个.html文件:pandoc-ohtrtr.htmlhow_to_repel_train_robbers.md同样,创建它的命令与前两个转换非常相似。下面是.html文件在浏览器中的样子:注意到在Firefox中查看的转换后的HTML文件中有什么吗?让我们再看看前面的命令。它们是:pandoc-ohtrtr.pdfhow_to_repel_train_robbers.mdpandoc-ohtrtr.docxhow_to_repel_train_robbers.mdpandoc-ohtrtr.htmlhow_to_repel_train_robbers.md这三个命令之间的唯一区别是htrtr之后的扩展名。这暗示您pandoc将依赖于您提供的输出文件扩展名(以确定目标转换格式)。总结Pandoc可以做的远不止这里完成的三个小转换。如果您选择以一种首选格式编写文件,但有时您需要将文件转换为另一种格式,pandoc很可能会为您完成。既然你已经学会了,你会用它做什么?你会自动化吗?如果您有一个网站并希望允许读者下载文章怎么办?您可以修改这些小命令,将它们写入脚本,您的读者可以决定他们想要哪种格式。您可以提供.docx、.pdf、.odt、.epub或更多格式。您的读者只需要选择一种格式,然后相应的转换脚本就会被执行,最后,您的读者就可以下载他们想要的文件了。这是完全可行的。