Pandoc 是万能的文档转换器,能够在 Markdown、HTML、LaTeX、DOCX、EPUB、reStructuredText 和 PDF 等数十种标记格式之间相互转换。它理解每种格式的语义,生成高保真的转换结果而非简单的文本替换。
AI 代理使用 Pandoc 在不同格式之间转换文档——将 Markdown 转为 PDF 报告、将 HTML 页面转为干净的 Markdown 便于处理,或从结构化文本生成 DOCX 文件。其处理包含引用、表格、数学公式和交叉引用的复杂文档的能力远超简单的格式转换工具。
Pandoc 的模板系统和 Lua 过滤器支持对输出格式进行深度定制。它还能从文档中提取元数据、拆分或合并文件,以及批量处理整个目录的文档——使其成为文档密集型自动化工作流中的多面手。