pandoc使用

news/2025/10/7 18:44:35/文章来源:https://www.cnblogs.com/cmyxjcc/p/19128738

pandoc安装

官网地址链接

如果在windows下安装,选择msi (Microsoft Installer),并根据引导完成安装工作。

安装完成后,需要打开新的terminal,并使用pandoc --version查看是否安装成功。

markdown转word

笔者在国内多家公司的工作经历中发现,企业内部的文档管理普遍采用 Word 和 PDF 格式。Word 作为一种支持富文本编辑的工具,其可视性较好,便于直接编辑和格式调整;PDF 则具有良好的跨平台一致性,适合用于正式文件的分发和归档。

在日常工作中,笔者更倾向于使用 Markdown 格式进行个人笔记记录。这主要是因为笔记内容以文本为主,很少涉及图像插入。尽管Markdown 本身具备良好的图片支持功能,但纯文本记录已能满足多数需求。

为与公司的文档管理体系保持兼容,笔者计划借助 Pandoc 工具,将 Markdown 格式的笔记转换为符合公司规范的 Word 文档。目前正致力于定制一个专用的转换模板,以实现高效、统一的格式转换。

实现思路如下:

  1. 使用pandoc命令打印自带的word模板

    pandoc -o template.docx --print-default-data-file reference.docx 
    
  2. 修改template.docx模板

  3. 此后markdown转换docx时使用template.docx

pandoc -o name_format_docx.docx .\name_format_markdown.md --reference-doc=template.docx

常用字体说明

  • 宋体​:是中文中最常见、最通用的字体之一,打印效果清晰明了,阅读性好,适合长篇文档,显得庄重正式。许多公司规定技术文件全文使用宋体。
  • ​微软雅黑​:是为屏幕显示优化的字体,在电子设备上显示效果极佳,现代感较强。是电子技术文档或需要投影阅读时的好选择。
  • ​黑体​:结构清晰,笔画粗壮,非常显眼,适合用于标题,能增强视觉效果。
  • 英文搭配​:Times New Roman是经典衬线字体,传统严肃,适合正式场合;Calibri是Office默认无衬线字体,现代感强,阅读舒适;Arial是无衬线字体,可读性强,应用广泛

pandoc的命令

以下是 Pandoc 最常用的核心命令参数分类详解,适用于日常文档转换场景(特别是 Markdown 转 Word/PDF/HTML):

一、基础转换参数

参数 说明 示例
-f FORMAT 指定输入格式(如 markdown, html, docx -f markdown
-t FORMAT 指定输出格式(如 docx, pdf, html -t docx
-o FILE 输出文件名(必须放在最后) -o report.docx
INPUT_FILE 输入文件路径(支持多个文件合并) chapter1.md chapter2.md

二、样式与模板控制

参数 说明 示例
--reference-doc=FILE.docx 指定 Word 模板(DOCX 格式专用) --reference-doc=template.docx
--template=FILE 指定模板(LaTeX/HTML 等格式使用) --template=custom.latex
--css=FILE.css 指定 CSS 文件(HTML/EPUB 输出) --css=styles.css
--highlight-style=STYLE 代码块高亮主题(如 pygments, monochrome --highlight-style=tango

三、内容增强参数

参数 说明 示例
--toc 生成目录(Table of Contents) --toc
--toc-depth=NUMBER 目录层级深度(默认 3) --toc-depth=2
--number-sections 自动编号章节标题(PDF/LaTeX 常用) --number-sections
--top-level-division=TYPE 指定顶级标题类型(chapter, part, section --top-level-division=chapter

四、元数据控制

参数 说明 示例
--metadata KEY:VALUE 设置元数据(覆盖文件内 YAML 块) --metadata title="报告"
-M KEY:VALUE 同上(简写形式) -M author="张三"
--variable KEY:VALUE 传递变量到模板(LaTeX 专用) --variable classoption=twocolumn

五、PDF 生成专用参数

参数 说明 示例
--pdf-engine=ENGINE 指定 PDF 引擎(pdflatex, xelatex, wkhtmltopdf --pdf-engine=xelatex
-V geometry:margin=1in 调整页面边距(LaTeX 的 geometry 包) -V geometry:top=2cm
--include-in-header=FILE 插入 LaTeX 头内容(如宏包) --include-in-header=header.tex

六、高级处理工具

参数 说明 示例
--filter=SCRIPT 使用过滤器(Python/Lua 脚本处理 AST) --filter=pandoc-citeproc
--lua-filter=SCRIPT.lua 使用 Lua 过滤器(更高效) --lua-filter=page-break.lua
--standalone 生成完整文档(包含头部/模板) --standalone

七、调试与信息查询

参数 说明 示例
--verbose 显示详细日志(调试用) --verbose
--list-input-formats 查看支持的输入格式
--list-output-formats 查看支持的输出格式
--list-extensions 查看 Markdown 扩展支持
--version 显示 Pandoc 版本

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/930726.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

深入解析:(八)登录认证与学生写作画像

pre { white-space: pre !important; word-wrap: normal !important; overflow-x: auto !important; display: block !important; font-family: "Consolas", "Monaco", "Courier New", …

c#造个轮子--GIF录制工具

在以往几篇文章里面,大家都可以看到各种录制的GIF效果图,把gif放在文章开始,不仅可以减少很多冗余的解释白话文,更可以让读者一览无余看到文章大概要义。 以往都是使用“LicEcap”来录制的,那么我们是否能自己实现…

android binder(二)应用层编程实例 - 指南

android binder(二)应用层编程实例 - 指南2025-10-07 18:38 tlnshuju 阅读(0) 评论(0) 收藏 举报pre { white-space: pre !important; word-wrap: normal !important; overflow-x: auto !important; display: bl…

做网站 需要什么样的服务器西安房产网最新楼盘

本文整理自曹操出行实时计算负责人林震基于 HologresFlink 的曹操出行实时数仓建设的分享,内容主要分为以下六部分: 曹操出行业务背景介绍曹操出行业务痛点分析HologresFlink 构建企业级实时数仓曹操出行实时数仓实践曹操出行业务成果分析未来展望 一、曹…

高校学校网站建设广州番禺区属于什么风险地区

分词 分词是最基本的第一步。无论对于英文文本,还是中文文本都离不开分词。英文的分词相对比较简单,因为一般的英文写法里通过空格来隔开不同单词的。但对于中文,我们不得不采用一些算法去做分词。 常用的分词工具 # encodingutf-8 import …

网站建设完工报告那些网站建设的好

1.什么是设计模式 软件设计模式(Design pattern),又称设计模式,是一套被反复使用、多数人知晓的、经过分类编目的、代码设计经验的总结。使用设计模式是为了可重用代码、让代码更容易被他人理解、保证代码可靠性、程序的重用性。 …

netdata

https://blog.gitiu.com/posts/19026/ 默认用的db engine 并不是做持久化的, 持久化用外部的DB https://learn.netdata.cloud/docs/netdata-agent/resource-utilization/disk-&-retention

秦皇岛手机网站制作费用优化是什么

Mirrored String II 看到题解说是马拉车算法,我赛时并没想到(好吧其实我是比赛完才知道有马拉车这个算法) 因为字符串的长度只有1000,直接暴力跑其实就可以了,但是要注意的是;回文串有俩种形式&#xff0c…

arc3.2语言sort的时候报错:(sort < `(2 9 3 7 5 1)) 得写成此种:(sort > (pair (list 3 2)))

arc3.2语言sort的时候报错:(sort < `(2 9 3 7 5 1)) 得写成此种:(sort > (pair (list 3 2)))pre { white-space: pre !important; word-wrap: normal !important; overflow-x: auto !important; display: block !i…

关于Elment-plus的el-table组件无法通过原生JS监听scroll事件

Element-ui的el-table组件能够通过原生JS监听scroll事件 Elment-plus的el-table组件无法通过原生JS监听scroll事件,貌似是由于虚拟滚动的原因?! 今天想给el-table进行无限滚动的时候才发现...

什么是网站可信认证网站内容不收录

C# WPF入门学习主线篇(十八)—— Border布局容器 欢迎来到C# WPF入门学习系列的第十八篇。在前几篇文章中,我们已经探讨了 Canvas、StackPanel、WrapPanel、DockPanel、Grid 和 UniformGrid 布局容器及其使用方法。本篇博客将介绍另一种非常…

噬菌体展示技术:从诺奖成果到疫苗研发,这一 “表型 - 基因型统一” 工具如何颠覆生物研究?

1985 年,George P. Smith 首次将外源基因插入丝状噬菌体 f1 的基因 Ⅲ,让目的多肽 “展示” 在噬菌体表面 —— 这一创举诞生了噬菌体展示技术,三十多年后,该技术因在抗体筛选、表位鉴定领域的突破性贡献,助力 Sm…

从零开始学Flink:实时流处理实战

本文以Apache Flink实时流处理为核心,通过SocketWordCount示例,系统讲解实时流处理基础概念、Flink优势、代码实现与并行处理机制,助力读者掌握Flink流处理实战技能。在大数据处理领域,实时流处理正变得越来越重要…

实用指南:解决 xmlsec.InternalError: (-1, ‘lxml xmlsec libxml2 library version mismatch‘)

实用指南:解决 xmlsec.InternalError: (-1, ‘lxml & xmlsec libxml2 library version mismatch‘)pre { white-space: pre !important; word-wrap: normal !important; overflow-x: auto !important; display: b…

高质量同人动画整理回顾记录的方式

爽了,每次清空网页、收藏夹释放大脑的时候都会感觉莫名的轻松,以前从来没有过这样的记录,用了几年才学来的经验啊;;; 超高质量原创动画制作,高质量同人动画太好看了,令人激动,某种内心被充盈了的感觉,只能体…

什么响应式网站莱芜新闻民生广角

一、问题描述 1、组态王【运行配置】界面没有【服务配置】的选项,无法将组态王Kingview配置为OPCUA服务器; 2、点击组态王【运行配置界面】的【服务配置】选项弹窗警告提示【试图执行的操作不受支持】,如下图所示: 二、问题分析 …

斑马打印机基础知识

斑马标签打印机分为热转印和热敏两种,其中,热转印需要碳带,热敏不需要。 热转印打印原理 打印头加热碳带上的油墨,将油墨熔化并转印到标签纸上。 热敏打印原理 打印头直接加热热敏纸,热量使涂层显现颜色成像。 热…

网站主要应用小程序开发工具代理平台

前言 2024.3.26是我在CSDN成为创作者的第128天,也是我第一次真正在网上创作的第128天 当我还在日常创作时,突然发现我收到了一封信 我想我可以分享一下这段时间的感想以及收获 机缘 在CSDN的这段时间里,我学习到了很多知识,也…

四川互联网广告人海淀区seo多少钱

System.out.print("今天开始继续读书摘录"); //不知道官方让不让我在博客里面记录 //如果不让的话我可能得转到别的上面记录 System.out.print("现在开始看《此生未完成》"); System.out.println("今天是第三天!");有时候常常会想到那…