pugixml解析Word

使用pugixml开源库接口并扩展,解析Word 文字和table 上下行位置关系

1.遍历指定节点下所有节点,包括当前节点下各个层的节点,判断某个节点的存在否
2. find_node()函数使用,predicate 参数构造传入方法
3. 获取当前word文档的格式,并按照原文将文字段落和表格的上下行位置关系还原所以需要确认纯文字段落的位置和table的位置

std::vector<std::string> duckx::Document::get_elements() const
{std::vector<std::string> allElements;pugi::xml_object_range<pugi::xml_node_iterator> childs = document.child("w:document").child("w:body").children();struct allow_remote_predicate{bool operator()(pugi::xml_node node) const{return strcmp(node.name(), "w:t") == 0;}};for (auto& it_child : childs) {if ( strcmp(it_child.name() , "w:p") == 0 ){         //  w:body/ w:p / w:r/ w:t="ass"if(it_child.find_node(allow_remote_predicate()) != nullptr ) {printf("find a  *** %s \n",it_child.find_node(allow_remote_predicate()).name());allElements.push_back("w:p");continue;}}else if (strcmp(it_child.name(), "w:tbl") == 0){printf("find a w:tbl \n");allElements.push_back(it_child.name());}}printf("the total row = %d\n",(int) allElements.size());return allElements;
}

总结:find_node()参数需要按照官网例子方法自己构造,注意返回值,当前节点所有子节点没有找到这个目标就会返回一个空节点,而不是false

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/269299.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

[51nod1264]线段相交

给定两个点: typedef struct { double x, y; } Point; Point A1,A2,B1,B2; 首先引入两个实验&#xff1a; a.快速排斥实验 设以线段A1A2和线段B1B2为对角线的矩形为M,N; 若M,N 不相交&#xff0c;则两个线段显然不相交&#xff1b; 所以&#xff1a;满足第一个条件时&#xf…

谁来理解外来工的孩子的心理健康?

儿子的心情最近不太好。我住在公司管理层宿舍里&#xff0c;儿子一直都感觉比较寂寞&#xff0c;因为这里基本上没有他的同伴。中午&#xff0c;儿子拿着他心爱的枪&#xff0c;站在食堂的旁边&#xff0c;忧郁地看着每一个匆匆赶路的人。他的心里肯定在想&#xff1a;这些人为…

Qt 在designer 中给QToolBar 添加 action控件

Qt 在designer 中给QToolBar 添加 action控件 1.在action editor 添加控件 SendData不出现使用打钩时 2. 使用鼠标直接拖拽到Ui指定位置

Windows环境下通过Git来管理自己的Android代码

前面已经介绍了在Windows下使用git工具来下载Android的源代码&#xff0c;Windows环境下通过Git得到Android源代码&#xff0c;这里记录我使用git工具来管理我自己的代码&#xff0c;git是一种分布式的项目管理工具而CVS及SVN都是集中式的版本号控制系统集中式版本号控制系统最…

rh9.0虚拟机dmesg启动过程分析(1)

Linux version 2.4.20-8 ([email]bhcompileporky.devel.redhat.com[/email]) (gcc version 3.2.2 20030222 (Red Hat Linux 3.2.2-5)) #1 Thu Mar 13 17:54:28 EST 2003#linux内核版本&#xff1a;2.4.20-8#Gcc版本&#xff0c;c编译器版本&#xff1a;3.2.2#当前发行版本的发布…

Qt QByteArray 转换 QString QT5.12.7

Qt QByteArray 转换 QString QT5.12.7 void MainWindow::slot_send() { const QString data m_sendLineEdit->text(); qDebug() << "shu ru: " << data.toLocal8Bit(); QByteArray data1 data.toLocal8Bit(); writeData(data1); }

Hello world开始

一切都从Hello world开始&#xff0c;代码如下&#xff1a; 1 #!/usr/bin/env python 定义程序执行过程中调用的环境 在linux下 直接调用python来解析执行该文件 2 #-*- coding:utf-8 -*- 也可以是 #codingutf-8 &#xff0c;作用是设置代码在执行过程中的编码形式&…

ASP中事务处理资料收集

在IIS 中&#xff0c;ASP结构提供了六个内建对象&#xff0c; 内建对象的特殊性在于&#xff0c;它们在 ASP 页内生成且在脚本中使用它们前无须创建。其中&#xff0c;内建对象ObjectContext专门用于支持开发基于Microsoft Transaction Server&#xff08;MTS&…

2020年工作总结大会感悟

数字孪生&#xff1a;具有数据预测分析意义 开发工作: 高质量以做产品的标准去思考 最主要的问题&#xff1a;沟通增加 现场经验: 遇事处理先冷静下来想办法&#xff0c;戒急戒躁 转变观念: 善于求助问题&#xff0c;乐于帮助求助者&#xff0c;心中有集体花少的时间做更多的事…

2016和2017的区别就是昨晚和今早

2016和2017的区别就是昨晚和今早 也是历史和未来 只是在跨年份是时候更有感觉&#xff0c;更让人思考和感叹。一年这个周期寒来暑往秋收冬藏&#xff0c;对我们的目标再审视&#xff0c;我们的收莸再总结&#xff0c;对我们的不足再反思&#xff0c;对我们的心态用调整。 形势比…

dot Net Frameworks中常见的设计模式

响应一下Anders Liu的号召(http://www.cnblogs.com/AndersLiu/archive/2007/05/29/763456.html)&#xff0c;列几个自己经常遇到的实现SINGLETON&#xff1a;System.DBNull.Value FACTORY METHOD&#xff1a;System.Data.IDbConnection.CreateCommand ()、System.Data.IDbComma…

如何构建一个向导操作模式程序

引导新用户熟悉产品的方式多种多样&#xff0c;向导程序是其中最经典也是最常用的一种。今天的文章&#xff0c;我们来聊聊向导程序的设计模式。 什么是向导程序 向导程序通常会提供一系列的步骤或者目标&#xff0c;让用户在完成步骤达成目标的过程中&#xff0c;逐步熟悉这个…

13 Tensorflow机制(翻译)

代码&#xff1a; tensorflow/examples/tutorials/mnist/ 本文的目的是来展示如何使用Tensorflow训练和评估手写数字识别问题。本文的观众是那些对使用Tensorflow进行机器学习感兴趣的人。 本文的目的并不是讲解机器学习。 请确认您已经安装了Tensorflow。 教程文件 文件作用mn…

鸟哥的 Linux 私房菜7 -- 首次开机关机与基本指令执行

鸟哥的 Linux 与 ADSL 私房菜 开机、关机、在线求助与指令下达方式最近更新日期&#xff1a;2004/05/01第一次登入系统与离开系统 图形模式与文字模式的切换方式 指令下达方式与基础指令练习 在线求助&#xff1a;man, info 正确的关机方式 开机过程的问题排解 本章习题练习 第…

Ignoring query to other database

Ignoring query to other database Ignoring query to other database 自己今天刚遇到&#xff0c;进入MySQL的时候&#xff0c;输入show databases; 产生如下错误 错误提示 Ignoring query to other database 郁闷&#xff0c;半天&#xff0c;怎么查询不了&#xff0c;开…

Qt QObject::connect: Parentheses expected错误原因

Qt 运行提示 QObject::connect: Parentheses expected, signal QUdpSocket::readyRead in …\terminal\net103.cpp:55 这个是 signal希望一个父类&#xff0c;其实是因为slot 函数 &#xff0c;声明没有在放在private slots: 错误原因&#xff1a;槽函数错误的放在 private&a…