java txt html格式_java中xml(txt/html等格式)解析问题,请教java高手,请勿粘贴其他网页上的内容(能查的都看了)。...

目的:通过对网页内容解析,获得需要的内容,如网页的标题Title,主要内容,描述信息;而里面的广告、超链接、无关紧要的信息统统不要,从而达到对用户上网行为的分析的目的。下面是我...

目的:通过对网页内容解析,获得需要的内容,如网页的标题Title,主要内容,描述信息

;而里面的广告、超链接、无关紧要的信息统统不要,从而达到对用户上网行为的分析的目的。

下面是我做的一个:只能对xml文件解析,其他的格式不行。其次这只是对一级子元素判断,未判断二级或三级等。

需要导入jdom jar包

1.放在E盘的app.xml文档

loops

look

loops1

look1

java处理程序

package example;

import org.jdom.*;

import org.jdom.input.SAXBuilder;

import java.io.*;

import java.util.*;

/**

* Xml 解析工作实现(读取分析)

*

Title:

*

Description:

*

Copyright: Copyright (c) 2005

*

Company:

* @author Yaming

* @version 1.0

*/

public class XmlReader {

private Element m_RootElement = null;

public Element getM_RootElement() {

return m_RootElement;

}

public void setM_RootElement(Element m_RootElement) {

this.m_RootElement = m_RootElement;

}

/**

* 构造函数

* @param xmlFile String

* 根据文件的路径初始化dom的根

*/

public class XmlReader {

private Element m_RootElement = null;

public Element getM_RootElement() {

return m_RootElement;

}

public void setM_RootElement(Element m_RootElement) {

this.m_RootElement = m_RootElement;

}

/**

* 构造函数

* @param xmlFile String

* 根据文件的路径初始化dom的根

*/

public XmlReader(String xmlFile) {

try {

SAXBuilder builder = new SAXBuilder();//解析器定义

Document doc=null;

doc=builder.build(new FileInputStream(xmlFile));//读入Xml文件,获得Doc

this.m_RootElement = doc.getRootElement();//获得Xml文件的最上面的根

// System.out.println("1========"+m_RootElement);

}

catch (IOException ex) {

this.m_RootElement=null;

}

catch (JDOMException ex) {

this.m_RootElement=null;

}

}

/**

* 获得指定名字的根的内容,此方法只适用于此xml

* @param curRoot Element Your XmlRoot

* @param codeName String Your XmlCode

* @return List

*/

public List getElement(Element curRoot,String codeName) {

List result = new ArrayList();

if (null == curRoot) {

curRoot = m_RootElement;

}//判断Xml是否存在,以及根是否正确解析

if (null != curRoot) {

List l=curRoot.getChildren();//获得最上层根的所有字节点

Iterator it=l.iterator();//递归取出

while(it.hasNext()){

Element e=(Element)it.next();

if(e.getName().equalsIgnoreCase(codeName)){//获取这些根是否为所需要的

List l1=e.getChildren();//如果需要,解析出这个子节点的所有子节点

Iterator it1=l1.iterator();

while(it1.hasNext()){

Element e1=(Element)it1.next();

result.add(e1.getTextTrim());//取出所包含的值,放到要返回的结果集中

} } }}

return result;

}

展开

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/331829.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

java泛型程序设计——定义简单泛型类+泛型方法

【0】README 0.1) 本文描述源代码均 转自 core java volume 1, 旨在理解 java泛型程序设计 的 定义泛型类泛型方法的知识; 【1】一个泛型类: 就是具有一个或多个类型变量的类; 1.1)看个荔枝: …

分布式 虚拟时间和虚拟同步_分布式虚拟跟踪

分布式 虚拟时间和虚拟同步跟踪提供了对系统的可见性,使开发人员和操作人员可以在运行时观察应用程序。 当系统不断增长并与更多微服务进行交互时,跟踪变得非常有价值。 在这样的环境中,这些痕迹非常棒,可以定位导致性能下降的故障…

java泛型程序设计——类型变量限定 + 泛型代码和虚拟机

【0】README 0.1) 本文描述源代码均 转自 core java volume 1, 旨在理解 java泛型程序设计 的 类型变量限定 泛型代码和虚拟机 的知识; 【1】类型变量的限定 1.1)类和方法需要对类型变量加以限定 1.1.1)看个荔枝&a…

java中装饰器_Java设计模式12:装饰器模式

装饰器模式装饰器模式又称为包装(Wrapper)模式。装饰器模式以多客户端透明的方式扩展对象的功能,是继承关系的一个替代方案。装饰器模式的结构通常给对象添加功能,要么直接修改对象添加相应的功能,要么派生子类来扩展,抑或是使用对…

selenium 4_Selenium4 Alpha –期望什么?

selenium 4Selenium4 Alpha-期望什么? 早在2018年8月,整个测试自动化社区就受到了一个重大新闻的打击:Selenium的创始成员Simon Stewart在班加罗尔Selenium会议上正式确认了Selenium 4的发布日期和一些重大更新。 世界最受欢迎的Web测试自动化…

英文论文中“such as, for example, e.g., i.e., etc., et al. ”的用法分析

【1】README 本文转自: http://www.cnblogs.com/lanke_2009/archive/2010/12/07/1899185.html , 旨在学习 英文论文中的 如 “such as, for example, e.g., i.e., etc., et al. ”的用法; 【2】正文如下: 黄龙旺  龚汉忠 (上…

mysql8.0云时代_8.0.22Mysql的详细安装

Mysql8.0.22的安装和常见问题前言提示:以下是本篇文章正文内容,下面案例可供参考一、MySQL的下载和安装?1.mysql官网下载:https://dev.mysql.com/downloads/mysql/2.下载步骤:可以点击Go to download page 去下载32位的…

java泛型程序设计——翻译泛型表达式+翻译泛型方法

【0】README 0.1) 本文描述源代码均 转自 core java volume 1, 旨在理解 java泛型程序设计 的 翻译泛型表达式翻译泛型方法 的知识; 【1】翻译泛型表达式 1.1)当程序调用泛型方法时, 如果擦除了泛型返回类型&#xf…

redis 受攻击怎么办?_最受欢迎的6个最常用的Redis库

redis 受攻击怎么办?Redis当前是世界上最受欢迎的键值商店, 它通过提供高速度和低延迟以及针对应用程序开发人员的灵活功能集,赢得了广泛的采用率 。 Redis是一个内存中的数据结构存储,用作根据BSD许可分发的数据库,缓存和消息代…

java泛型程序设计——调用遗留代码

【0】README 0.1) 本文描述源代码均 转自 core java volume 1, 旨在理解 java泛型程序设计 的 调用遗留代码 的知识; 【1】调用遗留代码相关 1.1)设计java 泛型的目的: 允许泛型代码和遗留代码间能够相互操作&#…

java oracle 字符_Oracle转义字符

1、oracle 特殊字符 转义关键词: oracle 转义环境:oracle 9i plsql在plsql里边执行:update userinfo set pageurlmyjsp?page1&pagesize10 where idtest这条sql语句往数据库的pageurl字段放进去了一个url地址,但是执行的时候却并非那…

jmeter进行性能测试_使用JMeter进行性能测试

jmeter进行性能测试在开发复杂的高可用性软件项目时,性能至关重要。 在当今这样的时代尤其如此,除了闪电般的实时数据可访问性之外,其他任何事情都受到惩罚。 当谈论有时需要的大量数据时,这并非总是一件容易的事。 在本文中&…

java泛型程序设计——约束与局限性

【0】README 0.1) 本文描述源代码均 转自 core java volume 1, 旨在理解 java泛型程序设计 的 约束与局限性 的知识; 【1】 不能用基本类型实例化类型参数 1.1)不能用类型参数代替基本类型, 因此,没有 Pa…

python简单菜单_创建一个简单的python菜单

修正和评论,它们主要是语法错误。menulist 1. Print the list,2. Add a name to the list,3. Remove a name from the list,4. Change an item in the list,9. Quit #assuming you want to display menulist, having it as a tuple is uselesslst("johny"…

郎溪 溪流_到无限(溪流)和超越!

郎溪 溪流Java允许您处理集合或流中的数据。 将流视为将一个集合转换为另一个集合的技术非常容易。 这可能会导致一些相当随意的代码,其中流数据被重复收集到某种类型的集合中,作为一个整体集合传递,然后再进行更多处理。 对于6个元素&#…

java泛型程序设计——Varargs 警告+不能实例化类型变量

【0】README 0.1) 本文描述源代码均 转自 core java volume 1, 旨在理解 java泛型程序设计 的 Varargs 警告不能实例化类型变量 的知识; 【1】 Varargs 警告 1.1)一个相关问题: 向参数个数可变的方法传递一个泛型类型…

rabbitmq怎么停止_Windows环境下RabbitMQ的启动和停止命令

Windows环境下RabbitMQ的启动和停止命令原创lockie_zou 最后发布于2018-05-24 15:34:21 阅读数 36514 收藏展开首先windows下安装好了erlang和rabbitmq。如下地址同时下载和安装:Erlang:http://www.erlang.org/download.htmlRabbitMQ :http:…

elk入门_ELK堆栈入门

elk入门朋友不允许朋友写用户身份验证。 厌倦了管理自己的用户? 立即尝试Okta的API和Java SDK。 数分钟之内即可在任何应用程序中对用户进行身份验证,管理和保护。 好的设计原则要求微服务架构是可观察的,并提供集中的监视工具。 该工具使开…

java泛型程序设计——泛型类的静态上下文中类型变量无效+不能抛出或捕获泛型类的实例

【0】README 0.1) 本文描述源代码均 转自 core java volume 1, 旨在理解 java泛型程序设计 的 泛型类的静态上下文中类型变量无效不能抛出或捕获泛型类的实例 的知识; 【1】泛型类的静态上下文中类型变量无效 1.1)不能在静态域或…

android ril.java_Android RIL学习

1.Android RIL概念Android RIL是基于telephony服务和raido硬件层的抽象层。Android的rild库是介于HAL接口与baseband modem之间,它提供了语音、数据、短信、SIM卡管理以及STK应用的功能。它把标准的GSM27.007中常用的如dial这些做主动请求的操作称之为request&#…