php表单提取,php – 使用RegEx提取表单字段

使用正则表达式解析HTML可能不是最好的方法.

您可以查看DOMDocument::loadHTML,这将允许您使用DOM方法处理HTML文档(例如,如果您知道这些,则使用XPath查询).

您可能还想看一下Zend_Dom和Zend_Dom_Query,顺便说一句,如果您可以在应用程序中使用Zend Framework的某些部分,这是非常好的.

例如,在使用Zend_Test进行功能测试时,它们用于从HTML页面获取数据 – 并且工作得很好;-)

首先看起来似乎更难……但是,考虑到一些HTML页面的混乱,它可能是一个更明智的想法……

在评论和编辑OP之后编辑

这里有几个想法,从“简单”开始,一个输入标签:

>它可以跨越几条线传播

>它可以有很多属性

>只考虑名称和价值是您感兴趣的,您必须处理这两个可能处于任何可能的顺序的事实

>属性可以包含双引号,单引号,甚至不包含其值

> tags / attributes可以是小写的也可以是大写的

>标签并不总是必须关闭

好吧,其中一些点无效 – HTML;但仍然在大多数公共网络浏览器中工作,所以必须考虑到它们……

只有这些点,我不想成为写正则表达式的人^^

但我想可能还有其他一些我没想过的困难.

另一方面,你有DOM和xpath …要获得输入名称=“q”的值(例如this page),这是一个类似这样的问题:

$url = 'http://www.google.fr/search?q=test&ie=utf-8&oe=utf-8&aq=t&rls=com.ubuntu:en-US:unofficial&client=firefox-a';

$html = file_get_contents($url);

$dom = new DOMDocument();

if (@$dom->loadHTML($html)) {

// yep, not necessarily valid-html...

$xpath = new DOMXpath($dom);

$nodeList = $xpath->query('//input[@name="q"]');

if ($nodeList->length > 0) {

for ($i=0 ; $ilength ; $i++) {

$node = $nodeList->item($i);

var_dump($node->getAttribute('value'));

}

}

} else {

// too bad...

}

重要的是什么? XPath查询,只有…并且它有什么静态/常量吗?

好吧,我说我想要所有< input>具有等于​​“q”的name属性.

它只是工作:我得到这个结果:

string 'test' (length=4)

string 'test' (length=4)

(我查了一下:页面上有两个输入名称=“q”^^)

我知道页面的结构吗?绝对没有;-)

我只知道我/你/我们想要名为q的输入标签;-)

这就是我们得到的;-)

编辑2:选择和选项有点乐趣:

好吧,只是为了好玩,这是我为选择和选项提出的:

$url = 'http://www.google.fr/language_tools?hl=fr';

$html = file_get_contents($url);

$dom = new DOMDocument();

if (@$dom->loadHTML($html)) {

// yep, not necessarily valid-html...

$xpath = new DOMXpath($dom);

$nodeListSelects = $xpath->query('//select');

if ($nodeListSelects->length > 0) {

for ($i=0 ; $ilength ; $i++) {

$nodeSelect = $nodeListSelects->item($i);

$name = $nodeSelect->getAttribute('name');

$nodeListOptions = $xpath->query('option[@selected="selected"]', $nodeSelect); // We want options that are inside the current select

if ($nodeListOptions->length > 0) {

for ($j=0 ; $jlength ; $j++) {

$nodeOption = $nodeListOptions->item($j);

$value = $nodeOption->getAttribute('value');

var_dump("name='$name' => value='$value'");

}

}

}

}

} else {

// too bad...

}

我得到一个输出:

string 'name='sl' => value='fr'' (length=23)

string 'name='tl' => value='en'' (length=23)

string 'name='sl' => value='en'' (length=23)

string 'name='tl' => value='fr'' (length=23)

string 'name='sl' => value='en'' (length=23)

string 'name='tl' => value='fr'' (length=23)

这是我的预期.

一些解释?

好吧,首先,我获取页面的所有选择标记,并将其名称保存在内存中.

然后,对于每一个,我得到选定的选项标签作为其后代(总是只有一个,顺便说一句).

在这里,我有价值.

比前面的例子复杂一点……但是仍然比正则表达式容易得多,我相信……花了我10分钟,而不是更多……我仍然没有勇气(疯狂?)开始想想某种能够做到这一点的突变正则表达式:-D

哦,作为旁注:我仍然不知道HTML文档的结构是什么样的:我甚至没有看过它的源代码^^

我希望这会有所帮助……

谁知道,也许我会说服你正则表达式在解析HTML时不是一个好主意……也许吧? 😉

还是:玩得开心!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/555503.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

phpexcel.php实际应用,PHP操作excel的一个例子(原创)-PHP教程,PHP应用

这是对于那些只喜欢简单处理一下excel朋友来说的//定义一个excel文件$workbook "c:/my documents/test.xls";$sheet "sheet1";//生成一个com对象$ex$ex new com("excel.sheet") or die ("连不上&#xff01;&#xff01;&#xff01;&qu…

集成 websocket 的四种方案

集成 websocket 的四种方案 1. 原生注解 pom.xml <dependency><groupId>org.springframework.boot</groupId><artifactId>spring-boot-starter-websocket</artifactId> </dependency>WebSocketConfig package cn.coder4j.study.exampl…

java异常不懂,看不懂的异常提示啊

当前位置:我的异常网 Java Web开发 看不懂的异常提示啊看不懂的异常提示啊www.myexceptions.net 网友分享于&#xff1a;2013-09-12 浏览&#xff1a;7次看不懂的错误提示啊&#xff01;&#xff01;&#xff01;&#xff01;写的一个JSP程序&#xff0c;运行时提示如下错误…

包含内部类的.java文件编译后生成几个.class文件

如果一个类有内部类&#xff0c;编译将生成几个字节码文件&#xff0c;规则是怎样呢&#xff1f; 写在前&#xff0c;自己动手丰衣足食&#xff0c;结论只有个人实验支持&#xff0c;没有官方数据支持&#xff0c;欢迎自行查阅文档然后来指正&#xff0c;轻喷&#xff0c;谢谢…

java服务端无法发送给客户端,无法从客户端向服务器发送消息

我正在开发一个应用程序&#xff0c;我需要从客户端向服务器发送消息&#xff0c;并在客户端上的文件发生更改时通知服务器 . 我在Qt中使用QTcpServer和QTcpSocket类 . 我正在写socket并从服务器端的socket读取但是我的读取失败了 .我可以知道如何将消息发布到服务器 . 我需要在…

java 泛型详解

对java的泛型特性的了解仅限于表面的浅浅一层&#xff0c;直到在学习设计模式时发现有不了解的用法&#xff0c;才想起详细的记录一下。 本文参考java 泛型详解、Java中的泛型方法、 java泛型详解 1. 概述 泛型在java中有很重要的地位&#xff0c;在面向对象编程及各种设计模式…

mysql 截取字符串部分值,Mysql字符串截取_获取指定字符串中的数据

搜索热词前言&#xff1a;本人遇到一个需求&#xff0c;需要在MysqL的字段中截取一段字符串中的特定字符&#xff0c;类似于正则表达式的截取&#xff0c;苦于没有合适的方法&#xff0c;百度之后终于找到一个合适的方法&#xff1a;substring_index(www.sqlstudy.com.cn,.,-2)…

Intellij IDEA远程debug教程实战和要点总结

远程调试&#xff0c;特别是当你在本地开发的时候&#xff0c;你需要调试服务器上的程序时&#xff0c;远程调试就显得非常有用。 JAVA支持调试功能&#xff0c;本身提供了一个简单的调试工具JDB&#xff0c;支持设置断点及线程级的调试同时&#xff0c;不同的JVM通过接口的协…

php嗅探木马,PHP安全-密码嗅探

密码嗅探尽管攻击者通过嗅探(察看)你的用户和应用间的网络通信并不专门用于访问控制&#xff0c;但要意识到数据暴露变得越来越重要&#xff0c;特别是对于验证信息。使用SSL可以有效地防止HTTP请求和回应不被暴露。对任何使用https方案的资源的请求可以防止密码嗅探。最好的方…

Idea进行远程Debug

Idea远程调试 当把一个本地项目部署到远程服务器后有可能出现意想不到错误&#xff0c;这个时候通过远程调试能够更清楚的找到bug所在位置。本篇主要讲解如何使用Idea开发工具 进行调试1.远程调试服务器上面的SpringBoot 项目2.远程调试服务器上运行在tomcat中的项目&#xff…

如何用php查不同,php-MySql调查不同查询

大家好,我确实在MySql查询中苦苦挣扎,我有一个名为“ info”的表,并且其中有一个名为“ rating”的列,评分在1-10之间.现在,我需要生成一个百分比值,该百分比值表示1-6、7-8和9-10中有多少评级,但我需要它们拼命显示,之后我需要第二个查询,该查询可以从中减去结果的百分比值1-6…

如何使用websocket实现前后端通信

如何使用websocket实现前后端通信 websocket通信是很好玩的&#xff0c;也很有用的的通信方式&#xff0c;使用方式如下&#xff1a; 第一步由于springboot很好地集成了websocket&#xff0c;所以先在在pom.xml文件中引入依赖 <dependency><groupId>org.springfr…

matlab表示DFT和DTFT,【 MATLAB 】离散傅里叶级数(DFS)与DFT、DTFT及 z变换之间的关系...

上篇博文我们简单的讨论了离散傅里叶级数DFS和离散傅里叶变换DFT之间的关系&#xff0c;简单地说&#xff0c;DFT就是DFS在一个周期内的表现。为了后面讨论方便&#xff0c;这里给出DFS的系数公式(分析公式)&#xff1a;(1) 其中&#xff1a;综合公式&#xff1a;(2) 为了对比&…

tail查看nohup.out文件内容

1.前台实时查看nohub.out文件内容&#xff1a; tail -f nohup.out 2.根据关键字查看 tail -f nohup.out |grep "关键字"3.输出文件最后100行 tail -n 100 nohup.out 4.输出文件最后100行&#xff0c;含关键字 tail -n 100 nohup.out |grep "关键字"

Linux nohup实现后台运行程序及查看(nohup与)

Linux nohup实现后台运行程序及查看&#xff08;nohup与&&#xff09; 更新时间&#xff1a;2019年09月11日 09:28:40 作者&#xff1a;猿的生活 这篇文章主要介绍了Linux nohup实现后台运行程序及查看&#xff08;nohup与&&#xff09;&#xff0c;文中通过示例代码…

php面向对象异常处理,PHP面向对象编程——自定义PHP异常处理类

/*?* WEB开发笔记 www.chhua.com 每日练习 PHP面向对象编程——自定义PHP异常处理类?* 这所以用自定义的异常类&#xff0c;主要是区分异常来自程序的哪一部分&#xff0c;比如是来自MYSQL的还是来自MODEL的?* 一般情况下&#xff0c;自定义的异常类也不要太多&#xff0c;否…

java createstatement,createStatement参数说明

Statement stmtconn.createStatement(参数一,参数二)第一个参数可以取值为ResultSet.RTYPE_FORWORD_ONLY:这是缺省值,只可向前滚动;ResultSet.TYPE_SCROLL_INSENSITIVE:双向滚动,但不及时更新,就是如果数据库里的数据修改过,并不在ResultSet中反应出来.ResultSet.TYPE_SCROLL_S…

websocket的用途/场景

websocket的用途/场景 先总结&#xff1a;高即时性服务&#xff0c;比如聊天室的群聊&#xff0c;server顺序收到了张三&#xff0c;李四的消息&#xff0c;立即就推送给王五&#xff0c;不能让王五等半天。 Ajax也可以一秒一刷&#xff0c;让王五去问张三说话没&#xff0c;如…

websocket学习总结记录

Websocket 1.基本概念 WebSocket是一种网络通信协议。 websocket和http 的区别&#xff0c;http的缺陷&#xff0c;只能从客户端发起请求&#xff08;单项请求&#xff09;不能从服务器发起请求。如果服务器有连续性的变化时&#xff0c;如果我们想要每一个时刻都获得最新的…

php分列显示,【杂谈】PHP数组怎样按键名完成降序分列

PHP关联数组按键名完成降序分列&#xff0c;我们能够直接经由过程PHP中的krsor()函数来完成。krsort函数示意对数组根据键名逆向排序。那末在前面的文章中&#xff0c;已给人人引见过PHP关联数组按键名完成升序分列的要领。下面我们继承连系简朴的示例&#xff0c;给人人引见PH…