php 扒取网页数据

扒取方法

    public function index(){$url = 'http://www.dytt8.net/';// $url = 'Public/txt/movies.txt';$content = file_get_contents($url);$content = iconv("gb2312", "utf-8//IGNORE",$content);$reg = "|<div class=\"co_content2\">(.*?)<\/div>|is";//正则匹配div$res = preg_match_all($reg, $content, $match);$count = count($match[1]);//有数据if($count){$arr = array();$array = array();for($i=0;$i<$count;$i++){$a = "|<a[^>]*>(.*?)<\/a>|is"; //匹配value$patten="/<a href=[\'\"]?([^\'\" ]+).*?>/";//匹配href值preg_match_all($a, $match[1][$i], $mat);preg_match_all($patten, $match[1][$i], $href);foreach($mat[1] as $key=>$val){$array = array('href'=>'http://www.dytt8.net/'.$href[1][$key],'name'=>$val,'ctime'=>time(),);array_push($arr,$array);}}$res = $this->Movies->addAll($arr);if($res){echo '抓取成功!';}else{echo '抓取失败!';}}}

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/397705.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

多表联合查询

关联数据库字典表的多表联合查询 inner join…on 自动连接 需要用到表的所有信息时&#xff0c;可以用以下两种方法 1) left join…on… 左连接 &#xff08;以左为准&#xff0c;右边没有NULL代替&#xff09; 2) right join…on… 右连接&#xff08;以右为准&#xff…

http 请求头和响应头

客户端发送请求过程带着的数据&#xff1a; 1.请求地址 2.请求方式 3.请求头 request headers 4.请求参数 https://www.juhe.cn/ 130.... 1a2b....pei 服务端响应给客户端的信息&#xff1a; 1.响应内容 2.响应报文/响应头部 response headers a 响应头 b 响应体 3.http状…

python3.6使用mysql_Python之——Python3.6连接MySQL

只安装了Python是不能连接数据库的&#xff0c;还要安装Python连接MySQL的相关类库&#xff0c;Python2.7连接MySQL的类库很多&#xff0c;MySQL官方最新支持的Python为Python3.4.&#xff0c;如下图所示&#xff1a;那么&#xff0c;在Python3.6上如何实现连接MySQL的功能呢&a…

MVVM模式于MVP模式

MVC、MVP、MVVM这些模式是为了解决开发过程中的实际问题而提出来的&#xff0c;目前作为主流的几种架构模式而被广泛使用。 一.MVP模式(Model-View-Presenter):传统的开发是MVP模式(例如jquery) MVP是把MVC中的Controller换成了Presenter&#xff08;呈现&#xff09;&#xff…

BrowserSync开发利器

2019独角兽企业重金招聘Python工程师标准>>> 大大节省开发时间。安装使用简单。使用步骤&#xff1a; 1、nodejs环境 安装 2、在项目中使用npm安装到本项目 3、对要监听的文件执行响应命令 官网更详细&#xff1a;http://www.browsersync.cn/#install 原理&#xf…

algorithm -- 选择排序

选择排序是《导论》第一章课后习题&#xff0c;仿照插入排序&#xff0c;再次运用循环不变式来证明下算法的正确性&#xff0c;C 源码&#xff1a; // 交换函数 void swap( int& a, int& b ) {a a^b;b a^b;a a^b; } void selectSort( int *arr, int count ) {if( a…

ueeditor无法上传图片_百度ue文本编辑器开发中无法上传图片

第一次发文&#xff0c;好紧张呀&#xff0c;不知道会不会没人看。之前用ue遇到了一些坑&#xff0c;没人看就当自己记录了笔记。第一次用&#xff0c;总是会遇到问题&#xff0c;可以先查看下百度ue的演示http://ueditor.baidu.com/website/onlinedemo.html和API http://fex.b…

SQL 语句优化--IN语句优化案例

为什么80%的码农都做不了架构师&#xff1f;>>> 今天客户系统升级&#xff0c;通过DMVs性能分析查了一下&#xff0c;升级后发现一个语句执行时间比较长&#xff0c;执行语句要好几秒钟&#xff0c;调出语句如下&#xff1a; select distinct field003 from ufi2j0…

Activity跳转

本例中MainActivity为&#xff1a;FirstActivity.java FirstActivity如下&#xff1a; package com.wyl.intentmultiactivitytest;import android.app.Activity; import android.content.Intent; import android.os.Bundle; import android.view.View; import android.view.Vie…

Java课程设计---项目数据库设计(含实体类)

1、数据库分析设计 将数据库命名为&#xff1a;db_student 分析系统中各角色之间的关系 2、表设计 &#xff08;1&#xff09;新建表tb_student&#xff08;学生表&#xff09; &#xff08;2&#xff09;新建表tb_admin&#xff08;管理员表&#xff09; &#xff08;3&#x…

java)_Java NIO系列教程(一) Java NIO 概述

原文链接 作者&#xff1a;Jakob Jenkov 译者&#xff1a;airu 校对&#xff1a;丁一Java NIO 由以下几个核心部分组成&#xff1a;ChannelsBuffersSelectors虽然Java NIO 中除此之外还有很多类和组件&#xff0c;但在我看来&#xff0c;Channel&#xff0c;Buffer…

Context.getExternalFilesDir()和Context.getExternalCacheDir()方法

2019独角兽企业重金招聘Python工程师标准>>> Context.getExternalCacheDir()方法可以获取到 SDCard/Android/data/你的应用包名/cache/目录&#xff0c;一般存放临时缓存数据如果使用上面的方法&#xff0c;当你的应用在被用户卸载后&#xff0c;SDCard/Android/dat…

java 静态代码块_JAVA静态代码块

今天遇到下面的代码&#xff0c;感觉很奇怪&#xff0c;特意记录下&#xff1a;代码如下&#xff1a;public class Test {private static List objs new ArrayList();static {objs.add(new Test(Test.S_NAME,Test.NAME,Test.COUNT));objs.add(new Test(Test.S_NAME,Test.NAME,…

context详解

1、Context概念&#xff1a; Context&#xff0c;相信不管是第一天开发Android&#xff0c;还是开发Android的各种老鸟&#xff0c;对于Context的使用一定不陌生~~你在加载资源、启动一个新的Activity、获取系统服务、获取内部文件&#xff08;夹&#xff09;路径、创建View操作…

WebApi路由

路由分为两种模式&#xff1a;模板路由和特性路由。 模板路由&#xff1a; 模板路由是ASP.NET Web API默认提供的路由。模板路由使用前需要定义路由模板。如下面默认的路由模板&#xff1a; 默认路由的URL格式是api/{controller}/{id}。api代表在资源前面要带上api目录&#xf…

java设计模式 组合_JAVA 设计模式 组合模式

用途组合模式 (Component)将对象组合成树形结构以表示“部分-整体”的层次结构。组合模式使得用户对单个对象和组合对象的使用具有唯一性。组合模式是一种结构型模式。结构图-组合模式结构图Component: 组合中的对象声明接口&#xff0c;在适当的情况下&#xff0c;实现所有类共…

项目总结SpringMVC相关

流程文字概述1、用户发送请求至前端控制器DispatcherServlet2、DispatcherServlet收到请求调用HandlerMapping处理器映射器。3、处理器映射器找到具体的处理器&#xff0c;生成处理器对象及处理器拦截器(如果有则生成)一并返回给DispatcherServlet。4、DispatcherServlet调用Ha…

SpringBoot登录登出切面开发

阅读本文约“2.5分钟” 本文开发环境是SpringBoot2.X版本。 对于系统而言&#xff08;这里多指管理系统或部分具备登录登出功能的系统&#xff09;&#xff0c;登录登出是一个类权限验证的过程&#xff0c;现在一般是以token进行校验&#xff0c;即用户输入登录信息&#xff0c…

spring --aop(日志记录)在工程中实际使用

2019独角兽企业重金招聘Python工程师标准>>> ###1.日志切面 package com.readygo.zbhealth.common;import java.util.Arrays; import java.util.List;import org.aspectj.lang.ProceedingJoinPoint;public class LoggingAspect {public Object Around(ProceedingJoi…

Neutorn LBaaS 原理

Load Balance as a Service&#xff08;LBaaS&#xff09;是 Neutron 提供的一项高级网络服务。LBaaS 允许租户在自己的网络中创建和管理 load balancer。 load balancer 可以说是分布式系统中比较基础的组件。 它接收前端发来的请求&#xff0c;然后将请求按照某种均衡策略转发…