网页与网站之间的关系做网站的域名怎么申请

news/2025/9/23 1:01:05/文章来源:
网页与网站之间的关系,做网站的域名怎么申请,农业开发公司好名字,城乡建设网站证件查询系统引入 今日概要 图片懒加载seleniumphantomJs谷歌无头浏览器知识点回顾 验证码处理流程今日详情 动态数据加载处理 一.图片懒加载 什么是图片懒加载#xff1f; 案例分析#xff1a;抓取站长素材http://sc.chinaz.com/中的图片数据 #!/usr/bin/env python # -*- coding:utf-8 … 引入 今日概要 图片懒加载seleniumphantomJs谷歌无头浏览器知识点回顾 验证码处理流程今日详情 动态数据加载处理 一.图片懒加载 什么是图片懒加载 案例分析抓取站长素材http://sc.chinaz.com/中的图片数据 #!/usr/bin/env python # -*- coding:utf-8 -*- import requests from lxml import etree if __name__ __main__: url http://sc.chinaz.com/tupian/gudianmeinvtupian.html headers { User-Agent: Mozilla/5.0 (Macintosh; Intel Mac OS X 10_12_0) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/69.0.3497.100 Safari/537.36, } #获取页面文本数据 response requests.get(urlurl,headersheaders) response.encoding utf-8 page_text response.text #解析页面数据获取页面中的图片链接 #创建etree对象 tree etree.HTML(page_text) div_list tree.xpath(//div[idcontainer]/div) #解析获取图片地址和图片的名称 for div in div_list: image_url div.xpath(.//img/src) image_name div.xpath(.//img/alt) print(image_url) #打印图片链接 print(image_name)#打印图片名称   - 运行结果观察发现我们可以获取图片的名称但是链接获取的为空检查后发现xpath表达式也没有问题究其原因出在了哪里呢 图片懒加载概念 图片懒加载是一种网页优化技术。图片作为一种网络资源在被请求时也与普通静态资源一样将占用网络资源而一次性将整个页面的所有图片加载完将大大增加页面的首屏加载时间。为了解决这种问题通过前后端配合使图片仅在浏览器当前视窗内出现时才加载该图片达到减少首屏图片请求数的技术就被称为“图片懒加载”。 网站一般如何实现图片懒加载技术呢 在网页源码中在img标签中首先会使用一个“伪属性”通常使用src2original......去存放真正的图片链接而并非是直接存放在src属性中。当图片出现到页面的可视化区域中会动态将伪属性替换成src属性完成图片的加载。 站长素材案例后续分析通过细致观察页面的结构后发现网页中图片的链接是存储在了src2这个伪属性中 #!/usr/bin/env python # -*- coding:utf-8 -*- import requests from lxml import etree if __name__ __main__: url http://sc.chinaz.com/tupian/gudianmeinvtupian.html headers { User-Agent: Mozilla/5.0 (Macintosh; Intel Mac OS X 10_12_0) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/69.0.3497.100 Safari/537.36, } #获取页面文本数据 response requests.get(urlurl,headersheaders) response.encoding utf-8 page_text response.text #解析页面数据获取页面中的图片链接 #创建etree对象 tree etree.HTML(page_text) div_list tree.xpath(//div[idcontainer]/div) #解析获取图片地址和图片的名称 for div in div_list: image_url div.xpath(.//img/src2) #src2伪属性 image_name div.xpath(.//img/alt) print(image_url) #打印图片链接 print(image_name)#打印图片名称   二.selenium 什么是selenium 是Python的一个第三方库对外提供的接口可以操作浏览器然后让浏览器完成自动化的操作。   环境搭建 安装selenumpip install selenium 获取某一款浏览器的驱动程序以谷歌浏览器为例 谷歌浏览器驱动下载地址http://chromedriver.storage.googleapis.com/index.html 下载的驱动程序必须和浏览器的版本统一大家可以根据http://blog.csdn.net/huilan_same/article/details/51896672中提供的版本映射表进行对应                效果展示 from selenium import webdriver from time import sleep# 后面是你的浏览器驱动位置记得前面加r,r是防止字符转义的 driver webdriver.Chrome(r驱动程序路径) # 用get打开百度页面 driver.get(http://www.baidu.com) # 查找页面的“设置”选项并进行点击 driver.find_elements_by_link_text(设置)[0].click() sleep(2) # # 打开设置后找到“搜索设置”选项设置为每页显示50条 driver.find_elements_by_link_text(搜索设置)[0].click() sleep(2) # 选中每页显示50条 m driver.find_element_by_id(nr) sleep(2) m.find_element_by_xpath(//*[idnr]/option[3]).click() m.find_element_by_xpath(.//option[3]).click() sleep(2) # 点击保存设置 driver.find_elements_by_class_name(prefpanelgo)[0].click() sleep(2) # 处理弹出的警告页面 确定accept() 和 取消dismiss() driver.switch_to_alert().accept() sleep(2) # 找到百度的输入框并输入 美女 driver.find_element_by_id(kw).send_keys(美女) sleep(2) # 点击搜索按钮 driver.find_element_by_id(su).click() sleep(2) # 在打开的页面中找到“Selenium - 开源中国社区”并打开这个页面 driver.find_elements_by_link_text(美女_百度图片)[0].click() sleep(3) # 关闭浏览器 driver.quit() 代码介绍 #导包 from selenium import webdriver #创建浏览器对象通过该对象可以操作浏览器 browser webdriver.Chrome(驱动路径) #使用浏览器发起指定请求 browser.get(url)#使用下面的方法查找指定的元素进行操作即可find_element_by_id 根据id找节点find_elements_by_name 根据name找find_elements_by_xpath 根据xpath查找find_elements_by_tag_name 根据标签名找find_elements_by_class_name 根据class名字查找     三.phantomJs PhantomJS是一款无界面的浏览器其自动化操作流程和上述操作谷歌浏览器是一致的。由于是无界面的为了能够展示自动化操作流程PhantomJS为用户提供了一个截屏的功能使用save_screenshot函数实现。代码演示 from selenium import webdriver import time# phantomjs路径 path rPhantomJS驱动路径 browser webdriver.PhantomJS(path)# 打开百度 url http://www.baidu.com/ browser.get(url)time.sleep(3)browser.save_screenshot(rphantomjs\baidu.png)# 查找input输入框 my_input browser.find_element_by_id(kw) # 往框里面写文字 my_input.send_keys(美女) time.sleep(3) #截屏 browser.save_screenshot(rphantomjs\meinv.png)# 查找搜索按钮 button browser.find_elements_by_class_name(s_btn)[0] button.click()time.sleep(3)browser.save_screenshot(rphantomjs\show.png)time.sleep(3)browser.quit()   重点seleniumphantomjs 就是爬虫终极解决方案:有些网站上的内容信息是通过动态加载js形成的所以使用普通爬虫程序无法回去动态加载的js内容。例如豆瓣电影中的电影信息是通过下拉操作动态加载更多的电影信息。 综合操作需求是尽可能多的爬取豆瓣网中的电影信息 from selenium import webdriver from time import sleep import timeif __name__ __main__:url https://movie.douban.com/typerank?type_name%E6%81%90%E6%80%96type20interval_id100:90action# 发起请求前可以让url表示的页面动态加载出更多的数据path rC:\Users\Administrator\Desktop\爬虫授课\day05\ziliao\phantomjs-2.1.1-windows\bin\phantomjs.exe# 创建无界面的浏览器对象bro webdriver.PhantomJS(path)# 发起url请求bro.get(url)time.sleep(3)# 截图bro.save_screenshot(1.png)# 执行js代码让滚动条向下偏移n个像素作用动态加载了更多的电影信息js window.scrollTo(0,document.body.scrollHeight)bro.execute_script(js) # 该函数可以执行一组字符串形式的js代码time.sleep(2)bro.execute_script(js) # 该函数可以执行一组字符串形式的js代码time.sleep(2)bro.save_screenshot(2.png) time.sleep(2) # 使用爬虫程序爬去当前url中的内容 html_source bro.page_source # 该属性可以获取当前浏览器的当前页的源码html with open(./source.html, w, encodingutf-8) as fp: fp.write(html_source) bro.quit()   四.谷歌无头浏览器 由于PhantomJs最近已经停止了更新和维护所以推荐大家可以使用谷歌的无头浏览器是一款无界面的谷歌浏览器。代码展示 from selenium import webdriver from selenium.webdriver.chrome.options import Options import time# 创建一个参数对象用来控制chrome以无界面模式打开 chrome_options Options() chrome_options.add_argument(--headless) chrome_options.add_argument(--disable-gpu) # 驱动路径 path rC:\Users\ZBLi\Desktop\1801\day05\ziliao\chromedriver.exe# 创建浏览器对象 browser webdriver.Chrome(executable_pathpath, chrome_optionschrome_options)# 上网 url http://www.baidu.com/ browser.get(url) time.sleep(3)browser.save_screenshot(baidu.png)browser.quit() 作业 爬取网易新闻国内板块下的新闻标题和新闻内容 转载于:https://www.cnblogs.com/presleyren/p/10579705.html

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/910941.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

新手做站必看 手把手教你做网站免费域名网站黄

Mysql数据库 ⽬前关系数据库有六种范式: 第⼀范式(1NF)、第⼆范式(2NF)、第三范式(3NF)、巴斯-科德范式 (BCNF)、第四范式(4NF)和第五范式(5NF&a…

php企业网站cms网站设计流程详细步骤

YOLOv8n原图检测YOLOv8n增强后检测召回率和置信度都有提升 前言 这篇博客讲讲低照度,大家都催我出一些内容,没想到这么多同学搞这个,恰好我也做过这方面的一些工作,那今天就来讲解一些方法,低照度的图像增强大体分“传统算法”和“深度学习算法”; 目前低照度的图像增…

手机seo网站推广seo型网站

目录 1. 为什么使用文件 2. 什么是文件 2.1 程序文件 2.2 数据文件 2.3 文件名 3. 文件的打开和关闭 3.1 文件指针 3.2 文件的打开和关闭 4. 文件的顺序读写 ​编辑 ​编辑 4.1 对比一组函数: ​编辑 5. 文件的随机读写 5.1 fseek 5.2 ftell 5.3 rewind…

网站建设公司应该怎么转型wordpress 调用豆瓣

每个优秀的程序员都喜欢编写简洁但有效且经过优化的代码。 类型推断是JDK 7中引入的一种方法,它肯定会为您带来更少键入的好处。 您以以下方式使用Java代码已有很长时间了。 但是,在初始化Collections的特定实现时,您是否曾经想到过代码重复&…

云建站平台哪家好濮阳网络电视直播

大家好,我是微学AI,今天给大家介绍一下人工智能(pytorch)搭建模型22-基于pytorch搭建SimpleBaseline(人体关键点检测)模型,并详细介绍该网络模型与代码实现。本文将介绍关于SimpleBaseline模型的原理,以及利用pytorch框架搭建模型…

凡客建站手机版下载咋样查看网站用什么编程语言做的

1:端口需要隔离开 新版增加GRPC 不要挨着设置ip,否则会出现端口占用。 可以使用 8848 8858 8868 8848GRPC会占用9848 9899 8849: 占用9849 9850 8850: 占用9850 9851 nginx 负载也需要与上述端口 隔离开…

怎么把自己做的网站让别人收到国内做网站群平台的公司

在嵌入式环境下,使用CMSIS-DSP库进行音频信号处理是一种常见的应用场景。通过CMSIS-DSP库,开发人员可以利用嵌入式系统的处理能力来实现各种数字信号处理(DSP)功能,例如音频滤波、均衡器、噪音消除等。本文将介绍如何在…

楚雄做网站界面设计属于什么专业

return中断方法和Unreachable code(永远达不到的代码) 1.下面这段代码因为for循环是个死循环,System.out.println(); 执行不到编辑器会报错Unreachable code(永远达不到的代码) public static void main(String[] ar…

哪个网站做视频赚钱为什么建设网站要年年交钱

1、 HarmoryOS Ability页面的生命周期 2、 Component自定义组件 3、HarmonyOS 应用开发学习笔记 ets组件生命周期 4、HarmonyOS 应用开发学习笔记 ets组件样式定义 Styles装饰器:定义组件重用样式 Extend装饰器:定义扩展组件样式 前面记录了ets组件样式…

合肥网站建设服务哪里有免费的网站推广软件

el-table当数据量大的时候,实现滚动到底部后加载数据,直接上js代码,有其他需求请各自更改 第一步、在data中定义两个数组 data() {return {innerList:[], //新数组,用于存放全部数据innerData:[], //el-table表格数组dom:null,…

淘宝单页面网站零基础网站建设视频

随着信息技术的不断发展,企业应用开发的需求也日益增长。为满足这一需求,低代码与系统集成逐渐崭露头角,成为推动企业数字化转型的重要力量。本文将从低代码的概念、优势,以及其与系统集成的结合等方面进行探讨,以期为…

凡科网做网站好吗免费网站建设 百度收录

本文介绍了Linux的C开发环境的构成和安装,使读者对Linux的C开发环境能有初步的了解。 你了解Linux吗?相信现在越来越多的人会说“是”的。那么你了解到何种程度呢?不可否认,目前决大多 数的Linux用户对Linux的了解还处于比较低级的…

南京装修公司做网站为中小型企业构建网站

Marica对Mirko很生气,因为他找到了一个新的女朋友,她想报仇。由于她不住在同一个城市,她开始为长途旅行做准备。我们知道每条路从一个城市到另一个城市需要多少分钟。 米尔科在车里无意中听到其中一条路正在维修,路被堵住了&…

网站建设方案需要哪些步骤网站建设的重要性 学校

写在前面 我们知道我们编写的java代码,会经过编译器编译成字节码文件(class文件),再把字节码文件装载到JVM中,映射到各个内存区域中,我们的程序就可以在内存中运行了。那么字节码文件是怎样装载到JVM中的呢…

哪家网站建设做的好网页游戏开发需要学什么

Horizontal Pod Autoscaling in Kubernetes写在前面我们平时部署web服务,当服务压力大撑不住的时候,我们会加机器(加钱);一般没有上容器编排是手动加的,临时加的机器,临时部署的服务还要改Nginx的配置,最后…

泰兴网站设计河南网站推广多少钱

眼中有细节,学习的过程才能平稳! 1.游戏更新时把名字也更新 代码如下: 效果如下: 2.因为是第三人称,从背后看,所以名称应该水平对称,翻转一下!rotate y180 游戏内效果如下&#xf…

互联网创业就是做网站吗局域网做网站

openchatai/OpenCopilot Stars: 3.8k License: MIT OpenCopilot 是一个允许你拥有自己产品的 AI 副驾驶员的项目。它集成了产品底层 API,并可以在需要时执行 API 调用。它使用 LLMs 来确定用户请求是否需要调用 API 端点,然后决定调用哪个端点并根据给定…

建设医院网站的重点与难点在于专业网站设计开发网站

项目背景 最近停在门前的车被人开走了,虽然有监控,但是看监控太麻烦了,于是想着框选一个区域用yolov8直接检测闯入到这个区域的所有目标,这样1ms一帧,很快就可以跑完一天的视频 用到的技术 COpenCVYolov8 OnnxRunt…

网站开发获客渠道做企业网站备案都需要什么资料

文章目录 前言一、题意描述输入描述:输出描述: 二、代码1.代码的实现2.读入数据 总结 前言 在python基础知识的学习中,我们很多时候会遇见让我们把数字拆分成各个位数的题,下面这道就是经典的数字拆分的l例题 一、题意 描述 牛…

学网站建设设计要钱吗wordpress wampsever

前些天发现了一个巨牛的人工智能学习网站,通俗易懂,风趣幽默,忍不住分享一下给大家。点击跳转到教程。 shell脚本中echo显示内容带颜色显示,echo显示带颜色,需要使用参数 -e 格式如下: echo -e "\033[字背景颜…