菏泽网站建设费用低价建站在哪里买

web/2025/10/4 8:30:44/文章来源:
菏泽网站建设费用,低价建站在哪里买,福建建设资格管理中心网站,凉山建设机械网站最近#xff0c;有网友反映#xff0c;我的批量查字典工具换到其它的网站就不好用了。对此#xff0c;我想说的是#xff0c;互联网包罗万象#xff0c;网站的各种设置也有所不同#xff0c;并不是所有的在线字典都可以用Python爬取的。事实上#xff0c;很多网站为了防…最近有网友反映我的批量查字典工具换到其它的网站就不好用了。对此我想说的是互联网包罗万象网站的各种设置也有所不同并不是所有的在线字典都可以用Python爬取的。事实上很多网站为了防止被爬取内容早就提高了网站的安全级别不会让用户轻意爬取内容的。 由于这名网友想要的是韩语翻译所以我就不能拿原来的网站来操作了只好去网上查询网速快、又不对爬虫有限制的网站来操作。终于探索出了爬取某字典网站上内容的方法。 一、用BeautifulSoup获取翻译 这是一个字典网站也是一个双语句库网站对于汉语的韩语翻译我们可以通过requests来获取网页源文再用BeautifulSoup进行解析然后用soup.find()查找想要的标签信息和Class提取文本信息然后再写入到xls文件就可以了代码如下 import xlwt import requests from bs4 import BeautifulSoupheaders {User-Agent:Mozilla/5.0 (Linux; Android 6.0; Nexus 5 Build/MRA58N) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/114.0.0.0 Mobile Safari/537.36 Edg/114.0.1823.37}def get_word(word):urlfhttps://zh.glosbe.com/zh/ko/{word}resp requests.get(url,headersheaders)soup BeautifulSoup(resp.text, html.parser)# 查找查询结果result soup.find(div, class_inline leading-10)if result:return result.text.split()[0]else:return 未找到翻译def process_txt_file(filename):# 创建工作簿wb xlwt.Workbook()# 创建表单sh wb.add_sheet(sheet 1)with open(filename, r, encodingutf-8) as file:words [i.strip() for i in file.readlines()]for index,word in enumerate(words):sh.write(index,0,word)sh.write(index,1,get_word(word))wb.save(translation_results.xls) #调用函数并传入txt文件路径 process_txt_file(words.txt) 二、用openpyxl来写入xlsx文件 上面的代码中采用的是xlwt来写入到xls文件我们也可以改用openpyxl同时我们还可以通过soup.h3.string来更快地定位所需要的位置信息。这次我们把查询的内容由韩语改为英文代码优化如下 import requests from bs4 import BeautifulSoup import openpyxl headers {User-Agent:Mozilla/5.0 (Linux; Android 6.0; Nexus 5 Build/MRA58N) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/114.0.0.0 Mobile Safari/537.36 Edg/114.0.1823.37} def get_word(word):urlfhttps://zh.glosbe.com/zh/en/{word}resp requests.get(url,headersheaders)soup BeautifulSoup(resp.text, html.parser)# 查找查询结果#results soup.find_all(div, class_py-2 flex)results soup.h3.stringif results:return results.strip()else:return 未找到翻译 # if results: # for result in results: # print(result.replace(\n\n\n,\n).strip()) # else: # return 未找到翻译 def process_txt_file(filename):workbook openpyxl.Workbook()sheet workbook.activewith open(filename, r, encodingutf-8) as file:words [i.strip() for i in file.readlines()]for index, word in enumerate(words):translation get_word(word)sheet.cell(rowindex 1, column1).value wordsheet.cell(rowindex 1, column2).value translationworkbook.save(translation_results.xlsx)#调用函数并传入txt文件路径 process_txt_file(words.txt) 三、提取双语例句到xlsx文件 先上效果以下是多个关键词及其相关例句的图示 相关代码如下 import requests from bs4 import BeautifulSoup import openpyxl headers {User-Agent:Mozilla/5.0 (Linux; Android 6.0; Nexus 5 Build/MRA58N) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/114.0.0.0 Mobile Safari/537.36 Edg/114.0.1823.37} def get_word(word):urlfhttps://zh.glosbe.com/zh/en/{word}resp requests.get(url,headersheaders)soup BeautifulSoup(resp.text, html.parser)# 查找查询结果results soup.find_all(div, class_py-2 flex)lst[]if results:for result in results:text result.text.replace(\n\n\n,\n).strip()lst.append(text.split(\n))return lstelse:return 未找到翻译def process_txt_file(filename):workbook openpyxl.Workbook()sheet workbook.activewith open(filename, r, encodingutf-8) as file:words [i.strip() for i in file.readlines()]for word in words:sheet.append([word])paras get_word(word)for para in paras:sheet.append(para)workbook.save(translation.xlsx)#调用函数并传入txt文件路径 process_txt_file(words.txt) 四、学后的反思 1. 爬虫不是万能的不能完全依靠爬虫去获取一切网上的信息毕竟有很多网站的案例防御机制是针对爬虫的 2. 利用BeautifulSoup是很不错的解析、提取网页标签的方法如果无法完全获取网页信息就要考虑带上headers,cookies等信息。 3. 写入excel文件有多种 方法列表写入Excel可以考虑sheet.append()方法简单实用。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/web/86689.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

qq浏览器在线郑州网站优化公司哪家好

jeffies hz xtime 每秒钟系统时钟节拍数 prco < 内核内存视窗 include/linux/list.h < 内核的数据结构&#xff0c;链表 workques_struct 工作队列转载于:https://www.cnblogs.com/asreg/p/7148606.html

个人备案网站能做什么如何给网站增加外链

输出各位数字之和能被15整除的所有数 输出100到1000之间的各位数字之和能被15整除的所有数&#xff0c;输出时每5个一行&#xff0c;每个数输出占4列列宽。 public class Day5 {public static void main(String[] args) {int t,flag0;for(int i100;i<1000;i){t (i/100)(i…

5千ip的网站能赚多少钱现在如何给网站做外链

获取深度和法线纹理 背后的原理 深度纹理是一张渲染纹理,它里面存储的像素值不是颜色,而是一个高精度的深度值。深度值范围是[0, 1],非线性分布的。这些深度值来自于顶点变换后得到的归一化的设备坐标(NDC)。一个模型想要被绘制在屏幕上,需要把它的顶点从模型空间变换到齐…

站内站怎么搭建wordpress安装主题

全世界只有3.14 % 的人关注了青少年数学之旅一个只能用算力来破解的加密算法1人类的加密史公元前5世纪&#xff0c;古希腊人使用一根叫scytale的棍子来传递加密信息。要加密时&#xff0c;先绕棍子卷一张纸条&#xff0c;把信息沿棒水平方向写&#xff0c;写一个字旋转一下&…

汽配人网做网站检察院内部网站升级建设

https://segmentfault.com/q/1010000009184137?_ea1845711 webstorm 不知道手贱点了什么&#xff0c;有时候会自动删除分号 webstorm javascript 繁忙的耗子 4月25日提问关注 4 关注收藏 0 收藏&#xff0c;470 浏览问题对人有帮助&#xff0c;内容完整&#xff0c;我也想…

怎么让网站文章被收录网站开发公司小程序开发

链接&#xff1a;https://www.nowcoder.com/acm/contest/135/C来源&#xff1a;牛客网 题目描述 其中&#xff0c;f(1)1;f(2)1;Z皇后的方案数&#xff1a;即在ZZ的棋盘上放置Z个皇后&#xff0c;使其互不攻击的方案数。 输入描述: 输入数据共一行&#xff0c;两个正整数x,m&am…

免费建设商城网站最优的手机网站建设

大家对工作的渴望我感同身受&#xff0c;有人去机器视觉培训机构培训&#xff0c;有人默默无闻地努力学习&#xff0c;不都是为了一份高新好工作吗&#xff1f; 实际上是&#xff1a; 技术高的人&#xff0c;劳动力贬值。 技术低的人&#xff0c;没有生存空间。 你有野心&…

海口网站建设电话程序开发过程有哪四个步骤

vb6的dictionary类 vb6 原生容器, 除了array还有collection, 没有原生的dictionary和set类, 在microsoft script runtime库(scrrun.dll) 中有一个dictionary类, 功能还算强大, 可以较好处理key-value这样的字典, 我甚至觉得用它也完全可以代替原生的collection类. microsoft sc…

高质量的南昌网站建设电商到底是做什么的

Spring cloud教程|Gateway服务网关 写在前面的话&#xff1a; 本笔记在参考网上视频以及博客的基础上&#xff0c;只做个人学习笔记&#xff0c;如有侵权&#xff0c;请联系删除&#xff0c;谢谢&#xff01; Spring Cloud Gateway 是 Spring Cloud 的一个全新项目&#xff0c;…

长清网站建设本地58同城招聘网

前言 每个成功的软件平台都有一个优秀的打包系统&#xff0c;比如Debian、Ubuntu 的 apt&#xff0c;RedHat、CentOS 的 yum。Helm 则是 Kubernetes上 的包管理器&#xff0c;方便我们更好的管理应用。 1.Helm的相关知识 1.1 Helm的简介与了解 Helm本质就是让K8s的应用管理&…

旅行社网站建设的目的杭州网页模板建站

Google是公认的全球最大的搜索引擎&#xff0c;同时&#xff0c;Google还通过旗下的 YouTube、Gmail、Google Play、Android等产品&#xff0c;汇集了海量的海外用户。对于跨境出海商家来说&#xff0c;谷歌广告是提高销售额、提高产品流量、拓展全球市场的重要推广渠道。 那么…

中山网站制作策划网络技术服务合同模板

文章目录1. 为什么要进行实例探究2. 经典网络3. 残差网络 ResNets4. 残差网络为什么有用5. 网络中的网络 以及 11 卷积6. 谷歌 Inception 网络简介7. Inception 网络8. 使用开源的实现方案9. 迁移学习10. 数据增强 Data augmentation11. 计算机视觉现状作业参考&#xff1a; 吴…

四川关于工程建设网站网站内页修改关键字

想要在保育员职位的求职过程中脱颖而出吗&#xff0c;参考这7篇精选的保育员简历案例&#xff01;无论您的经验如何&#xff0c;都能找到适合自己的简历样式及参考内容。 保育员个人简历模板下载&#xff08;可在线编辑制作&#xff09;&#xff1a;来幻主简历&#xff0c;做好…

网站备案被取消售后软件网站开发

在写一个代码生成可执行文件的过程需要经过编译和链接&#xff0c;编译又要经过三部&#xff1a;预处理&#xff0c;编译&#xff0c;汇编。 #define定义的变量和宏就是在预处理阶段会处理的。 一个简单的宏定义&#xff1a; #include<stdio.h>; #define Max(a,b) a>…

嘉兴市网站建设做网站总结与体会

系列文章目录 文章目录 系列文章目录前言一、使用过git merge和git rebase吗?它们之间有什么区别?二、使用过git cherry-pick,有什么作用?前言 前些天发现了一个巨牛的人工智能学习网站,通俗易懂,风趣幽默,忍不住分享一下给大家。点击跳转到网站,这篇文章男女通用,看…

青岛网站建设推广公司哪家好游戏代理怎么赚钱的

系列文章使用 abp cli 搭建项目给项目瘦身&#xff0c;让它跑起来完善与美化&#xff0c;Swagger登场数据访问和代码优先自定义仓储之增删改查统一规范API&#xff0c;包装返回模型再说Swagger&#xff0c;分组、描述、小绿锁接入GitHub&#xff0c;用JWT保护你的API异常处理和…

如何做seo整站优化天津做网站找哪家公司好

当需要在机器之间传输400GB文件的时候&#xff0c;你就会非常在意传输的速度了。默认情况下(约125MB带宽&#xff0c;网络延迟17ms&#xff0c;Intel E5-2430&#xff0c;本文后续讨论默认是指该环境)&#xff0c;scp的速度约为40MB&#xff0c;传输400GB则需要170分钟&#xf…

博客论坛网站开发珠宝类网站建设可执行报告

final&#xff0c;finally&#xff0c;finalize的区别 在Java中&#xff0c;final、finally和finalize是三个不同的关键字&#xff0c;它们具有不同的作用和用法。 1、final&#xff1a; final是一个修饰符&#xff0c;可以用于修饰类、方法和变量。 用于修饰类时&#xff0…

未备案的网站可以百度推广吗wordpress58同城主题

✨✨ 欢迎大家来访Srlua的博文&#xff08;づ&#xffe3;3&#xffe3;&#xff09;づ╭❤&#xff5e;✨✨ &#x1f31f;&#x1f31f; 欢迎各位亲爱的读者&#xff0c;感谢你们抽出宝贵的时间来阅读我的文章。 我是Srlua小谢&#xff0c;在这里我会分享我的知识和经验。&am…

海南省建设网站的公司投资 公司 网站模板

题目 产品数据表: Products 写一段 SQL来查找在 2019-08-16 时全部产品的价格&#xff0c;假设所有产品在修改前的价格都是 10 。 以 任意顺序 返回结果表。 查询结果格式如下例所示。 示例 1: 解题思路 1.题目要求我们查找在 2019-08-16 时全部产品的价格&#xff0c;假设所…