jsoup解析本地html网页到本地2

news/2025/10/23 13:39:12/文章来源:https://www.cnblogs.com/ligaohe/p/19160318
  • 在之前的jsoup解析本地html网页到本地中,虽然可以实现不同食物的解析,但是每个食物单独写一个方法实在太麻烦了
  • 注意到所有食物均属于Food的子类,且解析方法中有许多重复代码
  • 可将Food food以及Element foodDiv这两个方法中重复的参数作为通用方法的参数,提取公用方法:
// 提取公共解析逻辑到独立方法private void parseCommonFields(Element foodDiv, Food food) {String imgUrl = Objects.requireNonNull(foodDiv.selectFirst("img")).attr("src");String name = Objects.requireNonNull(foodDiv.selectFirst("h2")).text();String weight = foodDiv.select("p:contains(Weight)").text().replace("Weight: ", "");String caloriesStr = foodDiv.select("p:contains(Calories)").text().replace("Calories: ", "").replace("kcal", "").trim();int calories = Integer.parseInt(caloriesStr);String priceStr = foodDiv.select("p.price").text().replace("$", "");double price = Double.parseDouble(priceStr);String features = foodDiv.select("p.features").text().replace("Features: ", "");food.setName(name);food.setWeight(weight);food.setCalories(calories);food.setPrice(price);food.setFeatures(features);food.setImgUrl(imgUrl);}

然后,每个食物只需要调用公共方法,并提取自己的特有部分即可:

  1. Pizzas:
public List<Pizza> parsePizzas(String filePath) {List<Pizza> pizzas = new ArrayList<>();try {Document doc = Jsoup.parse(new File(filePath), "UTF-8");Elements pizzaDivs = doc.select("div.pizza");for (Element pizzaDiv : pizzaDivs) {Pizza pizza = new Pizza();parseCommonFields(pizzaDiv, pizza); // 调用公共解析方法// 只处理Pizza特有的字段String radius = pizzaDiv.select("p:contains(Radius)").text().replace("Radius: ", "");pizza.setRadius(radius);pizzas.add(pizza);}} catch (Exception e) {System.out.println("解析Pizza数据失败" + e.getMessage());}return pizzas;}
  1. FrenchFries:
public List<FrenchFries> parseFrenchFriess(String filePath) {List<FrenchFries> frenchFriesList = new ArrayList<>();try {Document doc = Jsoup.parse(new File(filePath), "UTF-8");Elements friesDivs = doc.select("div.french-fries");for (Element friesDiv : friesDivs) {FrenchFries frenchFries = new FrenchFries();parseCommonFields(friesDiv, frenchFries); // 调用公共解析方法// 只处理FrenchFries特有的字段String thickness = friesDiv.select("p:contains(Thickness)").text().replace("Thickness: ", "");frenchFries.setThickness(thickness);frenchFriesList.add(frenchFries);}} catch (IOException e) {throw new RuntimeException(e);}return frenchFriesList;}
  1. FriedChicken:
public List<FriedChicken> parseFriedChickens(String filePath) {List<FriedChicken> friedChickenList = new ArrayList<>();try {Document doc = Jsoup.parse(new File(filePath), "UTF-8");Elements friedChickenDivs = doc.select("div.fried-chicken");for (Element friedChickenDiv : friedChickenDivs) {FriedChicken friedChicken = new FriedChicken();parseCommonFields(friedChickenDiv, friedChicken); // 调用公共解析方法// 只处理FriedChicken特有的字段String spiciness = friedChickenDiv.select("p:contains(Spiciness)").text().replace("Spiciness: ", "");friedChicken.setSpiciness(spiciness);friedChickenList.add(friedChicken);}} catch (IOException e) {throw new RuntimeException(e);}return friedChickenList;}

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/944201.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Java 9 代码整洁之道:GeeCON大会技术实践

GeeCON参会体验 上周,我有幸参加了GeeCON大会。GeeCON是JVM领域中知名的会议,今年是其10周年纪念。在波兰克拉科夫举行的3天会议中,有1200多人参加了4个分会场的80多场演讲,演讲者超过70人。 这是我第一次参加GeeC…

2025 年新疆旅游线路服务最新推荐榜:聚焦企业专利技术、品质管控及知名客户合作案例的权威解析

根据文旅部数据统计,2024年新疆接待游客总量突破2.8亿人次,同比增长31%,其中定制化旅游服务需求增幅达45%。本文通过对17家新疆地接服务商进行多维数据分析,从企业资质、导游团队规模、服务品类覆盖、客户满意度等…

硬件编写_基于STM32单片机的汽车急控优秀的系统

硬件编写_基于STM32单片机的汽车急控优秀的系统pre { white-space: pre !important; word-wrap: normal !important; overflow-x: auto !important; display: block !important; font-family: "Consolas", &…

升级windows 11 25h2的步骤(xjl456852原创)

我自己电脑是windows11 的23h2,经过多次尝试,多次修改终于升级成功,遇到很多问题,现在记录一下。 环境准备 首先卸载电脑上的安全软件,如360,火绒,lock my pc之类的. 其他开机启动软件禁用启动项. 环境检查 通过文…

Prompt Optimizer 提示词优化器安装启用

pre { white-space: pre !important; word-wrap: normal !important; overflow-x: auto !important; display: block !important; font-family: "Consolas", "Monaco", "Courier New", …

【转载】cap,pcap文件中的ipv4数据包转成ipv6数据包

来源:https://blog.csdn.net/mincheat/article/details/78180656 cap , pcap文件结构(解析),网上多得是,这里就不写了。 写这个,主要是工作中正好需要大量的ipv6数据包,但是ipv6数据包不太好找,干脆就直接写个…

华为FusionCompute超融合上传ISO镜像方法教程

华为FusionCompute超融合上传ISO镜像方法教程 1、登录后点资源池,点存储2、点文件3、点上传文件4、选择镜像,点开始上传。5、等待上传完成,就可以选择华为FusionCompute超融合里面的ISO镜像了

QMPlay 编译

编译环境介绍 win11,msys2,vscode, cmake 首先下载相关依赖; 本文使用的ffmpeg5.1,qt6,libass。 安装libass pacman -S mingw-w64-x86_64-libass # 64位系统安装Ninja pacman -S mingw-w64-x86_64-ninja # 64位系…

2025 氧气/氮气/工业/氩气/高纯/液态/气体公司推荐榜:港骅 5 星领跑,黄骅及周边全品类供应,这些细分领域服务商更懂生产需求

随着工业生产对气体供应的稳定性、品类适配性要求提升,优质工业气体服务商成为保障生产效率的关键。这份结合供应能力、区域覆盖与用户口碑的推荐榜中,黄骅市港骅工业气体销售有限公司以 5 星实力稳居榜首,其余品牌…

Linux 命令 - 教程

Linux 命令 - 教程pre { white-space: pre !important; word-wrap: normal !important; overflow-x: auto !important; display: block !important; font-family: "Consolas", "Monaco", "Co…

详细介绍:如何实现多人协同文档编辑器

详细介绍:如何实现多人协同文档编辑器pre { white-space: pre !important; word-wrap: normal !important; overflow-x: auto !important; display: block !important; font-family: "Consolas", "Mon…

Java基础全面复盘:从入门到进阶的核心要点梳理

引言 Java作为一门经典的面向对象编程语言,自1995年诞生以来,始终保持着旺盛的生命力。无论你是刚刚接触Java的初学者,还是希望巩固基础的开发者,进行一次全面的基础复盘都大有裨益。本文将系统性地梳理Java核心知…

【STM32H743IIT6 系列】通过 LTDC接口驱动的 TFTLCD(RGB屏)显示

前言 SDRAM 配置 在开始此篇文章之前,首先要把 SDRAM 配置好,可以看我的上一篇文章:【STM32H743IIT6 系列】将外部SDRAM作为内部RAM使用的超简单方法没有将 SDRAM 作为内部 RAM 使用的朋友可以选择性看上面这篇文章…

10.22 —— 2024icpc沈阳D,E,B,M

D. Dot Product Game 首先将对两个数组的操作转变为对一个数组的操作:可以发现,对 \(a\) 的某个子数组循环左移 \(r\) 位 与 对 \(b\) 的某个子数组循环右移 \(r\) 位是等价的,因此修改某个情形,只需要对其中一个序…

AGV 系统的内部物流与装配智能化方案设计:应用场景与核心优势详解 - 实践

AGV 系统的内部物流与装配智能化方案设计:应用场景与核心优势详解 - 实践2025-10-23 12:55 tlnshuju 阅读(0) 评论(0) 收藏 举报pre { white-space: pre !important; word-wrap: normal !important; overflow-x: …

报表过滤框设置默认组织提示死循环

原因:首次赋值当前组织时,BeforeSetItemValueByNumber中过滤范围权限,导致赋值失败,组织字段重新为空,又触发值更新,再次赋值。 解决:实体服务规则中不勾选“值更新”,即值更新时不触发。

第九章-NOP Team dmz-C

第九章-NOP Team dmz-C 1、攻击者通过攻击DMZ-B机器发现有密钥可以免密登录到DMZ-C机器里,,然后攻击者上传了一个挖矿程序,请将该挖矿程序的名称提交, 我们使用DMZ-B下载的私钥进行登录查看当前pytho版本启用交互式…

高级语言设计第二次作业

这个作业属于哪个课程:https://edu.cnblogs.com/campus/fzu/gjyycx 这个作业要求在哪里: https://edu.cnblogs.com/campus/fzu/gjyycx/homework/13570 学号:102500309 姓名:郑睿杰 一、课后练习:(具体思路都在代…

UiPath License

UiPath Lincense: 22年之前,一个独立的OC license官价是2万美金。 22年到25年, UiPath推行了一套Flex的license类型,特点是OC可以免费安装使用,但各个独立的产品license的价格做了上调,比如attened robot, unatte…

一些变换

这篇文章主要是做一个总结和铺垫。 我们做物理题时,常常要解一些复杂的微分方程(便便),但是我们对方程做一些变换往往会使微分方程变成线性方程,这是好的,于是专门研究一些变换是重要的。 一些记号 \[\begin{ali…