Java 日期解析与格式化:从标准格式到自然语言解析

使用 Java 搭配 Apache Commons Lang3 和 Natty 库,实现灵活高效的日期解析与格式化。


一、背景

将不同格式的日期统一成一个格式。日期格式可能有以下几种类型:

  • 标准格式:2024-02-2814/05/20222002年5月6日
  • 非英文月份缩写:02 NIS 201826 AGO 2018(西班牙语)
  • 自然语言:next Mondaytwo days ago

二、依赖介绍

使用的版本是 jdk8。使用以下两个日期解析库:

1. Apache Commons Lang3

Apache Commons Lang3 提供了丰富的工具类,能够严格地解析各种标准日期格式。

<dependency><groupId>org.apache.commons</groupId><artifactId>commons-lang3</artifactId><version>3.12.0</version>
</dependency>

2. Natty

Natty 是一个专门用于解析自然语言日期的 Java 库,支持英文描述的各种日期表达方式。

<dependency><groupId>com.joestelmach</groupId><artifactId>natty</artifactId><version>0.13</version>
</dependency>

三、核心实现代码

定义一个工具类,提供统一的日期解析方法:

完整代码示例:

import org.apache.commons.lang3.time.DateUtils;
import com.joestelmach.natty.Parser;
import org.apache.log4j.Level;import java.text.ParseException;
import java.text.SimpleDateFormat;
import java.util.*;/**** @title* @author shijiangyong* @date 2025/5/14 14:18**/
public class SmartDateParser {// 允许解析的日期格式private static final String[] DATE_PATTERNS = {"yyyy-MM-dd", "yyyy/M/d", "dd/MM/yyyy", "yyyy年M月d日","dd MMM yyyy", "MMM dd yyyy", "dd MM yyyy","yyyyMMdd", "yyyy.MM.dd", "yyyy年MM月dd日", "d MMM yyyy","EEE, dd MMM yyyy"};// 处理非标准月份缩写(主要针对西班牙语、法语等)private static final Map<String, String> MONTH_CORRECTIONS = new HashMap<>();static {MONTH_CORRECTIONS.put("NIS", "APR");  // 可能是 AprilMONTH_CORRECTIONS.put("ABR", "APR");  // 西班牙语 AprilMONTH_CORRECTIONS.put("AGO", "AUG");  // 西班牙语 August}/*** 解析日期并转换为 yyyy-M-d 格式*/public static String parseDate(String input) {if (input == null || input.trim().isEmpty()) {return "Invalid Date";}input = input.trim().replaceAll("[,,]", "");// 修正月份缩写for (Map.Entry<String, String> entry : MONTH_CORRECTIONS.entrySet()) {if (input.contains(entry.getKey())) {input = input.toUpperCase().replace(entry.getKey(), entry.getValue());}}// 1. 明确格式优先处理for (String pattern : DATE_PATTERNS) {try {SimpleDateFormat sdf = new SimpleDateFormat(pattern, Locale.ENGLISH);// 严格校验日期sdf.setLenient(false);Date date = sdf.parse(input);return formatToStandard(date);} catch (ParseException ignored) {}}// 1. 使用 Apache Commons Lang3 解析try {Date date = DateUtils.parseDateStrictly(input, Locale.ENGLISH, DATE_PATTERNS);return formatToStandard(date);} catch (ParseException ignored) {}// 2. 使用 Natty 解析 (适用于 `next Monday`, `19 AUG 2019`)try {Parser parser = new Parser();List<com.joestelmach.natty.DateGroup> groups = parser.parse(input);if (!groups.isEmpty()) {List<Date> dates = groups.get(0).getDates();if (!dates.isEmpty()) {return formatToStandard(dates.get(0));}}} catch (Exception ignored) {}return "Unrecognized: " + input;}/*** 统一转换日期为 yyyy-MM-dd 格式*/private static String formatToStandard(Date date) {Calendar cal = Calendar.getInstance();cal.setTime(date);int year = cal.get(Calendar.YEAR);int month = cal.get(Calendar.MONTH) + 1;int day = cal.get(Calendar.DAY_OF_MONTH);return String.format("%04d-%02d-%02d", year, month, day);}public static void main(String[] args) {org.apache.log4j.Logger.getRootLogger().setLevel(Level.ERROR);List<String> testDates = Arrays.asList("02 NIS 2018", "2028-4-219", "19 AUG 2019", "2019-8-19","2002年5月6日", "2005/02/03", "03 SEP 1985", "14/05/2022","20 FEB 1991", "26 AGO 2018", "08 ABR 1975", "01 09 1988","next Monday", "yesterday", "two days ago", "2024.02.28","Wed, 19 Aug 2019");for (String dateStr : testDates) {System.out.println("输入: " + dateStr + " → 解析: " + parseDate(dateStr));}}
}

解析结果:

输入: 02 NIS 2018 → 解析: 2018-04-02
输入: 2028-4-219 → 解析: 2028-04-21
输入: 19 AUG 2019 → 解析: 2019-08-19
输入: 2019-8-19 → 解析: 2019-08-19
输入: 2002年5月6日 → 解析: 2002-05-06
输入: 2005/02/03 → 解析: 2005-02-03
输入: 03 SEP 1985 → 解析: 1985-09-03
输入: 14/05/2022 → 解析: 2022-05-14
输入: 20 FEB 1991 → 解析: 1991-02-20
输入: 26 AGO 2018 → 解析: 2018-08-26
输入: 08 ABR 1975 → 解析: 1975-04-08
输入: 01 09 1988 → 解析: 1988-09-01
输入: next Monday → 解析: 2025-05-19
输入: yesterday → 解析: 2025-05-13
输入: two days ago → 解析: 2025-05-12
输入: 2024.02.28 → 解析: 2024-02-28
输入: Wed, 19 Aug 2019 → 解析: 2019-08-19

要求的日期格式都正确解析了。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/bicheng/80961.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Room持久化库:从零到一的全面解析与实战

简介 在Android开发中,Room作为官方推荐的数据库持久化库,提供了对SQLite的抽象层,使得数据库操作更加安全、高效且易于维护。 Room通过注解处理器和编译时验证,显著降低了数据库操作的复杂度,同时支持响应式编程模式,使开发者能够轻松实现数据变化的实时监听。对于企业…

MySQL(6)如何删除数据库和表?

在 MySQL 中删除数据库和表是常见的管理操作。下面将详细介绍如何使用 SQL 语句以及图形化工具来删除数据库和表。 步骤一&#xff1a;连接 MySQL 服务器 首先&#xff0c;连接到 MySQL 服务器&#xff0c;可以使用命令行工具 mysql 或图形化工具如 MySQL Workbench。 使用命…

携固态电池、新形态钢壳叠片电池等产品 豪鹏科技将亮相CIBF 2025

携固态电池、新形态钢壳叠片电池等产品 豪鹏科技将亮相CIBF 2025 来源&#xff1a; 电池百人会-电池网 豪鹏科技&#xff08;展位号:14W001&#xff09;将携固态电池、新形态钢壳叠片电池及高安全性钠离子电池等前沿技术产品亮相CIBF 2025&#xff0c;凭借多年的技术积累和产…

React学习———useEffect和useLayoutEffect

useEffect useEffect是React的一个Hook&#xff0c;用于在函数组件中处理副作用。副作用包括数据获取、订阅、手动DOM操作以及其他需要再渲染后执行的操作 基本用法 useEffect(() > {// 副作用逻辑return () > {// 可选的清理函数} }, [依赖数组])第一个参数&#xff…

“天神之眼”计算平台的算力设计(预计500-1000 TOPS)

关于比亚迪“天神之眼”计算平台的算力设计&#xff08;预计500-1000 TOPS&#xff09;&#xff0c;其技术路径和行业意义值得深入探讨。以下从实现方式、技术挑战和行业影响三个维度展开分析&#xff1a; 1. 多芯片互联的技术实现路径 &#xff08;1&#xff09;芯片选型方案…

FPGA: Xilinx Kintex 7实现PCIe接口

在Xilinx Kintex-7系列FPGA上实现PCIe&#xff08;Peripheral Component Interconnect Express&#xff09;接口&#xff0c;通常使用Xilinx提供的7 Series Integrated Block for PCIe IP核&#xff0c;结合Vivado设计流程。以下是实现PCIe接口的详细步骤和关键点&#xff0c;适…

ArcGIS Desktop使用入门(二)常用工具条——图形

系列文章目录 ArcGIS Desktop使用入门&#xff08;一&#xff09;软件初认识 ArcGIS Desktop使用入门&#xff08;二&#xff09;常用工具条——标准工具 ArcGIS Desktop使用入门&#xff08;二&#xff09;常用工具条——编辑器 ArcGIS Desktop使用入门&#xff08;二&#x…

JT/T 808 通讯协议及数据格式解析

文章目录 一、引言二、协议数据帧结构三、消息头结构&#xff08;Message Header&#xff09;四、常用消息类型&#xff08;Message ID&#xff09;五、典型消息体结构解析六、数据转义规则七、校验码计算方法八、终端与平台通信流程示意&#xff08;简要&#xff09;九、平台接…

Rust 输出到命令行

Rust 输出到命令行 引言 Rust 是一门系统编程语言&#xff0c;以其高性能、内存安全、并发支持和零成本抽象等特性而闻名。在开发过程中&#xff0c;将 Rust 程序的输出传递到命令行是常见的需求。本文将详细介绍 Rust 输出到命令行的多种方法&#xff0c;帮助读者掌握这一技…

从字符串转换到矩阵快速幂:解决多次转换后的长度问题

引言 在编程竞赛和算法问题中&#xff0c;我们经常会遇到需要对字符串进行多次转换的问题。本文将介绍一个有趣的问题&#xff1a;给定一个字符串和转换规则&#xff0c;计算经过多次转换后字符串的长度。由于直接模拟会导致性能问题&#xff0c;我们将使用矩阵快速幂来高效解…

Vue2 elementUI 二次封装命令式表单弹框组件

需求&#xff1a;封装一个表单弹框组件&#xff0c;弹框和表单是两个组件&#xff0c;表单组件以插槽的形式动态传入弹框组件中。 外部组件使用的方式如下&#xff1a; 直接上代码&#xff1a; MyDialog.vue 弹框组件 <template><el-dialog:titletitle:visible.syn…

React Hooks:从“这什么鬼“到“真香“的奇幻之旅

写在前面:一个让React老手都拍案叫绝的魔法 “等等,函数组件怎么能有状态?!” —— 这是2018年我第一次听说React Hooks时的反应。当时我正在用class组件写一个复杂的表单,生命周期方法乱得像一碗意大利面。直到我看到了这段代码: function Counter() {const [count, s…

论文阅读笔记——双流网络

双流网络论文 视频相比图像包含更多信息&#xff1a;运动信息、时序信息、背景信息等等。 原先处理视频的方法&#xff1a; CNN LSTM&#xff1a;CNN 抽取关键特征&#xff0c;LSTM 做时序逻辑&#xff1b;抽取视频中关键 K 帧输入 CNN 得到图片特征&#xff0c;再输入 LSTM&…

SpringBoot Vue MySQL酒店民宿预订系统源码(支付宝沙箱支付)+代码讲解视频

&#x1f497;博主介绍&#x1f497;&#xff1a;✌在职Java研发工程师、专注于程序设计、源码分享、技术交流、专注于Java技术领域和毕业设计✌ 温馨提示&#xff1a;文末有 CSDN 平台官方提供的老师 Wechat / QQ 名片 :) Java精品实战案例《700套》 2025最新毕业设计选题推荐…

右值引用的学习

传统的C语法中就有引用的语法&#xff0c;而C11中新增了的右值引用语法特性&#xff0c;所以从现在开始我们之前学习的引用就叫做左值引用。无论左值引用还是右值引用&#xff0c;都是给对象取别名。 左值引用和右值引用 在讲之前&#xff0c;我们先来看一下什么是左值和右值…

PHP黑白胶卷底片图转彩图功能 V2025.05.15

关于底片转彩图 传统照片底片是摄影过程中生成的反色图像&#xff0c;为了欣赏照片&#xff0c;需要通过冲印过程将底片转化为正像。而随着数字技术的发展&#xff0c;我们现在可以使用数字工具不仅将底片转为正像&#xff0c;还可以添加色彩&#xff0c;重现照片原本的色彩效…

【Three.js基础学习】36.particles-morphing-shader

前言 通过着色器如何实现粒子之间动态切换 一、代码 script.js import * as THREE from three import { OrbitControls } from three/addons/controls/OrbitControls.js import { GLTFLoader } from three/addons/loaders/GLTFLoader.js import { DRACOLoader } from three/a…

【PostgreSQL数据分析实战:从数据清洗到可视化全流程】附录-D. 扩展插件列表(PostGIS/PostgREST等)

&#x1f449; 点击关注不迷路 &#x1f449; 点击关注不迷路 &#x1f449; 点击关注不迷路 文章大纲 附录D. PostgreSQL扩展插件速查表一、插件分类速查表二、核心插件详解三、安装与配置指南四、应用场景模板五、版本兼容性说明六、维护与优化建议七、官方资源与工具八、附录…

【Linux】冯诺依曼体系结构和操作系统的理解

目录 冯诺依曼体系结构一个例子来深入理解 初识操作系统操作系统的作用设计操作系统的目的操作系统之上和之下分别有啥 管理的精髓&#xff0c;先描述&#xff0c;再组织 冯诺依曼体系结构 我们知道&#xff0c;计算机这个东西发明出来就是帮助人们快速解决问题的。那如果我们想…

kotlin @JvmStatic注解的作用和使用场景

1. JvmStatic 的作用 JvmStatic 是 Kotlin 提供的一个注解&#xff0c;用于在 JVM 上将伴生对象&#xff08;companion object&#xff09;中的方法或属性暴露为 Java 静态方法或字段。 作用对象&#xff1a;只能用在 companion object 中的函数或属性。效果&#xff1a; 在 …