AI 时代的数据库进化论 —— 从向量到混合检索

news/2025/11/6 18:54:25/文章来源:https://www.cnblogs.com/OBCE666/p/19197515

AI 时代的数据库进化论 —— 从向量到混合检索

说明:

  1. 本文只是关于数据库发展趋势的个人见解,没有特别深入的向量和混合检索的实现原理,属于很浅显易懂的科普类文章,几乎不需要任何背景知识,大家可以放心阅读。
  2. 关于混合检索的原理和最佳实践类文章,有缘再更,欢迎感兴趣的朋友们关注【老纪的技术唠嗑局】微信公众号。

背景

数据的分类

我一般会把数据库中的数据类型,简单分为三类:

  1. 结构化数据:我们可以把传统数据库的基础数据类型,都看成结构化数据,每个数据可以堪称一个 “原子” 数据,例如 int、double、char、varchar。
  2. 半结构化数据:就是 Json / GIS / XML 这些。一个半结构化对象嵌套组织了很多基础数据类(半结构化数据类似一个 “分子”,是由一些 “原子” 以及相应的 “链接结构” 嵌套组成),我们称之为半结构化数据。
  3. 非结构化数据:简单说就是 “图、文、音、视” 这类东西。这些数据有一个特点 —— 大,这个特点导致这类数据的排序没啥意义,也没法儿做计算。

数据库的能力边界:

  • 关系型数据库能处理好结构化数据,因为对结构化数据进行数据压缩存储非常容易(比如除了通用的压缩算法,还可以基于每一个类型数据的特征,可针对性地进行多种编码压缩),以及很好的做数据计算,比如做一些基础的比较、排序、聚合、扫描、表达式计算等。
  • 半结构化数据,在实际应用中一直是基于专用数据库,大部分也是存储在 NoSQL 数据库中。例如,Mongo 的基本组成是 Document,Redis 有各种各样的复杂数据结构 List / Hash / Set 等等,GIS 一般会使用 PostGis 等专用数据库。

其实,关系数据库也能比较好处理半结构化数据,比如 Json,可以基于 Path 来访问具体的数据,Json Path 就有点类似于我们关系数据表的列的概念。而且,半结构化数据,是可以拆解成结构化数据的,基于关系数据库的能力,我们是可以对半结构化数据做存储和计算的。

除了上面提到的结构化数据和半结构化数据,还有一类,叫做 “非结构化数据”:

  • 非结构化数据在 AI 时代来临之前,对于数据库而言,只能存储,不能计算。对于存储来说,非结构化数据很大,基本上都需要用大对象进行存储(例如 blob),在存储上,相比其他类型,也是不优的(而且很贵)。
  • 非结构化数据在现实世界,绝大部分是存储在本地文件系统,例如:对象存储,块存储。这些存储一个典型的特点就是便宜。
  • 通用意义上的非结构化数据,目前只有向量数据库能够通用处理。如果单独把文本拎出来,除了向量,还可以进行全文文本处理。关于全文检索的更多内容,详见:《全文索引能力简介》。

AI 时代,数据库发生了什么变化?

在现实世界中,非结构化数据占比 80% 以上。但这些数据,绝大多数都只是存储,没有计算。

而在 AI 时代,数据只有能被计算,才能产生价值。

大模型

GenAI 带来了通用大模型。

在数据处理上,总结下来,大模型有两类能力:

  1. 直接处理非结构化数据。比如,输入一个文本,让大模型对文本进行总结。
  2. 提取非结构化数据的结构化特征,然后存储在关系数据库中做计算。举个例子,一张图片,我通过提示词,让大模型提取这张图片的 tag,比如提取 “穿裙子”、“长发”、“女士”、“湖边” 等等。提取了 tag 之后,数据库就可以做分析计算了。

在 GenAI 时代之前,非结构化数据是不是能被处理?其实也是可以的,只不过非常 “复杂”,需要进行 “定制”。

之前核心技术就是机器学习,在 GenAI 时代,这种技术门槛更低、更通用,也更便宜。

嵌入模型

大模型的维度都是以 B(Billon)为单位,嵌入模型一般都在 1K 维左右。

嵌入模型能捕获非结构化数据的 “隐形” 特征,然后将这些特性用高纬向量来表示,通过计算 2 个高纬向量的距离(比如 Cosin / IP 距离)等,来近似代替 2 个非结构化数据的相似度。相关内容详见:《浅入了解向量数据库》。

向量其实是一个半结构化数据(前面讲过,数据库只能高效处理结构化 / 半结构化数据),比如一个 1024 维度的向量,其实是一个 1024 个元素的 Array,每个 Array 都是一个 Float 类型。

在传统数据库中,非结构化数据是不可比较的,比如 2 张照片通过二进制比较完全没有意义。通过嵌入模型,2 个非结构化数据,就可以比较了(不过传统关系数据库的大小比较有些不同,这里是 “相似度” 比较),也就是这个 “可以比较了”,打开了非结构化处理的大门。

说明:

传统的关系数据库,最基础的数据处理其实也是比较,排序、过滤,甚至于扫描,都是基于比较的能力。

下图是个很常见的二维空间的例子。财富和相貌,是向量的 2 个维度。向量的每一个维度,就是非结构化数据 “隐形” 的一个特征。可以看到,在空间坐标系里,距离越近的 2 种生物,就越相似(这个也是最简单向量数据库的原理)。

有了大模型,为什么还需要向量数据库?

大家可以用反证法,先想象一下,在 AI 时代,如果只有大模型而没有向量数据库,会出现什么样的场景?

拿以图搜图为例

假设我有 100w 张图片,每次找相似的图片的时候,都绕过向量数据库,直接透传给大模型来处理。然后你就会发现:大模型超级慢,即使是不带推理的 Deepseek R1,也只能秒级出结果。(传统关系数据库的数据处理可是毫秒级,直接相差了 3 个数量级)。所以,在整个 AI 应用的数据链中,向量数据库不是瓶颈,大模型才是。

  • 大模型:哪怕是 10 亿参数的轻量模型,每生成一个 token(单词/字)都要遍历全部参数做矩阵运算,生成一段话要重复几十次这种运算——相当于“雇 10 亿个会计,每人算一步,才能得出一个句子”,硬件和算法优化空间远小于数据检索。
  • 向量数据库:哪怕处理 10 亿级向量,通过数据库中最常见的 “索引 + 并行”,能把检索延迟压到百毫秒内。

所以,大模型不适合大量的数据实时处理,向量数据库更合适。在处理海量数据的时候,正常思路只能是:向量数据库做初筛,大模型做总结 / 二次加工。

拿知识库为例

大模型有幻觉,这个是大家公认的。大模型可以回答很多,但是有可能很多是“胡说八道”。主要原因是大模型的知识是靠训练数据集来的,但是很多企业内的数据是不公开的。

大模型处理数据的上下文是有 “窗口大小” 的,比如 GPT-4 是 8K。一方面没有办法一下子给大模型塞整个企业的数据进去处理,另外大模型在处理特定问题的时候,也需要更加 “专注”,也就是说:少量非常相关的信息就可以了,不需要大量无关的信息。

在这个过程中,就不得不请出向量数据库,让它用最快的速度,过滤出和用户问题最相近的知识,然后交给大模型做总结。

总结

综上,AI 时代最常见的一个需求就是海量非结构化数据的近实时检索,现在,只有向量数据库能干。一般的 AI 解决方案,就是 “向量数据库 + 大模型” 相互配合,向量数据库的 “近实时检索” + 大模型的 “通用智能”。

所以毋庸置疑,向量数据库这个玩意儿,已经是 AI 时代数据库进化路线的重要一环。

最近一段时间,除了专业向量数据库,其他关系型数据库、noSQL 数据库、各种搜索引擎,也都开始逐步支持向量存储和检索的能力。

目前,不同数据库的向量能力演进路线可能会略有不同。但在不久的未来,大概率会殊途同归,即:向量(vector)会成为数据库中,和数字类型(number)、字符串类型(string)一样的基础数据类型。

这里多解释一句,上图中把向量索引单独从普通二级索引中抽离出来,主要是因为向量类型的检索开销较大,而且检索结果只要求近似而非绝对,所以会有一种独特的索引形式 —— 向量索引。

同理,全文索引、空间索引等,大致也是类似的原因。

什么是混合检索?

最近一段时间,数据库行业里的很多公司和大佬,都在纷纷发布一些混合检索的原理和实践类文章。Why?因为支持混合检索的数据库已经逐步成为了 AI 时代的刚需。

  1. 在生产环境中使用数据库,往往都会考虑权限问题。权限问题主要的解法,就是把文档表、员工权限表以及各种各样的表去做 Join。我目前几乎没有看到过有用户和业务使用很 “纯粹” 的向量检索,一般都会有标量 & 向量混合检索。这个标量,靠的就是传统数据库的检索能力。
  2. 为了让检索更准确,对于 RAG 方案,目前业界比较共识的方案是:全文 + 向量混合检索。未来,没有全文检索能力的数据库厂商,很难满足 RAG 方面的需求。
  3. 其他类似于 GraphRag 的方案,在学术界以及工业界也比较活跃。所以,向量 + 图混合检索的需求,也变的越来越常见。

那什么是混合检索?与其给出定义,不如直接举个例子来的方便。

比如基于蚂蚁百宝箱搭建的一个餐饮推荐 AI Agent 系统,会把用户的自然语言提问,转换成对知识库的搜索。

在上图的这个提问中:

  • 距离五百米以内,是基于空间位置(GIS)的查询。
  • 人均消费 25 元,评价 4.5 分以上,是基于传统标量的查询。
  • 不用排队,是基于用户对店铺的评价,基于向量的语意检索。

混合检索 —— AI 应用的发动机

AI 应用,强依赖知识库

上图是某知名保险行业 ISV 的智能体整体架构图。

各个 Level 的依赖可以简化如下:

绝大多数 AI 应用的架构都可以简化为上述架构图,例如:通用的知识库平台(各类问答助手)、智能体推荐系统(飞猪的旅游推荐)、类似于 Cursor 的智能编码助手、行业 AI 助手(数据库运维监控智能体)……

接下来,再针对上面这张图多说两句:

  • 智能体的效果依托于 “知识库”、“模型”、“业务逻辑”。在特定的智能体应用中,业务逻辑是固定的,模型只能在通用的模型矩阵中做选择,知识库成为智能体效果的重中之重。
  • 知识库的效果依赖很多方面:
    • 数据是否高质量,数据的清洗、打标、提取的程度,好的数据是好的效果的开端。
    • 查询语句是否高质量,查询语句是否经过充分的改写(比如改错别字 / 近义词替换),扩写(多维度问问题),语义/上下文填充。
    • 数据检索是否准确,在业界已经形成了共识,即混合多种检索方式(向量检索、关键词检索等)是提升最终效果行之有效的方式。
    • 数据检索是否高效,多种检索方式的引入,会引入更大量的计算,如何在保证准确的情况下更快给应用返回,缩短检索时延也是应用体验的重要一环。

基于上述讨论,我们可以基本达成一个共识,就是:知识库是影响 AI 应用效果非常重要的一环,而知识库的效果,强依赖于数据检索的质量和效率。所以,对于 AI 时代的数据库来说,就必须要为用户提供 —— 准确 & 高效的实时混合检索以及数据处理能力。

知识库,强依赖混合检索

知识库(RAG,检索增强生成)的最终目标还是模型生成的效果,各个语言大模型类请求上下文窗口一般在 128K 以下,而且喂给模型的请求包含很多信息,比如提示词、记忆、从知识库中检索的信息。

大模型拥有比较强大的泛化能力,但是最终效果还是需要依赖整个请求中的上下文信息。理想情况下,我们希望把更多的信息塞给大模型(如果可以的话,最好能直接整个知识库都填鸭式地塞给大模型),这样能取得最好的效果。

但是实际情况是,大模型的上下文窗口比较小,而且塞的越满,模型效果就可能越差。受限于大模型的上下文窗口大小,每个 token 都珍贵,最终塞给大模型的数据要尽量有相关性、精炼、准确。

下面是 Chroma 的创始人 Jeff Huber 在分享 Context Engineering 的概念时,报告里的一张折线图。可以很直观地看出,随着上下文长度不断增加,模型的效果会有明显的衰减。

虽然最近 DeepSeek-OCR 模型重新定义了 AI 的输入和输出(从文本到像素),能够在一定程度上对数据进行压缩(详见:《用最纯粹的语言,解析 DeepSeek OCR》)。然而,知识库一般都非常庞大,如何高效地从一个超大数据集找到大模型强依赖的信息,依然尤为重要。

如上图,从全量数据到模型窗口之间,形成了一个大漏斗。这里有几个概念需要再多解释一下:

  • 圈数据:基于用户明确的要求(“比如人均消费 25 元,评价 4.5 分以上,距离我 500 米以内”),把不满足要求的数据快速筛掉,这部分强依赖传统关系型数据库的基础能力。
  • 粗排:在得到满足基本要求的数据集后,需要基于和查询请求的相关性,对候选数据集做排序。这部分重点在通过数据库的手段来找到最相关的数据,使用数据库的非常重要的原因是快,基本能够保证百毫秒内的时延,这个特点对于在线查询非常重要。
  • 精排:粗排阶段的快,牺牲了一定的准确度(比如向量这一路,因为是双塔模型,请求和候选数据集之间的相关性不够强。 全文这一路,依赖的是关键字的匹配,语义相关性弱),粗排的思路是快速召回一堆结果,认为需要的结果大概率就在这一堆数据里面。在对精度要求比较高的场景,往往需要一些重排模型,来交叉获取查询请求和数据之间的深层次关系,从而对数据集做更精准的定序。以 Reranker 模型为例,需要对每个 “查询 - 文档” 对进行实时推理,这会显著增加系统的响应时间(从毫秒级可能升至几百毫秒甚至秒级)和每次查询的计算成本,所以依赖待精排的数据量进一步的小。

圈数据

圈数据很重要,很多数据库都会支持,比如 ES / Mongo / 关系数据库,每种数据库适用的场景也不尽相同。

对于 ES 等 NoSQL 数据库,一般只支持单表操作,设计上往往是反范式,会把一个业务场景的所有数据字段都放到一张表中,经常会形成一张大宽表。

对于一些依赖范式的 “一对多” 的能力,比如一个人有多个电话号码,ES 往往使用嵌套结构来实现。但是反范式的大宽表 + 嵌套结构的方式,往往会带来更新代价大,数据一致性等问题。所以一般是在一致性 / 实时性要求不高的边缘系统中出现,核心系统一般还是会选择关系型数据库。

关系型数据库基于关系范式,一个业务场景,往往会有多张表,每张表各司其职,多张表间有外键等关联。关系数据库优化器比较重要的能力是在各张表中选代价最低的索引以及在多张表间选择最优的 Join 顺序以及算法,整体扩展性和灵活性更好。

粗排

单一的粗排手段,往往有很多不容易被覆盖到的场景。比如召回一堆基于模版生成的数据,使用单一向量数据库不能很好的区分;比如需要召回多语言、有同义 / 近义语意的数据,只是基于关键字的搜索引擎也不能很好地解决。所以在实际工程中,往往会把多种召回方式(稠密向量、稀疏向量、搜索引擎、图等)混合使用。

基于多路检索的粗排,会带来如下几个问题:

  • 粗排精度问题:排序最终是对数据行做排序,排序分数一般是基于数据行中各个算分列的分数之和,可以看作是全局排序。“烟囱” 式的多路检索,一般是每一路取 TopK,然后再做融合(多路归并),可以看作是每一路单独局部排序再融合,相比全局排序,会损失精度,大大影响 AI 应用的效果。
  • 易用性问题:需要 AI 应用自己处理多路检索以及结果的融合,整个流程比较繁琐。
  • 一致性问题:如果是多个数据库承载多路检索,多个系统之间数据的一致性就需要进行额外处理。
  • 效率 & 成本问题:多路检索,需要维护多份数据,多份数据独立检索,消耗的计算资源也是成倍增加。

因此,混合检索在粗排阶段的优势也非常明显。也就是说,如果一款数据库可以支持多模数据类型,那就可以基于同一份数据,同时支持向量、全文等排序方式,并且是将多路检索融合到一个算分排序框架中,在给粗排带来更高精度的同时,也避免了数据一致性 / 成本 / 易用性等问题。

精排

在多路检索中涉及到向量以及重排(精筛)时,因为向量依赖嵌入模型,精筛依赖重排模型,而目前的向量 / 关系数据库都不支持在 DB 内调用模型,所以会导致整个流程十分复杂,涉及到应用和 DB 的多次交互。如下图所示:

因此,未来数据库的混搜框架中,需要内置 AI Function 的能力,支持嵌入模型、重排模型、大模型的调用。

无论是数据写入触发的索引构建流程中的向量 Embedding 生成,还是查询时候查询语句的向量 Embedding生成,都应该让数据库自动触发。在集成 Embedding 的 AI Function 能力后,用户可以不感知向量的存在,向量隐藏在数据库自身的索引表中

数据库需要集成 Embedding 的原因是:

  • 嵌入模型同时要被应用于查询以及待检索的数据集,如果这两者用的模型类型 / 版本不一致,会导致向量检索空间不一致,召回的数据就会有问题。数据库系统往往都抱着事不关己高高挂起的态度,把这个问题抛给用户来保证,虽说这种做法也理所应当,但如果 Embedding 能被数据库托管,模型信息成为数据的元数据,元数据版本被数据库管理,数据一致性就能在内部得到更好的保障。
  • 模型发展很快,当在做模型尝试或者更强能力的新模型发布的时候,经常会有换模型的诉求。之前的解决方案,都需要用户删掉所有的旧向量,扫描存储在数据库中的 Chunk,生成新向量,插入数据库,整个流程非常繁琐,而且新旧索引的交替,也会影响业务的使用。现在 Embedding 被数据库托管,换模型就是一个 Rebuild Index 的 DDL 命令,向量索引切换以及旧索引的回收,数据库都会内部包掉,对业务无感知,最重要的是整个过程几乎不影响业务的访问。

除此以外,用户还可以考虑显示调用 Rerank 模型的能力,在粗排之后,调用 Reranker 的 AI Function 即可。

至此,正文结束。这篇文章没有涉及过多的混合检索底层实现原理和使用上的最佳实践,后面再继续更新吧。

对混合检索实现原理感兴趣的老师们,欢迎继续观看下面这个视频(如果能点赞、收藏、留言就更好了)。

最后,这篇文章可能会有很多疏漏以及表述不当的地方,希望各位老师多多在留言区批评和指导。


接下来,就是大家期待已久的广告时间了~

Commercial Break

0x00. OceanBase 在混合检索方面的表现

因为在最前面说了在正文部分不会包含和数据库厂商相关的内容,所以数据库厂商在混合检索方面的能力、性能对比,就不得已放到了最后的这个 “广告时间” 中。

粗排阶段

  • OceanBase 支持多模数据类型,基于同一份数据,同时支持向量、全文等排序方式,并且是将多路检索融合到一个算分排序框架中,在给粗排带来更高精度的同时,也避免了数据一致性 / 成本 / 易用性的问题。
  • OceanBase 的粗排能力在性能上,一直在向业界最优秀的几款有相关能力的数据库产品看齐(这里不多评判各类数据库产品,性能数据参考下图)。

  • 在相关功能上:
    • OceanBase 的向量能力,目前也可以对标目前最流行的向量数据库前辈 Milvus 的各种算法和功能。
    • OceanBase 在全文上支持 RAG 场景下对 BM25、Multi Match、稀疏减枝算法、RankFeature 等功能,知识库场景基本上可以平替另一位老前辈 ElasticSearch。

精排阶段

OceanBase 内置了 AI Function 的能力,支持嵌入模型、重排模型、大模型的调用。

目前 OceanBase 已经把 AI Function 的能力融入到整个混搜的框架中。

整个混合检索过程中的圈数、粗排、精排,都可以完全融入到 OceanBase内核,用户可以直接向 OceanBase 中插入文本 Chunk,查询的时候直接使用原始自然语言字符串做查询,实现真正意义上的 Data In,Data Out,让整个 AI 多路检索更加简单和高效。

0x01. OceanBase 4.4.1 CE 正式发布!

OceanBase 4.4.1 社区版已经在 10 月 24 日正式发布,混合检索的能力得到了进一步的提升,欢迎大家来下载和试用。

以下内容摘自 OceanBase V4.4.1 CE 版本的 release notes[1]

  • V4.4.1 版本对向量检索能力进行了升级,支持 Hybrid Search 混合检索,提升召回效果。
  • 新增 AI function 能力,支持 SQL 访问大模型。
  • 此外通过适配 ARM 架构、无主键表优化、IVF 索引优化等手段进一步提高向量检索的性能。
  • 新增视图展示向量索引内存占用和异步任务状态,提升易用性。
  • ……

文档详见:OceanBase 官方文档《向量索引混合检索》[2]

下载地址:OceanBase 软件下载中心[3]

0x10. AI Native 数据库产品即将发布!!

To be continue.(这款产品会在 OceanBase 2025 年度发布会[4]上的 “开源之夜” 环节中正式亮相,欢迎大家关注)

参考资料

[1]

OceanBase V4.4.1 CE 版本的 release notes: https://www.oceanbase.com/product/oceanbase-database-community-rn/releaseNote_#V4__.4.1_

[2]

OceanBase 官方文档《向量索引混合检索》: https://www.oceanbase.com/docs/common-oceanbase-database-cn-1000000004020382_#3__-title-%E6%99%AE%E9%80%9A%E6%A0%87%E9%87%8F%E6%A3%80%E7%B4%A2_

[3]

OceanBase 软件下载中心: https://www.oceanbase.com/softwarecenter

[4]

OceanBase 2025 年度发布会: https://www.oceanbase.com/conference2025

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/958017.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

深入解析:操作系统基础:了解进程、线程、协程,理解I/O模型(阻塞/非阻塞,同步/异步)。

pre { white-space: pre !important; word-wrap: normal !important; overflow-x: auto !important; display: block !important; font-family: "Consolas", "Monaco", "Courier New", …

vue 3.x 前端导出功能

首页安装插件 npm install xlsx 在当前页面中引入import * as XLSX from xlsx点击事件<a-button :disabled="orderList.length === 0" :size="small" @click="exportExcel"><…

最高法-合同目的的认定

最高法-合同目的的认定2025-11-06 18:48 wwx的个人博客 阅读(0) 评论(0) 收藏 举报(2023)最高法民申2327号 天府某公司、西藏某公司等技术服务合同纠纷民事申请再审审查民事裁定书 本院认为: (一)关于涉案合…

2025年恒温恒湿机标杆厂家最新推荐:中焓环境,档案室恒湿机/精密恒温恒湿机/吊顶恒温恒湿机/档案室恒温恒湿机,定义环境控制精准新标准

随着社会对文物保存、精密制造、数据中心运维及工业生产的环境要求日益严苛,恒温恒湿设备已从特定领域专用设备,扩展至博物馆、档案馆、数据中心、医药、电子等多个关键行业。2025年,市场需求预计将持续增长,但随之…

2025年恒温恒湿厂家及恒湿设备标杆之选:中焓环境,适配机房/档案室/展柜等场景

随着各行业对环境温湿度精准控制需求的不断提升,尤其是机房、档案室、展柜等特殊场景对环境稳定性要求趋严,以及环保与节能理念在设备领域的深入渗透,恒温恒湿机、恒湿机等相关设备已从专业领域逐步拓展至更多行业应…

酸角糕行业发展趋势解析:2025年十大品牌综合测评与选择指南

酸角糕行业发展趋势解析:2025年十大品牌综合测评与选择指南【摘要】 酸角糕作为一种传统健康零食,近年来在消费升级和健康饮食潮流推动下,行业规模持续扩大,预计年增长率超过15%。本文基于第三方调研数据、用户口碑…

2025年11月酸角糕行业十大厂家排行榜:探索健康零食的新趋势与优选指南

2025年11月酸角糕行业十大厂家排行榜:探索健康零食的新趋势与优选指南随着消费者对健康食品需求的增长,酸角糕行业近年来蓬勃发展,成为休闲零食市场的新宠。本文基于行业数据分析及市场调研表单(包括消费者偏好、销…

mysql 查看数据库大小

SELECT table_schema AS "Database", ROUND(SUM(data_length + index_length) / 1024 / 1024, 2) AS "Size (MB)" FROM information_schema.tables GROUP BY table_schema;

2025年11月酸角糕厂家综合评测:健康零食新风向与选购全攻略

2025年11月酸角糕厂家综合评测:健康零食新风向与选购全攻略【摘要】 酸角糕行业正迎来快速发展期,随着消费升级和健康饮食理念的普及,这一传统零食焕发新生。本文基于行业调研数据及消费者反馈表单(包括产品口感测…

2025年11月酸角糕十大厂家权威排行榜:天然健康零食优选指南

2025年11月酸角糕十大厂家权威排行榜:天然健康零食优选指南摘要 近年来酸角糕行业迎来高速增长,2023 年市场规模已达 18.5 亿元,预计 2030 年将以年均 9.6% 的复合增长率攀升至 35 亿元以上。健康消费理念深化推动天…

oi 卡时技巧

这篇记录一下卡时技巧 卡时就是指在程序即将t飞的时候直接输出当前答案,适合在答案更新过程中当前答案有对的可能,但是全部更新完时间不够,就在即将t飞的时候结束程序,直接输出当前答案。 具体代码示例1: //来源于…

不越狱给iOS App装Tweak/插件:LiveContainer环境介绍与Tweak编写

自iOS 16.5.1之后,Arm64e设备的越狱一直处于停滞状态,没有新的进展。 不少越狱开发者也逐渐脱离越狱开发,转向JIT等新方式面对iOS的新环境。 iOS App相关的Tweak/插件在越狱鼎盛时代生机勃勃,Flex3的注入和Cydia等…

课后作业2(异常处理)

Java项目异常处理实战指南:从规范到落地 在Java项目开发中,异常处理是保障系统健壮性的核心能力。一份优秀的异常处理方案能将故障排查时间缩短50%以上,同时提升系统可用性30%。但实际开发中,空catch块、滥用异常控…

Bigtop 从零开始搭建大数据集群

背景 公司目前在线上环境使用的是基于 HDP 2.6.3 搭建的大数据集群,在持续使用4年之后,是否要给集群做个升级成为了一个值得思考的问题 现在集群的 Hadoop 版本是 2.7.3,继续使用倒也没什么问题,但一些使用痛点还是…

chatgpt-to-md优化并重新复习

chatgpt-to-md优化并重新复习之前原本写的又重新改了改 [https://www.cnblogs.com/tokepson/p/19152535](记录 | 个人开发库推送至PyPi流程梳理(ChatGPT to Markdown 工具发布完整流程) )以上废话 总之因为发现只支持…

从零开始制作 MyOS(六)

从零开始制作 MyOS(六) 今天的任务是:添加异常处理代码——除零操作。 除零操作的过程概述: C代码中的除零代码被编译成汇编语言,然后CPU在执行的时候发现除数为0后,直接触发除零错误,然后保存上下文,关中断,…

2025年11月介电常数测试仪推荐厂家排行:应该如何选择靠谱供应商

在材料科学和电子工程领域,介电常数测试仪是评估材料电气性能的关键设备。随着技术的不断进步,市场上涌现出众多介电常数测试仪供应商。本文将基于2025年11月的市场情况,推荐一些值得信赖的介电常数测试仪厂家,并提…

2025年11月电阻率测试仪工厂推荐:北京冠测精电——信誉、口碑与售后的三重保障

在材料科学和电子工程领域,电阻率测试仪是不可或缺的重要设备。无论是研究新型材料的电学特性,还是确保产品质量,选择一台可靠的电阻率测试仪至关重要。2025年11月,如果您正在寻找一家信誉好、口碑好、售后好的电阻…

SaaS版MES系统PC端后台特性清单与设计说明

SaaS版MES系统PC端后台特性清单与设计说明pre { white-space: pre !important; word-wrap: normal !important; overflow-x: auto !important; display: block !important; font-family: "Consolas", "…