深入探讨大数据领域数据工程的发展趋势

好的,请看这篇关于大数据领域数据工程发展趋势的深度技术博客。


数据工程的未来图景:从ETL到智能数据网格的演进之路

引言:我们正站在数据洪流的十字路口

想象一下,你是一家大型电商公司的首席数据官。每天,你的系统需要处理数十亿次用户点击、数百万笔交易记录、遍布全球的物流数据,以及实时变化的库存信息。五年前,你的团队可能还在为如何高效运行每日的ETL(提取、转换、加载)作业而绞尽脑汁;今天,你面临的挑战已经转变为如何让业务部门能够实时获取可信的数据洞察,如何让机器学习模型能够无缝访问特征数据,以及如何治理这个日益庞大且复杂的数据生态系统。

这不是未来幻想,而是当下许多数据驱动型组织的真实写照。我们正经历着数据工程的第二次浪潮——从传统的、以批处理为中心的"数据仓库时代",迈向一个更加实时化、民主化、智能化的"数据网格"(Data Mesh)新时代。

在这篇超过万字的深度探讨中,我将带你深入大数据领域数据工程的发展趋势,不仅告诉你发生了什么,更会解释为什么发生以及如何应对。我们将沿着数据工程的演进脉络,从基础概念到前沿实践,从技术架构到组织变革,全方位剖析这个日新月异的领域。

第一部分:基础回顾与范式转变

1.1 数据工程的演进简史

要理解数据工程的未来,我们首先需要了解它的过去。数据工程的发展大致经历了三个主要阶段:

第一阶段:数据库时代(1990年前)

  • 特征:在线事务处理(OLTP)系统主导
  • 焦点:数据一致性、事务完整性
  • 技术:关系型数据库(Oracle, DB2, SQL Server)

第二阶段:数据仓库时代(1990-2010)

  • 特征:企业数据仓库(EDW)和商业智能(BI)兴起
  • 焦点: Extract-Transform-Load(ETL)流程、星型 schema、维度建模
  • 技术:Teradata, Netezza, 早期Hadoop生态

第三阶段:大数据平台时代(2010-2020)

  • 特征:Hadoop生态系统爆发,批处理与流处理并存
  • 焦点:可扩展性、成本效益、多数据类型支持
  • 技术:HDFS, Spark, Hive, Kafka

当前阶段:数据网格与云原生时代(2020至今)

  • 特征:去中心化架构、实时处理、AI/ML集成
  • 焦点:数据产品思维、领域导向、自服务基础设施
  • 技术:云数据平台、实时计算引擎、数据目录

1.2 为什么需要范式转变?

传统的集中式数据架构面临的根本挑战可以用一个简单的比喻来解释:想象一个城市只有一家巨型超市满足所有居民需求。初期这可能高效,但随着城市扩张,会出现以下问题:

  1. 可扩展性瓶颈:所有数据流向一个中心,网络带宽和处理能力成为瓶颈
  2. 领域知识隔离:中央团队难以理解所有业务领域的细微差别
  3. 敏捷性不足:变更需要跨团队协调,流程缓慢
  4. 单点故障:中心平台故障影响全组织数据能力

这些挑战催生了数据网格理念——与其建设"数据超级市场",不如构建"数据城市",每个社区(业务领域)拥有自己的特色商店(数据产品),同时遵循统一的城市规划(全局治理)。

第二部分:核心技术发展趋势

2.1 批流一体化:Lambda架构的演进与替代

传统Lambda架构要求维护两套代码库(批处理和流处理),虽然提供了全面视图,但带来了显著的运维复杂度。新兴的Kappa架构批流一体化引擎正在改变这一局面。

Apache Spark Structured StreamingApache Flink是这一趋势的典型代表。它们提供了完全一致的API用于批处理和流处理,意味着开发者可以用同一套代码处理历史数据和实时数据。

// 使用Spark Structured Streaming进行批流统一处理示例valstaticDF=spark.read.format("json").load("historical-data/")valstreamingDF=spark.readStream.format("kafka").option("...").load()// 同样的操作应用于批处理和流处理valstaticCounts=staticDF.groupBy("device_type").count()valstreamingCounts=streamingDF.groupBy("device_type").count()// 流式处理结果可以与批处理结果无缝结合valcombined=staticCounts.union(streamingCounts)

Flink更进一步,提供了精确一次语义(exactly-once semantics)的状态管理和事件时间(event-time)处理能力,使其能够正确处理乱序事件和延迟数据。

// Flink事件时间处理示例stream.assignTimestampsAndWatermarks(WatermarkStrategy.<Event>forBoundedOutOfOrderness(Duration.ofSeconds(5)).withTimestampAssigner((event,timestamp)->event.getTimestamp())).keyBy(event->event.getKey()).window(TumblingEventTimeWindows.of(Time.minutes(1))).reduce((a,b)->a combine b);

发展趋势:批流界限逐渐模糊,未来我们将看到更多"无感知"的统一处理框架,开发者无需关心数据是批还是流,系统自动优化执行路径。

2.2 云原生数据平台的崛起

云原生不仅仅意味着"在云上运行",而是充分利用云平台的弹性、按需付费和托管服务特性。三大云厂商(AWS, Azure, GCP)都在积极构建自己的云原生数据生态系统。

Snowflake的成功证明了云原生数据仓库的潜力,其核心创新包括:

  • 存储与计算分离:独立扩展,成本优化
  • 原生多租户:安全隔离与资源共享
  • 数据共享:安全便捷的数据交换能力
  • 自动优化:自动聚类、压缩和缓存
-- Snowflake数据共享示例:极简的数据产品交付CREATESHAREproduct_analytics_share;GRANTUSAGEONDATABASEproduct_dbTOSHAREproduct_analytics_share;GRANTUSAGEONSCHEMAproduct_db.analyticsTOSHAREproduct_analytics_share;GRANTSELECTONTABLEproduct_db.analytics.daily_metricsTOSHAREproduct_analytics_share;ALTERSHAREproduct_analytics_shareADDACCOUNTS=consumer_account;

开源替代方案也在迅速发展,如Delta LakeApache IcebergApache Hudi,它们为数据湖提供了数据仓库级的管理能力:

  1. ACID事务:确保并发读写的一致性
  2. 模式演化:安全地添加、重命名和删除列
  3. 时间旅行:查询历史版本数据
  4. 增量处理:高效识别变化数据
# 使用Delta Lake进行模式演化示例fromdelta.tablesimportDeltaTable deltaTable=DeltaTable.forPath(spark,"/path/to/table")# 自动模式合并deltaTable.alias("target").merge(updatesDF.alias("source"),"target.key = source.key").whenMatchedUpdateAll().whenNotMatchedInsertAll().execute()

发展趋势:云原生数据平台将变得更加"无服务器化"(serverless),自动扩展和优化,按实际使用量计费,极大降低运维负担。

2.3 数据可观测性与数据质量

随着数据管道复杂度的增加,单纯监控作业成功与否已经不够。数据可观测性(Data Observability)成为关键能力,它包括:

  1. 新鲜度:数据最新更新时间是否符合预期
  2. 分布:数据值的分布是否正常(异常值检测)
  3. 量级:数据量是否在预期范围内
  4. 模式:数据结构是否发生变化
  5. 血缘:数据如何被转换和消费

现代数据质量工具如Great ExpectationsMonte CarloSoda提供了声明式的数据质量检查:

# Great Expectations数据质量检查示例importgreat_expectationsasge df=ge.read_csv("data.csv")result=df.expect_column_values_to_be_between("age",min_value=0,max_value=120)result=df.expect_column_values_to_be_unique("user_id")result=df.expect_column_values_to_not_be_null("email")# 自动生成数据质量文档df.get_expectation_suite()

发展趋势:AI驱动的异常检测、自动根因分析和自愈合管道将成为下一代数据可观测性平台的核心能力。

2.4 机器学习与数据工程的融合

传统的"数据工程为ML准备数据"模式正在被特征存储(Feature Store)概念所改变。特征存储作为ML和数据工程之间的桥梁,提供:

  1. 特征注册:定义、版本化和描述特征
  2. 特征服务:低延迟提供训练和推理所需特征
  3. 一致性:确保训练和推理使用相同特征计算逻辑
# 使用Feast(特征存储)示例fromfeastimportFeatureStore# 定义特征driver_features=FeatureView(name="driver_activity",entities=["driver_id"],features=[Field(name="trips_today",dtype=Int64),Field(name="rating",dtype=Float32),],source=BigQuerySource(table="feast-oss.drivers_activity"))# 检索特征用于训练store=FeatureStore(repo_path=".")training_df=store.get_historical_features(entity_df=entity_df,feature_refs=["driver_activity:trips_today","driver_activity:rating"]).to_df()# 在线推理获取特征feature_vector=store.get_online_features(feature_refs=["driver_activity:trips_today","driver_activity:rating"],entity_rows=[{"driver_id":1001}]).to_dict()

发展趋势:数据工程和ML工程的边界将进一步模糊,出现更多Data+ML平台,支持从数据准备到模型部署的完整生命周期管理。

第三部分:架构与组织变革趋势

3.1 数据网格:从单体到分布式架构

数据网格(Data Mesh)由ThoughtWorks的Zhamak Dehghani提出,是当前最受关注的数据架构范式转变。其核心原则包括:

1. 领域导向的去中心化所有权
传统 centralized data team 转变为 federated model,各个业务领域团队负责自己的数据产品。

Before (集中式):

[业务团队A] → [集中式数据平台团队] → [数据产品] [业务团队B] → → [数据产品] [业务团队C] → → [数据产品]

After (数据网格):

[业务团队A] → [领域数据产品A] [业务团队B] → [领域数据产品B] [业务团队C] → [领域数据产品C] ↓ [自服务数据平台]

2. 数据作为产品
每个数据源都应被视为一个产品,有明确的:

  • SLA(服务级别协议)
  • 文档和元数据
  • 支持机制
  • 版本管理

3. 自服务数据基础设施
提供标准化、易用的平台能力,让领域团队能够自主构建数据产品,包括:

  • 存储和计算资源调配
  • 流水线开发工具
  • 监控和可观测性
  • 治理和合规框架

4. 联合计算治理
全局策略和标准由跨领域治理委员会制定,但执行分散到各领域团队。

实施挑战:数据网格需要显著的组织文化变革和技术架构调整,不是所有组织都适合立即采用。通常建议从个别试点领域开始,逐步扩展。

3.2 DataOps:数据工程的敏捷实践

DataOps将DevOps理念应用于数据管道开发,强调:

  1. 自动化测试:数据质量检查、模式验证
  2. 持续集成/持续部署:自动化部署数据管道
  3. 环境管理:开发、测试、生产环境隔离与同步
  4. 监控与告警:实时监控管道健康状态
# 数据管道CI/CD配置示例 (使用dbt + GitHub Actions)name:dbt Pipelineon:push:branches:[main]pull_request:branches:[main]jobs:dbt-test:runs-on:ubuntu-lateststeps:-uses:actions/checkout@v2-name:Set up Pythonuses:actions/setup-python@v2with:python-version:'3.8'-name:Install dbtrun:pip install dbt-name:Run dbt testsrun:dbt testenv:DBT_HOST:${{secrets.DBT_HOST}}DBT_USER:${{secrets.DBT_USER}}DBT_PASSWORD:${{secrets.DBT_PASSWORD}}

发展趋势:DataOps工具链将更加成熟和标准化,出现更多专为数据工程设计的CI/CD平台。

3.3 数据治理的现代化

传统数据治理往往侧重于控制和限制,现代数据治理更强调Enablement(使能)而非Prevention(阻止)。关键转变包括:

  1. 策略即代码:使用代码定义和管理治理策略
  2. 自动化合规:自动扫描敏感数据并应用策略
  3. 元数据驱动:基于丰富元数据实现智能治理
  4. 隐私工程:内置隐私保护设计(Privacy by Design)
-- 使用BigQuery数据治理功能示例-- 自动数据分类和标记CREATETABLEsales.customer_dataASSELECT*EXCEPT(ssn,credit_card)FROMraw.customer_data;-- 列级权限控制GRANT`roles/bigquery.dataViewer`ONTABLEsales.customer_dataTO"group:sales-team@company.com";-- 数据掩码策略CREATEMASKING POLICY email_maskAS(email STRING)RETURNSSTRING->CASEWHENSESSION_USER()IN('admin@company.com')THENemailELSEREGEXP_REPLACE(email,r'^(.{3}).*@(.*)$',r'\1***@\2')END;

发展趋势:AI驱动的主动式治理,自动识别风险和建议优化措施,使治理从负担变为竞争优势。

第四部分:新兴技术与未来展望

4.1 实时数据处理的演进

实时数据处理正在从"尽可能快"向"智能实时"发展:

1. 复杂事件处理(CEP)
识别数据流中的模式和有意义的复杂事件,而不仅仅是简单聚合。

-- 使用Flink CEP检测复杂模式Pattern<LoginEvent,?>pattern=Pattern.<LoginEvent>begin("first").where(new SimpleCondition<LoginEvent>(){@Overridepublicbooleanfilter(LoginEventvalue){returnvalue.getResult().equals("failure");} }).next("second").where(new SimpleCondition<LoginEvent>(){@Overridepublicbooleanfilter(LoginEventvalue){returnvalue.getResult().equals("failure");} }).next("third").where(new SimpleCondition<LoginEvent>(){@Overridepublicbooleanfilter(LoginEventvalue){returnvalue.getResult().equals("failure");} }).within(Time.minutes(5));

2. 流式机器学习
模型在数据流上直接进行训练和预测,适应快速变化的环境。

# 使用River进行流式ML示例fromriverimportlinear_model,optim,preprocessing,metricsfromriverimportstream model=preprocessing.StandardScaler()|linear_model.LogisticRegression()metric=metrics.Accuracy()forxi,yiinstream.iter_csv('dataset.csv'):yi_pred=model.predict_one(xi)# 预测model.learn_one(xi,yi)# 在线学习metric.update(yi,yi_pred)# 更新评估指标

发展趋势:实时处理能力将变得更加智能和情境感知,能够自动适应数据特征和业务需求。

4.2 数据共享与协作生态

数据孤岛问题正在通过新技术得到解决:

1. 数据编织(Data Fabric)
通过元数据驱动的智能层,提供统一的数据访问、发现和治理,无论数据物理位置在哪里。

2. 开放数据格式与标准
Apache Arrow提供内存中数据的跨语言标准,极大提高了系统间数据交换效率。

# 使用Apache Arrow进行高效数据交换importpyarrowaspaimportpandasaspd# Pandas到Arrow的高效转换df=pd.DataFrame({'col1':[1,2],'col2':[3.0,4.0]})table=pa.Table.from_pandas(df)# 零拷贝共享给其他进程或语言sink=pa.BufferOutputStream()withpa.RecordBatchStreamWriter(sink,table.schema)aswriter:writer.write_table(table)buf=sink.getvalue()# 其他进程可以直接读取,无需反序列化reader=pa.RecordBatchStreamReader(buf)table_from_buf=reader.read_all()

3. 数据市场(Data Marketplace)
内部和外部数据产品的交易和协作平台,如AWS Data ExchangeSnowflake Data Marketplace

发展趋势:数据生态系统将从封闭走向开放,形成更加动态和协作的数据经济。

4.3 可持续数据工程

随着数据规模的持续增长,能耗和环境影响成为不可忽视的问题:

  1. 查询优化:更智能的查询规划和执行,减少不必要的计算
  2. 数据生命周期管理:自动将冷数据转移到更节能的存储层级
  3. 硬件感知优化:利用硬件特性(如GPU、新型存储)提高能效
  4. 碳足迹跟踪:监控和报告数据操作的碳排放
-- BigQuery自动优化示例:分区和聚类CREATETABLEsales.transactionsPARTITIONBYDATE(transaction_time)CLUSTERBYcustomer_id,product_categoryASSELECT*FROMraw.transactions;-- 自动智能调度CREATEMATERIALIZEDVIEWsales.daily_summariesPARTITIONBYDATE(summary_date)CLUSTERBYregionASSELECTDATE(transaction_time)ASsummary_date,region,COUNT(*)AStransaction_count,SUM(amount)AStotal_amountFROMsales.transactionsGROUPBY1,2;

发展趋势:绿色数据工程将成为重要考量,碳效率与成本效率同等重要。

第五部分:实践指南与建议

5.1 评估当前数据成熟度

在拥抱新趋势前,建议组织先评估自身的数据成熟度:

  1. Level 1:分散探索(数据孤岛,手工流程)
  2. Level 2:集中整合(数据仓库/湖,基础ETL)
  3. Level 3:规模优化(云平台,自动化管道)
  4. Level 4:能力民主化(自服务,数据产品)
  5. Level 5:智能驱动(AI/ML集成,预测性洞察)

大多数组织处于2-3级,目标是逐步向4-5级演进,而非跳跃式发展。

5.2 采用新技术的策略建议

  1. 以用例驱动:选择具体业务问题应用新技术,而非为技术而技术
  2. 渐进式演进:通过Strangler模式逐步替换旧系统,而非Big Bang重写
  3. 技能投资:投资团队技能发展,特别是云原生和实时处理技术
  4. 治理先行:建立适当的治理框架,避免去中心化带来的混乱

5.3 团队结构与文化变革

技术变革需要相应的组织变革:

  1. 从集中式到联邦式:建立领域数据产品团队+中心平台团队的混合模式
  2. 数据产品经理角色:新兴角色,负责数据产品的规划和生命周期
  3. 数据工程师技能扩展:需要掌握软件工程最佳实践和领域知识
  4. 度量与激励:调整KPI,奖励数据质量、可用性和业务影响,而非仅仅作业成功率

结论:构建面向未来的数据能力

数据工程正在经历其历史上最深刻的变革时期。从技术角度看,我们正在从批处理主导转向批流融合,从本地部署转向云原生,从手工运维转向DataOps自动化。从架构角度看,集中式数据平台正在向去中心化的数据网格演进。从组织角度看,数据正在从IT资产转变为业务产品,数据团队从成本中心转变为价值创造中心。

这些变化并非相互孤立,而是共同构成了现代数据栈(Modern Data Stack)的完整图景。成功的组织不会盲目追逐每一个新趋势,而是会基于自身业务需求、组织文化和现有基础,选择性地采用和发展适合自己的数据能力。

未来属于那些能够将数据技术架构理念组织能力有机结合的组织。它们能够将数据转化为洞察,将洞察转化为行动,将行动转化为价值——这才是数据工程的终极目标。

正如软件工程在过去二十年经历了从瀑布到敏捷到DevOps的演进,数据工程正在经历类似的成熟化过程。对于那些愿意投资于这一转型的组织来说,回报将是巨大的:更快的洞察速度、更低的运营成本、更高的数据质量,以及最终——更强的竞争优势。


延伸阅读与资源

  1. 《Data Mesh: Delivering Data-Driven Value at Scale》- Zhamak Dehghani
  2. 《Fundamentals of Data Engineering》- Joe Reis & Matt Housley
  3. Apache项目文档:Spark, Flink, Kafka, Iceberg, Hudi
  4. 云厂商白皮书:AWS Data Lake Formation, Azure Synapse, Google BigQuery

实践建议:从一个小而重要的用例开始实验新技术,测量业务价值,迭代学习,然后逐步扩展。记住,最好的架构是能够演进

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/1184700.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

【技术收藏】风控系统的革命:大模型如何让审核员和初级算法工程师失业?

文章分享了风控系统中使用大模型替代人工审核的经验&#xff0c;发现大模型能在100-200ms内高效完成风险文本标注&#xff0c;通过优化prompt即可解决问题&#xff0c;极大简化了原有流程。这种"发现问题->修改prompt->上线"的模式使审核员和初级算法工程师面临…

自己写一个分布式定时任务框架+负载均衡+OpenAPI异步调用!

项目背景目前的定时任务框架已经很成熟&#xff0c;从QuartZ到xxl-job&#xff0c;再到近几年出现的PowerJob&#xff0c;既然有这么多的好的实现&#xff0c;为什么还是选择重写一个定时任务框架呢&#xff1f;开发中遇到这样的场景&#xff0c;业务层面需要频繁的创建修改定时…

(TETCI 2024) 从 U-Net 到 Transformer:即插即用注意力模块解析

小伙伴们好&#xff0c;我是小嬛。专注于人工智能、计算机视觉领域相关分享研究。【目标检测、图像分类、图像分割、目标跟踪等项目都可做&#xff0c;相关领域论文辅导也可以找我&#xff1b;需要的可联系&#xff08;备注来意&#xff09;】-------正文开始--------论文题目&…

如何加快 SQL 查询速度的同时保持 SQL 的简洁性?

在本文中&#xff0c;我们将讨论如何提高SQL查询速度的同时&#xff0c;还能保持SQL语句的简洁。在进入主题之前&#xff0c;我们先了解一下查询的实际处理过程&#xff1a;1. 查询处理过程查询处理过程被定义为通过一系列从数据库中提取数据的过程。这涉及将SQL语句的转换为数…

MyBatis-Flex来了!完爆MyBatis-Plus?

Mybatis-Flex 是一个优雅的 Mybatis 增强框架&#xff0c;它非常轻量、同时拥有极高的性能与灵活性。我们可以轻松的使用 Mybaits-Flex 链接任何数据库&#xff0c;其内置的 QueryWrapper^亮点 帮助我们极大的减少了 SQL 编写的工作的同时&#xff0c;减少出错的可能性。总而言…

25年的关键词:失业、工伤、外包、投资回血……

引言 「2025」 年就这么稀里糊涂的过去咯, 前不久正巧听到播客不禁感慨, 于世界而言「2025」这一年属实精彩: 年初的 Deepseek、宇树机器人爆火特朗普上台后各种折腾, 关税战一度引起全球股市暴跌, 而最后又好像啥也没发生一样后面泡泡马特爆火、小红书出圈...之后又有雷军塌…

即插即用系列 | CVPR 2025 CATANet:一种用于轻量级图像超分辨率的高效内容感知 Token 聚合网络

论文题目&#xff1a;CATANet: Efficient Content-Aware Token Aggregation for Lightweight Image Super-Resolution 论文原文 (Paper)&#xff1a;https://arxiv.org/abs/2503.06896 官方代码 (Code)&#xff1a;https://github.com/EquationWalker/CATANet GitHub 仓库链接&…

牛掰,MySQL 8.2 支持读写分离了!

MySQL InnoDB ReplicaSet启动 MySQL Router 8.2结论我们一直在等待的 MySQL 读/写分离功能 现在终于可以使用了&#xff01;在规模上&#xff0c;我们在副本之间分配读取&#xff0c;但这必须在应用程序中以某种方式进行管理&#xff1a;指向在某个地方写入并在其他地方读取。在…

【PFJSP问题】自适应双种群协同鸡群算法ADPCCSO求解置换流水车间调度问题PFSP【含Matlab源码 14995期】

&#x1f4a5;&#x1f4a5;&#x1f4a5;&#x1f4a5;&#x1f4a5;&#x1f4a5;&#x1f4a5;&#x1f4a5;&#x1f49e;&#x1f49e;&#x1f49e;&#x1f49e;&#x1f49e;&#x1f49e;&#x1f49e;&#x1f49e;&#x1f49e;Matlab武动乾坤博客之家&#x1f49e;…

洛谷 P3746 [六省联考 2017] 组合数问题

题目链接 题目求 \(\displaystyle \sum _ {i = 0} [x ^ {ik + r}] (1 + x) ^ {nk}\),定义多项式的循环卷积为两个多项式相乘后,把所有 \(x ^ i\) 的项合并到 \(x ^ {i \bmod k}\)。快速幂加速即可。 时间复杂度 \(\t…

公司弃用 Nginx,选择这款工具!

Cloudflare 公司宣布弃用 nginx&#xff0c;转用自研的新一代方向代理服务 Pingora&#xff0c;并号称比nginx更快、更高效、更安全&#xff0c;下面通过 Cloudfare 官方网站的一篇文章来了解下 Pingora 比 Nginx 强在哪里&#xff1f;简介今天&#xff0c;我们很高兴有机会在此…

【DPFSP问题】自适应双种群协同鸡群算法ADPCCSO求解分布式置换流水车间调度DPFSP【含Matlab源码 14996期】

&#x1f4a5;&#x1f4a5;&#x1f4a5;&#x1f4a5;&#x1f4a5;&#x1f4a5;&#x1f4a5;&#x1f4a5;&#x1f49e;&#x1f49e;&#x1f49e;&#x1f49e;&#x1f49e;&#x1f49e;&#x1f49e;&#x1f49e;&#x1f49e;Matlab武动乾坤博客之家&#x1f49e;…

洛谷 P3747 [六省联考 2017] 相逢是问候

题目链接 欧拉降幂最多只会迭代到第 \(k = \text O (\log p)\) 次模数就会变成 \(1\)(证明见这里)。故一个数被操作超过 \(k\) 次就会变为一个定值。 于是用线段树维护出操作还没有满 \(k\) 次的位置,每次暴力修改并…

Gemini 336L - 调试记录(Ubuntu 24.04)

按照Readme安装ROS2 SDK:https://github.com/orbbec/OrbbecSDK_ROS2/tree/v2-main开启ROS2自动补全:eval "$(register-python-argcomplete ros2)" eval "$(register-python-argcomplete colcon)"…

电缆敷设施工机械-哪个品牌的电缆输送机好用

哪个品牌的电缆输送机好用&#xff1f;在电力、通信等基建工程中&#xff0c;电缆输送机的品牌选择&#xff0c;远不止于比较单一参数。这本质上是对设备背后技术可靠性、工程适配性与长期服务价值的综合考量。一个优秀的品牌&#xff0c;意味着其产品能深度融入多样化的施工场…

深入解析:从C++开始的编程生活(16)——继承

pre { white-space: pre !important; word-wrap: normal !important; overflow-x: auto !important; display: block !important; font-family: "Consolas", "Monaco", "Courier New", …

13.6B参数铸就“世界模型”,美团LongCat-Video搭建5分钟原生视频生成,定义AI视频新标杆

13.6B参数铸就“世界模型”,美团LongCat-Video搭建5分钟原生视频生成,定义AI视频新标杆pre { white-space: pre !important; word-wrap: normal !important; overflow-x: auto !important; display: block !importan…

NodeJS生产环境发布流程

NodeJS生产环境发布流程1、创建宝塔的容器时,先把命令设置为sleep infinity,使用npm将依赖安装完后再改为node /app/server.js2,如果.env不生效,则直接在容器的环境变量里设置3、容器数据库里的端口应该设置为3306…

怎样免费在线把 HEIC 转为 JPG?无需安装软件,也不用上传照片

如果你用 iPhone 拍照,可能已经注意到一个新格式:HEIC。它画质高、文件小,而且在苹果设备上支持良好。但在日常使用中,你可能会遇到不少麻烦。1️⃣ HEIC 的最大问题:兼容性不足 虽然 HEIC 技术先进,但在非苹果环…

2026年趋势全景图:AI重塑技术与翻译行业,这些变化你必须知道!

哈喽,大家好!2026年已至,最近不少机构都发布了年度趋势报告——从IBM聚焦的企业战略,到CSA Research关注的翻译行业,再到BOL News、CSDN拆解的技术革新,每一份报告都在告诉我们:这一年,“不确定性”会是常态,但“机遇”也藏在每一个变革节点里。 今天这篇博客,我就整…