精选案例展 | 智己汽车—全栈可观测驱动智能化运营与成本优化

本案例为“观测先锋 · 2024 可观测平台创新应用案例大赛”精选案例,同时荣获IT168“2024技术卓越奖评选-年度创新解决方案”奖。

图片

项目背景

近年来,中国汽车行业进入转型升级阶段,智能网联技术成为行业发展的核心。车联网、自动驾驶等技术的加速研发与应用,推动电动化、智能化、网联化和共享化“四大趋势”不断发展。中国在新能源汽车领域持续保持全球领先地位,2020年发布的《智能汽车创新发展战略》明确提出,到2025年,中国将实现有条件自动驾驶智能汽车的规模化生产,并推动高度自动驾驶技术在特定环境下的市场化应用,基于此,国内车企通过云计算、容器化、微服务等技术加速数字化转型,推动智能化、网联化与服务化的深度融合。然而,数字化转型也带来系统稳定性、性能瓶颈和潜在风险,车企需在激烈的市场竞争中提升技术水平,以抓住技术变革的机遇,实现可持续发展。

在这一宏观背景下,智己汽车在2024年度实现了非凡的跃升。全年销量攀升至6.55万辆,同时对于核心技术研发的投入亦呈现出强劲的增长态势。智己始终把核心技术创新作为战略重点,持续优化其云架构,整合云资源种类70+、各类线路30+及系统数量1000+,极大提升了平台的可扩展性与稳定性。

图片

可观测性建设过程中的难点及挑战

1. 在智己汽车的混合云环境建设中,运维难度显著增加。由于云平台的异构性,智己汽车产品架构需要支持复杂的多云场景,确保不同云资源之间的高效协同。如何实现跨云平台的可观测性,确保系统稳定性和快速定位问题成为核心挑战。此外,混合云环境下的成本管控也变得更加复杂,智己汽车需要在不同云服务商之间优化资源使用,避免非必要开支。安全合规性方面,数据加密、访问控制和合规性要求也必须严格保障。综合来看,智己汽车面临着混合云环境下运维、监控、安全与成本管控等多重挑战。

图片

2. 可观测性能力建设缺乏统一的认知和建设方式。尽管可观测性概念在云原生时代快速发展,但许多企业对其理解仍停留在传统监控手段上,对可观测性的内涵及应用场景缺乏全面了解。此前,智己汽车在可观测性建设方面的应用和实践仍处于初步阶段,缺乏统一的认知和清晰的建设路径。这导致在可观测性技术落地和最佳实施上存在一定不足。

3. 复杂业务系统故障排查困难,影响客户体验。智己汽车业务涵盖零部件和整车的研发、制造、销售、以及汽车服务与贸易等,业务之间盘根错杂,支撑系统繁多。一旦IT系统或该系统所在链路出现故障,通过各平台和应用访问产品的客户会第一时间收到相关报错信息。传统IT接到业务故障投诉后,需要对各种关联系统的网络、应用、数据库、主机进行逐一排查,极大地影响客户访问体验,对业务造成严重影响。

应用场景

1. 基础设施统一纳管—多云单平台。Bonree ONE一体化智能可观测平台赋能智己汽车实现业务请求的全链路追踪与性能分析,打造统一化多云管理平台,实现了对异构云资源的集中管理,同时审查不同的云基础架构中的多个应用,帮助企业快速识别和定位应用故障,提高排障效率,赋能智己汽车优化云服务表现。

图片

图片

2. 基础设施统一纳管—自动化运维。Bonree ONE平台为用户提供了端到端的可观测性,覆盖整个堆栈的自动化管理。通过实现从应用部署、更新、配置和管理,到数据采集监控、服务生命周期管理和故障诊断的全流程自动化,极大地提升了IT运维效率,确保基础设施的统一纳管和高效运维。

3. 多深度拓扑及监控。智己汽车通过Bonree ONE实现了多深度拓扑和监控,全面记录了请求从接收到处理完成整个生命周期内的调用链路。例如,在接口优化方面,通过平台实时监控请求链路,成功发现app前端OTA查询接口超时问题,定位到数据库连接数不足,并通过接口代码优化解决;在压测并发场景下,Bonree ONE帮助团队定位到大数据服务数据库中的SQL执行延迟,提出限流优化方案;在根因分析方面,平台帮助解决B端查询响应超时问题,避免了循环调用,并在TO C业务中准确定位前端报错的根因,识别为人车绑定关系错误并提供解决方案。

图片

项目成果与收益

1. 实现了云资源管理从“一次性采购”向“持续运营”的转变。智己汽车成功应用Bonree ONE一体化智能可观测平台,并通过FinOps实现了云资源管理的转型,实现从“一次性采购”到“持续运营”的转变,推动了技术、业务和财务的深度协同。凭借Bonree ONE强大的数据处理能力及多维度的可观测能力,智己汽车实现了精准的云成本优化,能够有效预测和控制未来成本,确保云资源的高效使用和财务透明度。同时,智己汽车实现了事中监控与异常可视化,能够实时跟踪云资源使用情况并及时识别潜在问题,助力智己汽车践行“持续运营”,优化组织、文化、流程和自动化,实现了全面的资源优化与业务增长的可持续平衡。

图片

2. 云平台基础资源成本节约30%。通过应用Bonree ONE一体化智能可观测平台,智己汽车实现了云平台基础资源成本节约30%。平台通过运行成本的可视化,提供用量、预测趋势分析,并通过维度分类对成本浪费进行精准识别和展示,助力智己汽车实现了资源优化及弹性预测与定时弹性能力优化,进一步提升了资源配置效率,确保了灵活计费方案的实施,全面提升成本控制能力。

3. 提升混合云管平台资源的管理与优化能力。智己汽车通过Bonree ONE一体化智能可观测平台,提升了混合云管平台资源的管理与优化能力。Bonree ONE支持统一自动化编排、可视化监控、资源管理和告警功能,实时跟踪云资源使用情况,快速响应潜在问题。同时,助力混合云管平台通过费用管理、成本分析、实时费用追踪等,精确优化云成本。Bonree ONE适配多云环境、提升业务敏捷性等优势,显著增强了整体治理能力。

图片

4. 故障感知和根因定位时间缩短80%。接入Bonree ONE一体化智能可观测平台后,运维和业务同事能够在接到报障单后迅速查看故障时间段的会话记录,迅速定位为前端问题。进一步通过下钻链路和服务指标,精准识别后端执行异常步骤,并与后端同事共享详细链路信息。后端同事通过绑定的指标视图,直观看到报错链路调用信息、服务指标和数据库慢查询。最终,团队迅速确认问题并给出解决方案,故障排查时间从原本的120分钟缩短至20分钟,大幅提升了问题定位效率和响应速度。

图片

总   结

在多云环境下,智己汽车实现了从“云资源管理”到“持续运营“的全面转型,显著升了云资源的使用效率、成本控制能力以及故障排查速度。智己汽车通过精确的成本优化与自动化运维,在保障系统稳定性的同时,进一步提升了其整体运营效率与可持续发展能力,为推动智能化、网联化与服务化的深度融合打下了坚实的基础。未来,智己汽车将在可观测性与云资源优化的基础上,不断深耕技术创新之路,持续提升自身在全球智能汽车领域竞争力,引领未来出行的智能革命。

企业介绍

智己汽车是由上汽集团、浦东新区、阿里巴巴集团三方联合打造的高端智能纯电汽车品牌。通过人工智能、大数据让用户成为汽车价值链的核心驱动,打破用户与企业的边界,从底层打通整车与驾乘体验高度相关的ECU控制器,将客户场景和汽车感知充分融合,鼓励用户进行高度自定义,实现汽车智能化宽度和深度的全新突破。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/bicheng/71897.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

速通HTML

目录 HTML基础 1.快捷键 2.标签 HTML进阶 1.列表 a.无序列表 b.有序列表 c.定义列表 2.表格 a.内容 b.合并单元格 3.表单 a.input标签 b.单选框 c.上传文件 4.下拉菜单 5.文本域标签 6.label标签 7.按钮标签 8.无语义的布局标签div与span 9.字符实体 HTML…

【Python模块】——pymysql

pymysql是python操作mysql的标准库,可以通过pip install快速导入pymysql包操作数据库 使用pymysql操作mysql 简单demo import pymysql connect pymysql.connect(host"localhost",port3306,user"root",password"root",database&quo…

IP离线库助力破解网络反诈难题

毫秒级响应识别异常访问 IP离线库集成全球全量IP地址的详细信息,包括地理地址查询、运营商、经纬度、代理识别等多种维度数据。例如: 当用户账号频繁从北京、越南等多地IP登录时,系统将自动触发风险预警; 检测到访问IP为已知机…

lattice hdl实现spi接口

在lattice工具链中实现SPI接口通常涉及以下步骤: 定义硬件SPI接口的管脚。配置SPI时钟和模式。编写SPI主机或从机的控制逻辑。 展示了如何在Lattice工具链中使用HDL语言(例如Verilog)来配置SPI接口: lattice工程 顶层:spi_slave_top.v `timescale 1ns/ 1ps module spi_…

Spring 循环依赖解析与解决方案

文章目录 1. 什么是循环依赖?1.1 概念解析1.2 示例代码 2. 循环依赖的类型2.1 构造器循环依赖(不可解决 ❌)2.2 Setter 方式或 Autowired 方式的循环依赖(可解决 ✅) 3. 解决循环依赖的方式3.1 方式一:使用…

Cesium@1.126.0,创建3D瓦片,修改样式

第一步:添加3D建筑 Cesium.createOsmBuildingsAsync()这是一个异步方法,所以要写在一个异步函数里 创建一个函数 const create3DBuilding async (viewer) > {try {// 添加3D建筑const tileset await Cesium.createOsmBuildingsAsync();viewer.scen…

力扣-贪心-1005 k次取反后最大化的数组和

思路 找到绝对值最大的,然后如果是负数就变成正的,所有数遍历完之后,有两种情况,一种是k已经为0了,不需要再取反了,一种是所有数都为正数,k不为0,此时对绝对值最小的数操作即可 代…

vue2项目打包后js文件过大, 首次加载缓慢

vue2项目打包后js文件过大, 首次加载缓慢 安装插件 npm i compression-webpack-plugin6.1.1 -D配置vue.config.js const CompressionWebpackPlugin require(compression-webpack-plugin)module.exports {configureWebpack: {plugins:[new CompressionWebpackPlugin({filen…

高级SQL技术在Python项目中的应用:ORM与深度性能优化

引言 在现代Python项目开发中,数据库交互远不止是数据的简单存取,它已成为构建高性能、可维护应用的核心瓶颈和关键能力所在。 仅仅依赖基础SQL查询,虽然入门简单,却难以应对日益增长的应用挑战。这些挑战主要体现在以下几个方面: 性能瓶颈: 数据量剧增: 从百万到数十亿乃…

基于 C++ Qt 的 Fluent Design 组件库 QFluentWidgets

简介 QFluentWidgets 是一个基于 Qt 的 Fluent Designer 组件库,内置超过 150 个开箱即用的 Fluent Designer 组件,支持亮暗主题无缝切换和自定义主题色。 编译示例 以 Qt5 为例(Qt6 也支持),将 libQFluentWidgets.d…

抖音视频如何下载保存去水印

随着短视频平台的兴起,抖音作为国内最受欢迎的短视频平台之一,吸引了大量用户上传和观看各种创意视频。许多用户在浏览抖音视频时,往往会想要保存一些有趣或精彩的视频片段,但抖音视频通常会有水印,影响观看体验。为了…

React 源码揭秘 | 更新队列

前面几篇遇到updateQueue的时候,我们把它先简单的当成了一个队列处理,这篇我们来详细讨论一下这个更新队列。 有关updateQueue中的部分,可以见源码 UpdateQueue实现 Update对象 我们先来看一下UpdateQueue中的内容,Update对象&…

[SQL] 事务的四大特性(ACID)

🎄事务的四大特性 以下就是事务的四大特性,简称ACID。 原子性📢事务时不可分割的最小操作单元,要么全部成功,要么全部失败。一致性📢事务完成后,必须使所有的数据都保持一致隔离性&#x1f4e2…

DeepSeek 提示词:基础结构

🧑 博主简介:CSDN博客专家,历代文学网(PC端可以访问:https://literature.sinhy.com/#/?__c1000,移动端可微信小程序搜索“历代文学”)总架构师,15年工作经验,精通Java编…

如何使用 Python 连接 MySQL 数据库?

在Python开发中,连接MySQL数据库是一个常见的需求。 我们可以使用多种库来实现这一功能,其中最常用的是mysql-connector-python和PyMySQL。 下面我将详细介绍如何使用这两个库来连接MySQL数据库,并提供一些实际开发中的建议和注意事项。 1…

Apache DolphinScheduler系列1-单节点部署及测试报告

文章目录 整体说明一、部署环境二、版本号三、部署方案四、部署步骤4.1、上传部署包4.2、创建外部数据库4.3、修改元数据库配置4.4、上传MySQLl驱动程序4.5、初始化外部数据库4.6、启停服务4.7、访问页面五、常见问题及解决方式5.1、时间不一致5.2、异常终止5.3、大量日志5.4、…

LLM之论文阅读——Context Size对RAG的影响

前言 RAG 系统已经在多个行业中得到广泛应用,尤其是在企业内部文档查询等场景中。尽管 RAG 系统的应用日益广泛,关于其最佳配置的研究却相对缺乏,特别是在上下文大小、基础 LLM 选择以及检索方法等方面。 论文原文: On the Influence of Co…

人工智能(AI):科技新纪元的领航者

摘要 人工智能(AI)作为当今科技领域最具变革性的力量之一,正以惊人的速度重塑着我们的世界。本文旨在全面且专业地介绍人工智能,涵盖其定义、发展历程、关键技术、应用领域、面临的挑战以及未来展望等方面,以期为读者…

如何防止 Docker 注入了恶意脚本

根据您的描述,攻击者通过 CentOS 7 系统中的 Docker 注入了恶意脚本,导致自动启动名为 “masscan” 和 “x86botnigletjsw” 的进程。这些进程可能用于网络扫描或其他恶意活动。为了解决这一问题,建议您采取以下步骤: 1. 停止并删…

LLaMA-Factory|微调大语言模型初探索(4),64G显存微调13b模型

上篇文章记录了使用lora微调deepseek-7b,微调成功,但是微调llama3-8b显存爆炸,这次尝试使用qlora微调HQQ方式量化,微调更大参数体量的大语言模型,记录下来微调过程,仅供参考。 对过程不感兴趣的兄弟们可以直…