【飞腾平台实时Linux方案系列】第十七篇 - 飞腾平台实时Linux系统备份与灾难恢复。

一、简介:备份不是“可选项”,是工业现场“硬指标”

  • 飞腾芯片(FT-1500A/FT-2000/FT-D2000)已批量应用于能源、矿山、轨道交通等关键领域,系统一旦宕机:

    • 变电站控制中断 → 区域停电,损失千万;

    • 矿井提升机失控 → 人身安全风险;

    • 地铁信号系统离线 → 列车紧急制动,晚点 30 min+。

  • 国产化 + PREEMPT_RT带来微秒级实时性,但“硬件冗余”不等于“系统冗余”——逻辑层备份缺失仍是现场最大痛点。

  • 掌握“飞腾平台实时 Linux 备份与灾难恢复” =90 min 内原地重建系统,保障业务连续性,满足《工业控制系统信息安全》GB/T 33009 要求。


二、核心概念:6 个关键词先搞懂

关键词一句话说明飞腾平台特殊点
全量镜像整个系统分区逐字节复制需兼容 ARM64 引导(UEFI+GRUB)
增量快照基于初始镜像,仅保存变化块推荐 btrfs/zstd,压缩比 2:1
PREEMPT_RT实时补丁内核,中断线程化备份时需保留实时内核与模块
国产可信固件飞腾 UEFI 2.5,支持可信启动备份必须包含 /boot/efi 与 EFI变量
灾难恢复时间 RTO系统故障 → 业务恢复 最大容忍时间矿山场景要求 RTO ≤ 90 min
恢复点目标 RPO允许丢失的数据时间窗控制指令 RPO ≤ 5 min

三、环境准备:30 分钟搭好“备份实验室”

1. 硬件

  • 飞腾 FT-2000 4 核工业主板 × 2(节点 A/B)

  • 256 GB 国产 SSD(长江存储)(系统盘)

  • 1 TB 移动硬盘 ×1(灾备介质,可插拔)

  • 千兆以太网交换机 ×1(网络备份通道)

2. 软件

组件版本安装命令
实时内核linux-5.15-rt53飞腾原厂 deb 包
备份工具fsarchiver 0.8.7apt install fsarchiver
快照工具btrfs-progs 5.16已内置
网络同步rsync 3.2.3已内置
脚本模板bash 5.0+本文提供

3. 一键装 btrfs 与实时内核(可复制)

#!/bin/bash # setup_btrfs.sh sudo apt update sudo apt install -y btrfs-progs fsarchiver # 将第二块 SSD 格式化为 btrfs,用于快照 sudo mkfs.btrfs -L BTRFS_SNAP /dev/nvme1n1 sudo mkdir /mnt/snap sudo mount /dev/nvme1n1 /mnt/snap

四、应用场景(300 字):矿井提升机控制柜

山西某煤矿立井提升机额定载荷 25 吨,PLC 主控器采用飞腾 FT-2000 + PREEMPT_RT 内核,运行提升曲线算法(周期 1 ms)。现场粉尘、潮湿、24 h 连续运行,曾出现 SSD 坏块导致系统无法启动,人工下井抢修耗时 4 h,影响提煤 6000 吨。
按本文方案部署“本地快照 + 网络镜像”双保险:

  1. 每 30 min 自动生成分区快照,RPO=30 min;

  2. 每日夜班将全量镜像同步到地面机房,RTO=60 min;

  3. 故障时插入移动硬盘 → 一键恢复 → 系统重新上线,抢修时间缩短至 45 min,满足矿山安全规程停产不超过 2 h 要求,直接避免一次重大停产损失。


五、实际案例与步骤:从“0”到“可恢复”全流程

实验目录统一:~/backup-lab,所有脚本可一键运行。


5.1 全量镜像:fsarchiver 整盘克隆

#!/bin/bash # full_backup.sh DATE=$(date +%F_%H-%M) SNAP_DIR="/mnt/snap/full" mkdir -p $SNAP_DIR # 保存分区表 + UEFI 固件变量 sudo sfdisk -d /dev/nvme0n1 > $SNAP_DIR/pt.txt sudo efibootmgr -v > $SNAP_DIR/efi.txt # 逐分区存档(-z8 = zstd 压缩级别 8) sudo fsarchiver savefs $SNAP_DIR/root.fsa /dev/nvme0n1p2 \ -A "FT2000_RT_DEMO" -z8 -j4 sudo fsarchiver savefs $SNAP_DIR/boot.fsa /dev/nvme0n1p1 -z8 echo "Full backup done: $SNAP_DIR"

使用场景

  • 首次部署、版本发布前生成“基线”,故障时可直接还原。


5.2 增量快照:btrfs 每 30 min 自动快照

#!/bin/bash # snap_create.sh MOUNT="/" SNAPDIR="/mnt/snap/incr" mkdir -p $SNAPDIR # 创建可写快照(-r 只读,-w 可写用于演练) sudo btrfs subvolume snapshot -r $MOUNT $SNAPDIR/snap_$(date +%s) # 保留最近 48 份,超量删除最旧 ls -t $SNAPDIR | tail -n +49 | xargs -r sudo rm -rf

加入 cron:

echo "*/30 * * * * /home/ftuser/backup-lab/snap_create.sh" | sudo tee -a /var/spool/cron/crontabs/root

5.3 网络镜像:rsync 每日推送到灾备机

#!/bin/bash # net_sync.sh REMOTE="backup@192.168.10.100::ft_backup" # 排除运行时文件 rsync -avz --delete --exclude='/tmp' --exclude='/var/log' \ /mnt/snap/ $REMOTE/$(date +%F)

灾备机需安装rsyncd并配置模块:

# /etc/rsyncd.conf [ft_backup] path = /data/ft_backup read only = no auth users = backup secrets file = /etc/rsyncd.secrets

5.4 一键恢复:USB 启动盘 60 min 重建系统

  1. 制作飞腾 UEFI 启动盘(Ubuntu Live RT)

  2. 插入移动硬盘,启动进入 Live 系统

  3. 执行恢复脚本:

#!/bin/bash # restore.sh DISK="/dev/nvme0n1" FSARCHIVER="/usr/sbin/fsarchiver" # 还原分区表 sfdisk $DISK < pt.txt # 还原 boot & root $FSARCHIVER restfs boot.fsa id=0,dest=${DISK}p1 $FSARCHIVER restfs root.fsa id=0,dest=${DISK}p2 # 重新安装 UEFI 条目 efibootmgr -c -d $DISK -p1 -L "FT-RT" -l /EFI/BOOT/grubaa64.efi
  1. 重启,进入新生系统,验证实时性:

sudo cyclictest -p99 -i100 -d60s -n

六、常见问题与解答(FAQ)

问题现象解决
fsarchiver 报“unknown filesystem feature”源分区启用了新特性-o选项忽略特征,或升级 fsarchiver
btrfs 快照占用空间暴涨数据库大量写启用 zstd 压缩 + 每日合并快照
恢复后无法启动UEFI 条目丢失Live 系统内重新efibootmgr -c并检查 /boot/efi 文件完整
rsync 同步慢单线程 10 MB/s--whole-file局域网跳过 delta,或并行lsyncd
磁盘坏道导致备份失败I/O error使用ddrescue先抢救镜像,再 fsarchiver

七、实践建议与最佳实践

  1. 3-2-1 原则
    至少 3 份副本,2 种介质,1 份异地。

  2. 备份验证演练
    每季度做一次“盲演”:随机拔掉节点 A 电源,45 min 内节点 B 拉起并接管控制。

  3. 加密与可信
    移动硬盘使用cryptsetup luksFormat全盘加密,防止丢失泄露。

  4. 快照链合并
    每周合并一次增量快照→“周基线”,减少链深度,提升恢复速度。

  5. 监控告警
    备份失败立即告警:

    */30 * * * * /home/ftuser/backup-lab/snap_create.sh || echo "backup fail" | mail -s Alert admin@example.com
  6. 文档化
    将恢复步骤写成《现场抢修卡》A4 塑封,贴于机柜内侧,断电时无需找电脑即可操作。


八、总结:一张脑图带走全部要点

飞腾 RT 系统备份恢复 ├─ 全量:fsarchiver + UEFI 变量 ├─ 增量:btrfs 快照 + cron ├─ 网络:rsync 异地同步 ├─ 恢复:Live USB + 一键脚本 └─ 演练:季度盲演 + 加密 + 文档

备份不是成本,是保险;恢复不是选修,是生存。
把本文脚本纳入 Git,下次矿山、电网、地铁现场出现“黑屏”时,你只需插入移动硬盘 → 执行 restore.sh → 45 min 后系统重新上线,让国产化飞腾平台真正“稳若磐石”

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/1188347.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

基于Python爬虫的网络小说热度分析 大数据可视化系统

目录摘要开发技术路线相关技术介绍核心代码参考示例结论源码lw获取/同行可拿货,招校园代理 &#xff1a;文章底部获取博主联系方式&#xff01;摘要 随着网络文学的快速发展&#xff0c;海量小说数据的高效采集与分析成为研究热点。本系统基于Python爬虫技术&#xff0c;结合大…

智慧果园树上腰果成熟度检测数据集VOC+YOLO格式4700张6类别

数据集格式&#xff1a;Pascal VOC格式YOLO格式(不包含分割路径的txt文件&#xff0c;仅仅包含jpg图片以及对应的VOC格式xml文件和yolo格式txt文件)图片数量(jpg文件个数)&#xff1a;4700标注数量(xml文件个数)&#xff1a;4700标注数量(txt文件个数)&#xff1a;4700标注类别…

基于Python的电商购物商城管理系统 0151px5p

目录项目概述核心功能技术架构特色与创新应用场景开发技术路线相关技术介绍核心代码参考示例结论源码lw获取/同行可拿货,招校园代理 &#xff1a;文章底部获取博主联系方式&#xff01;项目概述 Python电商购物商城管理系统是一个基于Web的全功能电子商务平台&#xff0c;旨在…

FLUX.2 Klein:消费级GPU也能实现的亚秒级图像生成

2026年1月19日&#xff0c;Black Forest Labs&#xff08;黑森林实验室&#xff09;正式开源了FLUX.2系列中的轻量级成员——FLUX.2 [klein]模型家族。作为目前最快的图像生成模型系列之一&#xff0c;FLUX.2 [klein]以其亚秒级推理速度和消费级硬件友好性迅速吸引了开发者的关…

我的 ASP.NET 点餐系统项目实战之旅

asp.net的点餐系统项目&#xff0c;才答辩完&#xff0c;可以使用。 使用了百度API&#xff0c;也是三层架构&#xff0c;有管理员后台和商家前台 刚完成了 ASP.NET 点餐系统的答辩&#xff0c;现在来跟大家分享下这个有趣的项目经历。这个系统已经可以投入使用啦&#xff0c;而…

Openwork 入门指南:开源 AI 桌面助手快速上手

Openwork 入门指南&#xff1a;开源 AI 桌面助手快速上手 最近 Openwork 确实很火&#xff01;它是一个完全开源的 AI 桌面代理工具&#xff0c;被誉为 Claude Cowork&#xff08;Anthropic 的付费协作功能&#xff09;的免费平替。项目在 2026 年 1 月中旬发布后迅速爆火&…

边缘 AI 入门系列(一):Jetson Nano 深度学习环境搭建与 YOLOv5 部署

文章目录 一、概述:Jetson Nano深度学习环境构建全景图 为什么选择Jetson Nano? 环境配置的挑战与解决思路 二、部署流程:从系统刷机到AI框架配置的完整路径 2.1 Jetson Nano刷机流程 2.1.1 刷机前的准备工作 2.1.2 系统镜像选择 2.1.3 刷机操作步骤 2.1.4 刷机常见问题解决…

python的变量名变量名称空间

一、变量的三要素 1.变量名 2.赋值运算符 3.变量值二、声明一个变量的过程 X hello 1.在内存里面开辟了一个变量名X的名称空间 2.在内存里面创建了一个字符串hello 3.将字符串的内存地址和变量名X关联三、内存堆区和栈区 1.变量名称放在内存的栈区 2.变量的值的内存地址放在内…

大数据技术的基于Python+Selenium的招聘信息智能采集与分析系统开题任务书

目录摘要开发技术路线相关技术介绍核心代码参考示例结论源码lw获取/同行可拿货,招校园代理 &#xff1a;文章底部获取博主联系方式&#xff01;摘要 随着互联网招聘信息的爆炸式增长&#xff0c;传统的人工采集与分析方式效率低下且难以满足精准化需求。基于大数据技术构建的招…

CVE-2025–24813:Apache Tomcat 路径等价性漏洞解析与赏金通告

免责声明&#xff1a;本文档仅用于教育目的。未经授权利用系统是非法行为&#xff0c;将受到法律制裁。保持道德&#xff0c;遵守法律&#xff0c;负责任地进行安全研究。 感谢大家阅读。享受快乐、符合道德的黑客技术&#xff01; 如果你喜欢我的工作或者需要利用脚本&#xf…

提升多尺度检测能力:YOLOv8 中 P2 小目标与 P6 超大目标检测头添加方法

蓝色线条为原模型,绿色线条为优化后的小目标模型,map提升4.5! 我们先理解什么叫做上下采样、再理解要选择哪一层作为检测头和分辨率越大检测目标越小等问题,然后再来添加小目标检测头就会容易理解很多! 原理介绍 一、上采样(Upsampling) 1. 定义 上采样是指将特征图…

TensorRT INT8 部署实战:CMake 工程化 + RTSP 推流的指定区域行人检测与人群密度分析

往期文章 RK3588+docker+YOLOv5部署:https://blog.csdn.net/FJN110/article/details/149673049 RK3588测试NPU和RKNN函数包装https://blog.csdn.net/FJN110/article/details/149669753 RK3588刷机:https://blog.csdn.net/FJN110/article/details/149669404 以及深度学习部署工…

BEV感知十年演进

你问 BEV 感知十年演进&#xff0c;其实已经不是在问一种“感知表示形式”的未来&#xff0c;而是在问&#xff1a; 当系统把世界“压扁成一张俯视图”之后&#xff0c;它还能不能对真实世界的风险负责。 下面这份内容&#xff0c;不是 BEV 从 LSS 到 Occupancy 的技术路线回顾…

【Coze 2.0深度技术解析】从AI辅助工具到主动协作伙伴的技术实现

文章目录目录引言一、Coze 2.0的升级背景&#xff1a;解决传统AI Agent的三大技术痛点二、Coze 2.0四大核心技术能力深度解析2.1 AgentSkills&#xff1a;行业经验的数字化封装&#xff0c;让通用AI快速“专精”2.2 AgentPlan&#xff1a;目标驱动的自主规划&#xff0c;实现长…

YOLOv8 集成 CBAM 实战:通道注意力(CAM)与空间注意力(SAM)详解

YOLOv8 效能再升级:深度解析与集成 CBAMBlock (Convolutional Block Attention Module) 文章目录 YOLOv8 效能再升级:深度解析与集成 CBAMBlock (Convolutional Block Attention Module) 1. 探索注意力机制的奥秘 2. CBAM (Convolutional Block Attention Module) 原理与结构…

RK3588 高分辨率多摄像头系统优化实战:48MP 单摄与双摄分时复用方案解析

文章目录 前言 一、RK3588摄像头硬件资源深度解析 1.1 MIPI PHY硬件架构 1.2 软件通路映射关系详解 1.3 关键配置要点 二、双ISP合成技术深度剖析 2.1 高分辨率处理的技术挑战 2.2 双ISP合成的系统配置 2.3 虚拟ISP节点的重要作用 三、48M分辨率单摄系统的完整实现 3.1 OV50C40…

运动控制算法十年演进

你问 运动控制算法十年演进&#xff0c;其实已经不是在问 “PID / MPC / 学习控制谁更强”&#xff0c; 而是在问一个更根本的问题&#xff1a; 当系统开始长期、无人、在真实世界中运动—— 谁来保证“它还能停得下来、退得回去、不会慢慢把自己逼进死角”&#xff1f; 下面这…

从 Transformer 到 Mamba:YOLOv8 中 VSSBlock(MambaLayer)的核心原理解析

文章目录 Mamba-YOLOv8的核心:VSSBlock (MambaLayer) 的深度解析 🧬 VSS Block 的内部构造与数据流 🏞️ SS2D (2D-Selective-Scan) 模块的魔力 ✨ 总结 MambaLayer 的强大之处 YOLOv8 改进步骤:Mamba 融合实战教程 🚀 整体思路概览:Mamba如何融入YOLOv8? 步骤 1: 创…

资源监控体系:利用npu-smi实现硬件状态实时可视化

在高性能计算领域&#xff0c;盲目运行模型无异于蒙眼狂奔。无论是排查 DeepSeek 的性能瓶颈&#xff0c;还是保障生产环境的稳定性&#xff0c;掌握 NPU 的实时状态是必修课。npu-smi 是昇腾系统自带的命令行工具&#xff0c;对标 NVIDIA 的 nvidia-smi&#xff0c;但其功能覆…

深度学习中的超分辨率重建(SR):经典模型与最新方法详解

文章目录 一、插值方法分类与数学原理 1.1 最近邻插值(Nearest-Neighbor Interpolation) 1.2 双线性插值(Bilinear Interpolation) 1.3 双三次插值(Bicubic Interpolation) 1.4 Lanczos插值 二、MATLAB实现与效果对比 三、方法性能对比 四、传统插值方法的局限性 结论与展…