深度学习部署包含哪些步骤?
| 阶段 | 说明 | 示例工具 | 
|---|---|---|
| 模型导出 | 把 .pt、.h5 等格式模型导出为通用格式(如ONNX) | PyTorch, TensorFlow, ONNX | 
| 推理优化 | 减小模型体积、加速推理(量化、剪枝) | TensorRT, ONNX Runtime | 
| 系统集成 | 将模型嵌入业务系统中运行(桌面、服务器、边缘设备) | C++/C#/Python 接口,Flask/Qt/WebApi | 
| 上线运行 | 打包运行环境,部署在云端、本地或设备上 | Docker, Kubernetes, Jetson | 
| 持续服务 | 设置监控、日志、模型热更新等 | Prometheus, Grafana, FastAPI |