1 创建环境 pyslam
REM 保存当前目录 set STARTING_DIR=%cd% set ROOT_DIR=.. cd %ROOT_DIR%REM 检查 conda conda --version if errorlevel 1 (echo 错误:请先安装 condapauseexit )REM 创建环境 call scripts\pyenv-conda-create.bat
2 安装库
REM 激活环境 conda activate pyslamREM 继续剩余步骤 call scripts\install_git_modules.bat set WITH_PYTHON_INTERP_CHECK=ON call scripts\install_pip3_packages.bat call scripts\install_cpp.bat call scripts\install_thirdparty.bat call scripts\install_pip3_semantics.batREM 安装特定版本包 pip install "pyarrow<19" pip install -U "protobuf>=5,<6" pip install "numpy<2"REM 返回原目录 cd %STARTING_DIR% echo 安装完成!
2-2 call scripts\install_pip3_packages.bat
安装的主要包分类
核心计算机视觉库
- OpenCV: 从源码编译安装,启用非免费模块
- scikit-image: 图像处理库
- kornia: PyTorch的计算机视觉库
- Pillow-HEIF: HEIF图像格式支持
深度学习框架
- TensorFlow 2.13: 谷歌深度学习框架
- PyTorch:
- macOS: torch==2.1 + torchvision==0.16
- Linux: torch==2.2.0 + torchvision==0.17(支持CUDA)
- timm: 预训练模型库
图形界面和可视化
- PyQt5: 图形用户界面框架
- pyqtgraph: 科学可视化库
- rerun-sdk: 数据可视化工具
SLAM相关专用库
- numpy-quaternion: 四元数运算
- pyflann-py3: 快速最近邻搜索
- FAISS: 相似性搜索(支持CPU/GPU)
- evo: SLAM轨迹评估工具
- trimesh: 3D网格处理
特定功能模块依赖
MonoGS(3D高斯溅射)
需要CUDA支持,安装:
- lietorch: Lie群工具
- simple-knn: K最近邻算法
- diff-gaussian-rasterization: 高斯溅射渲染
- 可视化工具:wandb, glfw, PyOpenGL等
mast3r 和 mvdust3r(3D重建)
需要CUDA支持,安装:
- pytorch3d: Facebook的3D深度学习库
- roma: 旋转匹配工具
- gradio: Web界面工具
其他功能模块
- gdown: Google Drive下载工具
- hjson: 配置文件读取
- einops: 张量操作
- ujson: 快速JSON处理
- protobuf: 序列化工具(DELF网络需要)
🔧 平台特定处理
macOS特殊处理
- 使用较旧的torch版本避免段错误
- 跳过不支持macOS的包(如open3d, megengine)

安装的主要包分类
核心计算机视觉库
- OpenCV: 从源码编译安装,启用非免费模块
- scikit-image: 图像处理库
- kornia: PyTorch的计算机视觉库
- Pillow-HEIF: HEIF图像格式支持
深度学习框架
- TensorFlow 2.13: 谷歌深度学习框架
- PyTorch:
- macOS: torch==2.1 + torchvision==0.16
- Linux: torch==2.2.0 + torchvision==0.17(支持CUDA)
- timm: 预训练模型库
图形界面和可视化
- PyQt5: 图形用户界面框架
- pyqtgraph: 科学可视化库
- rerun-sdk: 数据可视化工具
SLAM相关专用库
- numpy-quaternion: 四元数运算
- pyflann-py3: 快速最近邻搜索
- FAISS: 相似性搜索(支持CPU/GPU)
- evo: SLAM轨迹评估工具
- trimesh: 3D网格处理
特定功能模块依赖
MonoGS(3D高斯溅射)
需要CUDA支持,安装:
- lietorch: Lie群工具
- simple-knn: K最近邻算法
- diff-gaussian-rasterization: 高斯溅射渲染
- 可视化工具:wandb, glfw, PyOpenGL等
mast3r 和 mvdust3r(3D重建)
需要CUDA支持,安装:
- pytorch3d: Facebook的3D深度学习库
- roma: 旋转匹配工具
- gradio: Web界面工具
其他功能模块
- gdown: Google Drive下载工具
- hjson: 配置文件读取
- einops: 张量操作
- ujson: 快速JSON处理
- protobuf: 序列化工具(DELF网络需要)
🔧 平台特定处理
macOS特殊处理
- 使用较旧的torch版本避免段错误
- 跳过不支持macOS的包(如open3d, megengine)
2-3 call scripts\install_cpp.bat
这是一个用于构建PySLAM的C++核心组件的脚本,负责编译高性能的底层算法库。



🏗️ C++ 部分可能包含的组件
基于 PySLAM 项目的性质,C++ 部分可能包含:
1. 高性能计算模块
- 特征提取加速: ORB, SIFT, SURF 等特征的 C++ 实现
- 图像处理优化: 图像金字塔、高斯模糊等底层操作
- 几何计算: 相机几何、位姿估计、三角测量
2. 第三方库绑定
- OpenCV C++ 扩展: 自定义的 OpenCV 模块
- 点云处理: PCL 或自定义点云算法
- 优化库: g2o, Ceres Solver 等图优化库
3. Python 扩展模块
- C++ Python 绑定: 使用 pybind11 或 Boost.Python
- 性能关键函数: 将计算密集型部分用 C++ 实现
-



2-4 call scripts\install_thirdparty.bat call

🎯 功能分类
核心SLAM组件
- 特征提取: orbslam2_features (ORB特征)
- 后端优化: g2opy (图优化)、gtsam (因子图)
- 回环检测: pydbow2/3 (词袋模型)
- 可视化: Pangolin (3D显示)
深度估计模块
- 单目深度: ml_depth_pro, depth_anything_v2
- 立体视觉: raft_stereo, crestereo (高精度立体匹配)
- 多视图: mast3r, mvdust3r (多视图3D重建)
高级功能
- 大规模定位: vggt (视觉地理定位)
- 机器人集成: ros2_pybindings (ROS2接口)
- 3D处理: open3d (点云处理)
⚙️ 技术特点
- 性能优化: C++核心 + Python绑定的混合架构
- 多模态感知: 单目/立体/多视图深度估计全覆盖
- 可扩展性: 模块化设计,支持多种SLAM方案
- 生产就绪: 集成ROS2,支持实际机器人部署
- 研究导向: 包含最新学术成果(mast3r, vggt等)
这个第三方库集合为PySLAM提供了完整的视觉SLAM技术栈,从底层特征提取到高级3D重建,支持从基础定位到大规模场景理解的全套功能。
2-5 scripts\install_pip3_semantics.bat


🎯 各包详细功能
1. transformers (4.38.2)
- 功能: HuggingFace的预训练Transformer模型
- SLAM应用:
- 场景语义理解
- 物体识别和分类
- 视觉语言模型集成
- 版本锁定原因: 避免新版API破坏性变更
2. f3rm
- 功能: 稠密CLIP特征提取
- SLAM应用:
- 3D场景的语义特征学习
- 视觉-语言对齐
- 高级场景理解
- 特点: 最新的语义SLAM研究方向
3. timm (1.0.15)
- 功能: PyTorch图像模型库
- SLAM应用:
- 提供多种骨干网络
- 特征提取支持
- 模型架构基础
- 版本锁定: 确保兼容性
4. numpy (<2.0)
- 功能: 数值计算基础库
- 重要性: 所有科学计算的基础
- 版本限制: 避免numpy 2.0的破坏性变更
5. opencv-python
- 安装方式: 从本地whl文件强制重装
- 目的: 确保正确的OpenCV版本和配置
- 功能: 图像处理、相机标定、几何计算
-