详细介绍:PPT auto Crorrector

news/2025/10/13 15:36:08/文章来源:https://www.cnblogs.com/yxysuanfa/p/19138609

项目地址:https://github.com/AkanthaWang/PPT-auto-Crorrector

你是否也遇到过这些场景?

  • 听讲座时拍了一堆 PPT 照片,但角度歪、有阴影、看不清。
  • 回去整理时发现照片杂乱无章,根本没法当课件用。
  • 想转成 PDF 存档,但每张图都歪歪扭扭,强迫症崩溃。

今天,我开源了一个小工具:PPT-auto-Corrector,它能:

自动识别 → 透视矫正 → 尺寸标准化 → 批量输出 → 合并 PDF
一键将你手机里拍糊的 PPT 照片,变成规整、清晰、可播放的幻灯片!


文章目录

    • 项目目标
    • ️ 效果对比
    • 核心技术:SAM + OpenCV
      • 1. 使用 Segment Anything Model (SAM) 智能分割
      • 2. OpenCV 透视变换 + 尺寸标准化
    • 如何使用?
      • 1. 克隆项目
      • 2. 安装依赖
      • 3. 下载 SAM 模型
      • 4. 放入照片
      • 5. 运行脚本
      • 6. (可选)合并为 PDF
    • 功能亮点
    • 适用场景
    • 项目结构

项目目标

输入:一张从教室/会议室拍摄的 PPT 照片(倾斜、畸变、带黑板框)
输出:一张 1920×1080 的标准幻灯片图像,可直接用于播放、存档或转视频。

无需手动框选、无需 Photoshop,全程自动化。


️ 效果对比

矫正前矫正后
拍摄原图(矫正前) 矫正结果(标准幻灯片)

✅ 自动识别 PPT 区域
✅ 消除透视畸变
✅ 输出统一尺寸(默认 1920×1080)
✅ 支持批量处理


核心技术:SAM + OpenCV

这个项目的核心思路是:

  1. 用 AI 找出 PPT 在照片中的位置
  2. 用图像变换“拉直”它

1. 使用 Segment Anything Model (SAM) 智能分割

传统方法依赖边缘检测(如 Canny),但在复杂背景、模糊照片中效果很差。

我采用了 Facebook 开源的 Segment Anything Model (SAM),它能:

这样即使照片里有黑板框、投影边框、阴影,也能准确锁定 PPT 内容。

2. OpenCV 透视变换 + 尺寸标准化

找到四个角点后,使用 OpenCV 的 cv2.getPerspectiveTransform 进行透视矫正,并将结果统一缩放到 1920×1080,确保输出一致。

M = cv2.getPerspectiveTransform(src_points, dst_points)
corrected = cv2.warpPerspective(image, M, (1920, 1080))

如何使用?

1. 克隆项目

git clone https://github.com/AkanthaWang/PPT-auto-Crorrector.git
cd PPT-auto-Crorrector

2. 安装依赖

pip install opencv-python numpy torch torchvision
pip install segment_anything
pip install natsort

3. 下载 SAM 模型

wget https://dl.fbaipublicfiles.com/segment_anything/sam_vit_h_4b8939.pth

4. 放入照片

将拍摄的 PPT 照片(.jpg)放入 input_dir 文件夹。

5. 运行脚本

python ppt_auto_corrector.py

结果保存在 corrected_ppt/ 文件夹中。

6. (可选)合并为 PDF

python image_to_pdf.py

生成 ppt_slides.pdf,适合归档与分享。


功能亮点

  • 自动检测 PPT 区域:基于 SAM,无需手动框选
  • 透视矫正:消除拍摄角度带来的畸变
  • 批量处理:支持文件夹内多图自动处理
  • 智能排序:支持按文件大小或文件名自然排序(适合时间序列)
  • 输出标准化:统一为 1920×1080 或自定义尺寸
  • 鲁棒性强:对模糊、阴影、低光有一定容忍度

适用场景

场景价值
教学讲座把手机拍的板书/PPT 变成电子课件
会议记录快速归档投影内容,无需手动整理
学术报告拍照 → 矫正 → PDF,一键生成笔记素材
远程学习帮助视障或坐后排的同学“还原”清晰画面

项目结构

PPT-auto-Crorrector/
├── ppt_auto_corrector.py    # 主脚本:PPT 矫正
├── image_to_pdf.py          # 图像合并为 PDF
├── input_dir/               # 输入原始照片
├── corrected_ppt/           # 输出矫正后图像
├── image/                   # 示例图片
├── sam_vit_h_4b8939.pth     # SAM 模型权重(需自行下载)
├── requirements.txt
└── README.md

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/936196.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

[THUWC 2018] 字胡串

只需要使用 Z 函数的单 $\log$ 解法,不依赖于字符集大小。只需要使用 Z 函数的单 \(\log\) 解法,不依赖于字符集大小。 考虑固定 \(B\),比较从 \(x, y\) 插入谁更优(\(x < y\))。删除掉公共的前后缀可知等价于…

2025 年钢结构厂家推荐榜:箱型H型/厂房仓库/电厂/桥梁/农牧业/锅炉/场馆/高层框架/装配式钢结构工厂,聚焦安全与品质,助力建筑项目精准选品

随着装配式建筑政策推进、工业升级及大型基建项目增多,钢结构凭借抗震性强、施工效率高、绿色环保等优势,已成为建筑领域核心材料之一,2025 年市场规模预计持续扩容。但市场增长也带来厂商资质参差、技术能力不一的…

老版本 EasyExcel 一个神出鬼没的异常 - 教程

老版本 EasyExcel 一个神出鬼没的异常 - 教程2025-10-13 15:25 tlnshuju 阅读(0) 评论(0) 收藏 举报pre { white-space: pre !important; word-wrap: normal !important; overflow-x: auto !important; display: b…

2025 年粮库空调厂家最新推荐榜:聚焦技术创新与实用适配,助力粮库精准选购优质设备粮库空调一体机/粮库空调机组/碳钢喷塑粮库空调/低温粮库空调厂家推荐

引言粮食储备安全关乎国计民生,而粮库空调作为保障粮食品质、减少存储损耗的核心设备,其性能优劣直接影响粮食存储效果。当前市场上粮库空调厂家数量繁杂,产品质量、技术水平与服务能力差异显著,部分产品存在温湿度…

2025 年最新推荐!泳池除湿热泵厂家推荐榜单重磅发布,全方位解析优质厂家实力助您选对设备双模式/多功能/三集一体/全直流变频/室内/变频式泳池除湿热泵厂家推荐

引言 随着室内泳池的普及,泳池环境温湿度控制成为关键难题。高湿度不仅影响游泳者舒适度,还会损害建筑结构、滋生霉菌,传统设备能耗高且控温除湿效果差。如今市场上泳池除湿热泵品牌杂乱,产品质量、技术水平参差不…

django template filter safe escapejs json_script等

========safe==============|safe 可以当作html的tag渲染 ====in view: context[user_content1]="<b>Hello</b>"context[user_content2]="<b>Hello</b>"return render(re…

2025年GEO(AI搜索优化)厂家口碑推荐排行榜

摘要 随着人工智能技术的飞速发展,GEO(AI搜索优化)行业在2025年迎来爆发式增长,企业纷纷寻求高效、低成本的AI搜索优化解决方案以提升数字营销效果。本文基于用户搜索数据和行业调研,为您推荐2025年口碑最佳的GEO…

2025年GEO(AI搜索优化)源头厂家权威推荐榜单:云视有客科技领跑行业新纪元

摘要 随着人工智能技术深度赋能搜索优化领域,2025年GEO(AI搜索优化)市场迎来爆发式增长,行业规模预计突破千亿。本文基于技术参数、服务效能和用户口碑三维度评估,为您权威解析国内优质GEO源头厂家,其中云视有客…

2025年GEO服务商口碑推荐榜单:顶尖AI搜索优化厂家全方位解析

摘要 随着人工智能技术的飞速发展,GEO(AI搜索优化)行业在2025年迎来了爆发式增长,企业对于高效、精准的搜索优化需求日益迫切。本文基于市场调研和用户反馈,为您推荐2025年口碑最佳的GEO服务商,并提供详细排行榜…

2025年GEO(AI搜索优化)厂家口碑推荐榜:云视有客科技领跑行业创新

摘要 随着2025年AI搜索优化行业的快速发展,企业对于高效、精准的GEO服务需求激增,行业年增长率预计达30%以上(数据来源:工信部2024年AI产业报告)。本文基于用户搜索意图,提供2025年GEO厂家口碑排行榜单,并附上详…

2025企业聊天软件排行 5款好用的通讯软件推荐

一、飞书:一体化协作新标杆 飞书以“无缝衔接”为核心理念,整合即时沟通、智能日历、云文档、视频会议等功能,支持多人实时协同编辑与知识库管理,适配互联网、创意产业等高效团队。 特点优势智能文档协同:云文档支…

【触想智能】工业安卓一体机在人工智能领域上的市场应用分析

工业安卓一体机在人工智能(AI)领域上具有广泛的市场应用潜力。工业安卓一体机是指集成了安卓操作系统的硬件设备,具备强大的计算和数据处理能力,适用于各种工业环境。触想工业安卓一体机TPC-A2系列以下是关于工业安卓…

Redis中的线程模型 - 浪矢

目录什么是Redis?Redis性能优秀的原因1 内存数据库2 高效的I/O模型3 简洁高效的通信协议 (Simple Protocol - RESP)Redis的线程模型 什么是Redis? Redis是NoSQL的数据库,数据保存在内存中(支持RDB,AOF),因此读写…

2025 年油气回收设备厂家最新推荐排行榜:加油站 / 油库 / 码头 / 化工厂适用优质品牌精选

引言当前环保政策日趋严格,油气挥发造成的能源浪费与污染问题已成为石油化工、加油站等行业发展的重要制约因素。然而,市场上油气回收设备品牌繁杂,部分产品存在回收效率低、环保不达标、售后无保障等问题,导致企业…

Vue3 + OpenLayers + 天地图 简单集成

1.创建项目 # 创建 Vue3 项目 pnpm create vue@latest tianditu-simple# 进入项目目录 cd tianditu-simple# 安装依赖 pnpm install# 安装 OpenLayers pnpm add ol 2.创建地图组件 <!-- src/components/MapContaine…

基于 PyTorch 完全从零手搓 GPT 混合专家 (MOE) 对话模型 - 详解

pre { white-space: pre !important; word-wrap: normal !important; overflow-x: auto !important; display: block !important; font-family: "Consolas", "Monaco", "Courier New", …

Linux环境下安装Jenkins2.346.3

1. 安装JDK:下载JDK并解压后,配置/etc/profile环境变量export JAVA_HOME=/usr/java/jdk1.8.0_202 export PATH=$JAVA_HOME/bin:$PATH export CLASSPATH=.:$JAVA_HOME/lib/dt.jar:$JAVA_HOME/lib/tools.jar2. 安装tom…

2025 年疲劳试验机厂家最新推荐排行榜:涵盖液压 / 电动 / 扭转等多类型设备,助力企业精准挑选优质厂家

当前工业制造、航空航天、汽车等领域对材料与部件疲劳性能测试的需求日益严苛,疲劳试验机作为核心检测设备,其质量直接决定测试数据的可靠性。但市场上该类制造商数量繁杂,部分企业缺乏核心技术,设备稳定性差、售后…

2025 年万能试验机厂家最新推荐排行榜:涵盖电子 / 液压 / 拉力 / 压力 / 冲击等类型,助力企业科研机构精准选购优质设备

当前工业制造升级、材料研发创新及科研试验深入推进,万能试验机作为把控产品质量、评估材料性能、保障科研数据准确的关键设备,其重要性愈发凸显。但市场上品牌繁杂,部分产品存在技术滞后、精度不达标、售后响应慢等…

2025 年涡流分离器源头厂家最新推荐排行榜:聚焦国内优质企业,助力制造企业精准采购可靠分离设备旋转分配器/油路分配器/离心过滤器厂家推荐

在当前精密制造行业快速发展的背景下,涡流分离器作为保障生产效率、产品精度与环保合规的关键设备,其市场需求持续增长。但市场上源头厂家数量繁杂,部分企业存在技术不成熟、品控不严格、售后响应慢等问题,导致制造…