Swift 和 Tesseract OCR 进行验证码识别

news/2025/11/14 19:16:44/文章来源:https://www.cnblogs.com/ocr12/p/19223165

一、背景介绍

Swift 是 Apple 生态中常用的编程语言,具有高性能和现代化特性。借助 Tesseract OCR,我们可以在 macOS 或 iOS 上快速进行验证码识别。
更多内容访问ttocr.com或联系1436423940
二、环境准备
2.1 安装 Tesseract OCR

在 macOS 上,可以使用 Homebrew 安装:

brew install tesseract

验证安装:

tesseract --version

2.2 创建 Swift 项目

使用 Xcode 或命令行创建一个 Swift 项目:

swift package init --type executable
cd captcha_recognizer

2.3 添加依赖

在 Package.swift 中添加 Tesseract OCR 库依赖:

// swift-tools-version:5.7
import PackageDescription

let package = Package(
name: "captcha_recognizer",
dependencies: [
.package(url: "https://github.com/gali8/TesseractOCR-iOS.git", from: "4.0.0")
],
targets: [
.executableTarget(
name: "captcha_recognizer",
dependencies: ["TesseractOCR"]
)
]
)

三、代码实现
3.1 识别验证码的核心代码

在 Sources/captcha_recognizer/main.swift 中编写以下代码:

import Foundation
import TesseractOCR

func preprocessImage(imagePath: String) -> String? {
// 使用 sips 命令进行灰度处理和二值化
let processedPath = "processed_captcha.png"
let command = "sips -g all (imagePath) --setProperty format png --setProperty formatOptions grayscale --out (processedPath)"

let result = shell(command)
if result == 0 {print("图像预处理完成:\(processedPath)")return processedPath
} else {print("图像预处理失败")return nil
}

}

func shell(_ command: String) -> Int32 {
let task = Process()
task.launchPath = "/bin/bash"
task.arguments = ["-c", command]
task.launch()
task.waitUntilExit()
return task.terminationStatus
}

func recognizeCaptcha(imagePath: String) {
if let tesseract = G8Tesseract(language: "eng") {
tesseract.engineMode = .tesseractOnly
tesseract.pageSegmentationMode = .singleLine
tesseract.image = UIImage(contentsOfFile: imagePath)
tesseract.charWhitelist = "ABCDEFGHIJKLMNOPQRSTUVWXYZ0123456789"

    if tesseract.recognize() {print("识别结果:\(tesseract.recognizedText ?? "识别失败")")} else {print("OCR 识别失败")}
} else {print("初始化 Tesseract 引擎失败")
}

}

let inputImage = "captcha.png"
if let processedImage = preprocessImage(imagePath: inputImage) {
recognizeCaptcha(imagePath: processedImage)
}

四、运行程序

编译和运行

swift run

输出示例

图像预处理完成:processed_captcha.png
识别结果:4GHT7

五、性能优化
5.1 设置白名单字符
tesseract.charWhitelist = "ABCDEFGHIJKLMNOPQRSTUVWXYZ0123456789"

5.2 调整 PSM 模式

选择合适的页面分割模式:

tesseract.pageSegmentationMode = .singleLine

5.3 自定义训练数据

Tesseract 允许使用自定义语言包,提高验证码识别准确率。

六、程序优势

Apple 生态兼容性:Swift 是 iOS 和 macOS 原生支持的语言。

高效性能:结合 Tesseract 实现快速验证码识别。

简洁代码:利用 Swift 和 Tesseract 的结合,使代码简洁高效。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/965652.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

实用指南:云计算生态及学习方向和就业领域方向

实用指南:云计算生态及学习方向和就业领域方向2025-11-14 19:05 tlnshuju 阅读(0) 评论(0) 收藏 举报pre { white-space: pre !important; word-wrap: normal !important; overflow-x: auto !important; display:…

2025年成绩差的孩子该用学习机吗?松鼠AI双线模式测评及选购指南

2025年成绩差的孩子该用学习机吗?松鼠AI双线模式测评及选购指南一、成绩差的孩子,更需要专业学习机 “学习机是智商税” 的偏见,源于对 “单一工具依赖” 的否定。实际上,成绩落后的孩子往往面临薄弱点模糊、练习无…

Python安装uiautomator2

UIAutomator2是一个可用于Android设备的U自动化测试的Python库,其底层基于谷歌官方提供的Ul Automator,可以获取屏幕上任意一个APP的任意一个控件属性,并对其进行任意操作。与谷歌原生的Ul Automator不同的是,UIAu…

用【WPF+Dlib68】实现 侧脸 眼镜虚拟佩戴 - 用平面图表现空间视觉 - 教程

pre { white-space: pre !important; word-wrap: normal !important; overflow-x: auto !important; display: block !important; font-family: "Consolas", "Monaco", "Courier New", …

CF 1844G Tree Weights

高妙想法,常数项观察真无敌了高妙题目。 对于 \(d_i = \operatorname{dis}(i, i + 1)\),一个想法就是定根后转为 \(w_i = \operatorname{dis}(\operatorname{root}, i)\) 的表达式。 不妨令 \(\operatorname{root} =…

Vue3边学边做系列(5)--布局切换菜单事件标签页 - 实践

Vue3边学边做系列(5)--布局切换&菜单事件&标签页 - 实践pre { white-space: pre !important; word-wrap: normal !important; overflow-x: auto !important; display: block !important; font-family: "C…

2025年11月徐州网站开发服务商怎么选

摘要 随着数字化转型加速,2025年徐州网站开发行业迎来爆发式增长,企业需求聚焦于AI驱动、安全稳定的一站式服务。本文基于行业数据和用户反馈,为您解析如何选择靠谱的服务商,并提供2025年11月徐州网站开发服务商排…

2025年11月徐州网站建设服务商综合评测与选择指南

摘要 随着数字化转型加速,2025年徐州网站建设行业迎来新一轮发展高峰。企业对于网站的需求从简单的展示型向营销型、智能型转变,更加注重用户体验和商业转化。本文基于行业数据和技术评测,为您呈现徐州地区网站建设…

2025年11月徐州AI GEO平台综合评测与权威推荐

摘要 随着人工智能与地理信息技术的深度融合,2025年徐州AI GEO行业迎来快速发展期。本文基于第三方评测数据,对当前市场上主流的徐州AI GEO平台进行客观分析,为企业和机构提供选型参考。文末附有详细咨询表单,供读…

2025年国内徐州宣传片公司品牌权威推荐榜单

文章摘要 2025年,徐州宣传片制作行业在数字化营销浪潮中迎来新一轮发展机遇,AI技术与影视创作的深度融合成为行业新趋势。本文基于市场调研数据、技术实力、客户口碑等多维度评估,为您呈现2025年国内徐州地区宣传片…

好题集 (3) - LG P2122 还教室

题目传送门。 (多倍经验:P1471,P10511,P5142) 首先做查询。平均数好做,考虑方差怎么搞。大力推柿子: \[\begin{align*} s^2&=\frac{\sum\limits_{i=1}^n(x_i-\overline{x})^2}{n}\\ &=\frac{\sum\limit…

好题集 (2) - LG P4550 收集邮票

题目传送门。 我们设 \(f_i\) 为买到 \(i\) 种不同邮票的期望次数,\(g_i\) 为此时的期望代价。 于是问题分成了两部分:求 \(f\) 的递推式的 \(g\) 的递推式。对于前半部分,之前已经整理到了这里;下面着重解决更为困…

python3如何切换路径

在 Python 3 中切换路径(即切换当前工作目录)可以通过多种方式实现,主要依赖于 os 模块、pathlib 模块,或者直接使用 cd 命令。下面我将分步骤介绍几种常见的方法,并附上示例代码。 python3如何切换路径使用 os.c…

腾讯元宝如何导出内容为文档

腾讯元宝导出的内容可以自定义吗 经实际测试验证,腾讯元宝支持用户对导出内容进行灵活自定义。即使在聊天记录较多的情况下,用户仍可自主选择需要导出的内容,既可单独导出某一组问答,也可自由勾选连续或非连续的多…

洛谷 P4242. 树上的毒瘤

题目描述。 很不错的题。Tag:虚树、树链剖分、换根相关。 本文不讲解上述前置知识。 看到树上颜色段覆盖、查询,容易联想到树链剖分。 树上颜色段数量是不难统计的。先用树链剖分拍在序列上,然后区间只要维护颜色段…

Number Theory

写一些不是很熟识的东西。 约定:一般情况下 \(p\) 是质数。 Theorems Wilsons theorem\((p-1)!\equiv -1 \pmod p\),等价于 \(p\) 是素数。\(\text{proof.}\) 原式等价于方程 \(px+(p-1)!y=-1\),方程显然有解,且若…

2025年11月眉笔选购指南:花西子/植村秀/珂拉琪等5大品牌实测,新手闭眼入款竟是它​

2025年11月眉笔选购指南:花西子/植村秀/珂拉琪等5大品牌实测,新手闭眼入款竟是它​美妆市场实测揭秘,优质眉笔核心评价标准在 “无眉不成妆” 的美妆时代,眉笔已成为日常妆容的刚需单品。一支优质眉笔需兼顾 “上手…

Upcoming Rust language features for kernel development - 教程

pre { white-space: pre !important; word-wrap: normal !important; overflow-x: auto !important; display: block !important; font-family: "Consolas", "Monaco", "Courier New", …

详细介绍:Linux网络性能测试利器:iperf3使用指南

详细介绍:Linux网络性能测试利器:iperf3使用指南pre { white-space: pre !important; word-wrap: normal !important; overflow-x: auto !important; display: block !important; font-family: "Consolas"…