【全栈开发】—— Paddle OCR 文字识别 + deepseek接入(基于python 最新!!!)

所有源码都在文章中,大家不要私信来要源码,当然,评论区欢迎交流技术

目录

Paddle OCR

配置环境

示例

deepseek接入

环境配置

api 调用代码

sliconflow


Paddle OCR

配置环境

清华源下载 paddlepaddle

pip install paddlepaddle -i https://pypi.tuna.tsinghua.edu.cn/simple

清华源下载 paddlehub

pip install paddlehub -i https://pypi.tuna.tsinghua.edu.cn/simple

飞桨官网安装:

开始使用_飞桨-源于产业实践的开源深度学习平台

根据自己电脑的配置进行选择,选择 GPU 或者 CPUGPU 要选择 CUDA 版本,可在cmd输入指令查看:

nvcc --version

release 后面的就是 CUDA  版本,还未下载 CUDA 的可以看我之前配置 YOLO8GPU 环境,有CUDA Cudnn教程:

CV -- 基于GPU版CUDA环境+Pycharm YOLOv8 目标检测_python+yolo+opencv+cuda-CSDN博客

官网复制适合自己的指令,在控制台下载(我这只是示例):

 python -m pip install paddlepaddle-gpu==3.0.0rc1 -i https://www.paddlepaddle.org.cn/packages/stable/cu118/

下载完后再下载  paddleocr

pip install paddleocr

示例

配置完成,下面进行一个简单示例(官方示例):

from paddleocr import PaddleOCR
import os
os.environ['KMP_DUPLICATE_LIB_OK'] = 'TRUE'#我的电脑因为报某些错误需要加上这个
# Paddleocr目前支持的多语言语种可以通过修改lang参数进行切换
# 例如`ch`, `en`, `fr`, `german`, `korean`, `japan`
ocr = PaddleOCR(use_angle_cls=True, lang="ch",use_gpu = True)  # need to run only once to download and load model into memory   use_gpu 开启gpu(显卡)进行推理
img_path = 'F:\全栈\Django\YOLO_django\\app01\static\img\\2.jpg'
result = ocr.ocr(img_path, cls=True)
for idx in range(len(result)):res = result[idx]for line in res:print(line)

原图片是这样的:

运行代码,识别文字:

识别是一行一行来的,第一个数据是该文字在图片的位置信息是,第二个是文字识别的内容,第三个则是置信度。

可以看到,由于我识别的图片拍的比较清晰,所有文字的识别置信度都在0.998之上,大家也可以放点不清晰的看看效果咋样。

deepseek接入

环境配置

先去 deepseek 官网注册,申请 api

DeepSeek

这样获取的 api 是没有免费额度的:

但我们也试试代码。

api 调用代码

安装 openai

pip install openai

运行代码:

from openai import OpenAIclient = OpenAI(api_key='你的api',base_url="https://api.deepseek.com")
response = client.chat.completions.create(model="deepseek-chat",messages=[{"role":"system","content":"你好呀"},{"role":"user","content":"很好"}],stream=False,
)
print(response.choices[0].message.content)

这样是会报错的:

因为自己 deepseek 官网没有 token 请求次数,大部分小伙伴又不想花钱,API就没办法调用。当然,大大家有能力也可以自己去充值,充值了就有 token 使用权力,就可以正常调用 api。

sliconflow

没超能力就无法调用 deepseek 了吗?当然不是,大家也可注册获取使用Deepseek模型的平台 sliconflow

去这个网站注册,注册即送两千万 token,白飘党的福利:Models

新建密钥:

使用硅基平台的 api 时,在调用时,需要修改部分代码,修改如下:

base_url="http://api.siliconflow.cn/v1"model="deepseek-ai/DeepSeek-V3"

完整代码如下:

from openai import OpenAIclient = OpenAI(api_key='你的api密钥',base_url="http://api.siliconflow.cn/v1")
response = client.chat.completions.create(model="deepseek-ai/DeepSeek-V3",messages=[{"role":"system","content":"我是DeepSeek Chat,由深度求索公司(DeepSeek)创造的人工智能助手!"},{"role":"user","content":"怎么去重庆"}],stream=False,
)
print(response.choices[0].message.content)

message 中是上下文,model 可以根据 message 生成结果,role 是发送消息的对象,content 是内容,这里 role 有系统和用户,系统就是 model 上次的回答,用户则是你自己 。当然 message 中也可以不止放这两行上下文,能放很多。

运行代码:

可以看到是能给出推理的,这里也欢迎大家去重庆旅游哈哈(本人重庆的)。


 

下文更新,在Django中使用图像识别、deepseek,尽情交互!!!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/web/73852.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

SAIL-RK3588J 核心板技术方案——高精度装配式建筑机器人控制‌

(本方案契合《建筑机器人产业目录》政策要求) 一、方案背景与政策支持‌ ‌政策驱动‌ 2025年2月《建筑机器人产业目录》明确将‌“高精度建筑机器人控制设备”‌纳入重点补贴范围,要求定位精度≤0.5mm、支持实时质检与多机协同&#xff0c…

OpenAI API - 快速入门开发

文章目录 开发者快速入门分析图像输入使用工具扩展模型提供闪电般的 AI 体验构建代理进一步探索 模型精选模型推理模型旗舰聊天模型成本优化模型实时模型旧版 GPT 模型DALLE文本转语音转写嵌入调度工具特定模型GPT 基础模型 Libraries创建和导出 API 密钥安装官方 SDKJavaScrip…

蓝桥杯省赛 棋盘 3533 二维差分+二维前缀和

传送门 0棋盘 - 蓝桥云课 const int N 2e3 10;int n,m; int a[N][N];void insert(int x11,int y11,int x22,int y22) {a[x11][y11] ;a[x11][y22 1] --;a[x22 1][y11] --;a[x22 1][y22 1] ; }void solve() {cin >> n >> m;for (int i 1;i < m;i ){int x11…

《C++Linux编程进阶:从0实现muduo 》-第6讲.C++死锁问题如何分析调试-原子操作,互斥量,条件变量的封装

重点内容 视频讲解&#xff1a;《CLinux编程进阶&#xff1a;从0实现muduo C网络框架系列》-第6讲.C死锁问题如何分析调试-原子操作,互斥量,条件变量的封装 代码改动 lesson6代码 实现&#xff1a;base/Atomic.h 实现&#xff1a;base/Mutex.h 实现&#xff1a;base/Condit…

洛谷题单1-P5708 【深基2.习2】三角形面积-python-流程图重构

题目描述 一个三角形的三边长分别是 a a a、 b b b、 c c c&#xff0c;那么它的面积为 p ( p − a ) ( p − b ) ( p − c ) \sqrt{p(p-a)(p-b)(p-c)} p(p−a)(p−b)(p−c) ​&#xff0c;其中 p 1 2 ( a b c ) p\frac{1}{2}(abc) p21​(abc)。输入这三个数字&#xff…

matplotlib标题比x,y轴字体大,明明标题字体更大?

原始代码&#xff1a; plt.xlabel(训练轮次&#xff08;Epochs&#xff09;, fontsize14, fontweightbold, fontpropertieschinese_font) # 设置中文字体、加大、加粗 plt.ylabel(R值, fontsize14, fontweightbold, fontpropertieschinese_font) # 设置中文字体、加大、加粗…

Baklib内容中台的核心优势是什么?

智能化知识管理引擎 Baklib的智能化知识管理引擎通过多源数据整合与智能分类技术&#xff0c;实现企业知识资产的自动化归集与动态更新。系统内置的语义分析算法可自动识别文档主题&#xff0c;结合自然语言处理技术生成结构化标签体系&#xff0c;大幅降低人工标注成本。针对…

Android学习总结之ContentProvider跨应用数据共享

在 Android 开发中&#xff0c;跨应用数据共享是构建开放生态的关键需求。作为四大组件之一&#xff0c;ContentProvider通过标准化接口和安全机制&#xff0c;成为实现这一需求的核心枢纽。本文将围绕其生命周期方法、核心机制、自定义实现及最佳实践展开&#xff0c;帮助开发…

计算机底层基石:原码、反码、补码、移码深度剖析

在计算机的世界里&#xff0c;所有数据最终都以二进制的形式进行存储与运算。原码、反码、补码和移码作为二进制数据的重要编码方式&#xff0c;对计算机实现高效数据处理起着关键作用。接下来&#xff0c;我们将深入剖析这几种编码。​ 一、原码​ 1.1 定义​ 原码是最简单…

Bitnode和Bitree有什么区别 为什么Bitree前多了*

Bitnode 和 Bitree 的区别在于它们的类型定义和用途&#xff1a; Bitnode: 这是一个结构体类型&#xff0c;表示二叉树中的一个节点。 它包含三个成员&#xff1a; data&#xff1a;存储节点的数据&#xff08;这里是 char 类型&#xff09;。 lchild&#xff1a;指向左子节点…

AI 时代,我们该如何写作?

当ChatGPT/DeepSeek能在几秒钟内产出一篇文章&#xff0c;而且生成能力日益精进&#xff0c;你是否也曾思考&#xff0c;我还能做什么&#xff1f; 当2024年AI开始进入人们的视野&#xff0c;我在CSDN 上的博客也悄然发生了变化&#xff0c;以前一篇文章发布后&#xff0c;阅读…

第三卷:覆舟山决战(73-108回)正反人物群像

第三卷&#xff1a;覆舟山决战&#xff08;73-108回&#xff09;正反人物群像 核心矛盾&#xff1a;寒门称帝→权力异化→历史循环 主题&#xff1a;通过人物群像展现屠龙者成魔的必然性与制度压迫的永恒性 一、正派阵营&#xff08;理想主义残余&#xff09; 1. 檀道济&…

vscode 通过Remote-ssh远程连接服务器报错 could not establish connection to ubuntu

vscode 通过Remote-ssh插件远程连接服务器报错 could not establish connection to ubuntu&#xff0c;并且出现下面的错误打印&#xff1a; [21:00:57.307] Log Level: 2 [21:00:57.350] SSH Resolver called for "ssh-remoteubuntu", attempt 1 [21:00:57.359] r…

Nginx RTMP DASH 模块分析 (ngx_rtmp_dash_module.c)

ngx_rtmp_dash_module.c实现了一个 Nginx RTMP 模块&#xff0c;主要功能是支持通过 DASH&#xff08;动态自适应流媒体&#xff09;协议进行流媒体发布。DASH&#xff08;Dynamic Adaptive Streaming over HTTP&#xff09;是一种流行的视频流协议&#xff0c;它允许根据网络状…

飞书电子表格自建应用

背景 coze官方的插件不支持更多的飞书电子表格操作&#xff0c;因为需要自建应用 飞书创建文件夹 创建应用 开发者后台 - 飞书开放平台 添加机器人 添加权限 创建群 添加刚刚创建的机器人到群里 文件夹邀请群 创建好后&#xff0c;就可以拿到id和key 参考教程&#xff1a; 创…

LangFlow系列:LangFlow快速入门示例

本文介绍了开源AI开发工具LangFlow的快速入门方法。LangFlow作为可视化框架&#xff0c;支持通过拖拽组件构建多智能体及RAG应用&#xff0c;兼容主流大语言模型与向量数据库。文章从环境搭建、核心功能到实战案例逐步讲解&#xff0c;演示如何利用其可视化界面创建智能聊天机器…

基于龙芯3A5000处理器,全国产标准6U VPX板卡解决方案

1&#xff0c;产品功能 本产品为一款高可靠性的基于龙芯3A5000处理器以及 7A2000芯片组的标准6U VPX板卡&#xff0c;具有以太网、SATA、PCIE&#xff0c;以及显示等接口&#xff0c;产品功能框图如图1所示&#xff1a; 图1 系统框图 2&#xff0c;技术指标 序号 项目 指标…

无人机进行航空数据收集对于分析道路状况非常有用-使用无人机勘测高速公路而不阻碍交通-

无人机进行航空数据收集对于分析道路状况非常有用-使用无人机勘测高速公路而不阻碍交通- 瑞士拥有1,400 多公里长的高速公路网络。这些公路将人和货物从山谷高原运送到阿尔卑斯山的最高山口。维护这些高速公路使国家得以顺利运转。高速公路维护的重要性显而易见&#xff0c;但在…

Android设计模式之工厂方法模式

一、定义&#xff1a; 定义一个用于创建对象的接口&#xff0c;让子类决定实例化哪个类。 二、组成&#xff1a; 1.抽象工厂&#xff1a;工厂模式的核心&#xff0c;声明工厂方法&#xff0c;返回抽象产品对象。 2.具体工厂&#xff1a;实现工厂方法&#xff0c;返还具体的产品…

推荐系统(十七):在TensorFlow中用户特征和商品特征是如何Embedding的?

在前面几篇关于推荐模型的文章中&#xff0c;笔者均给出了示例代码&#xff0c;有读者反馈——想知道在 TensorFlow 中用户特征和商品特征是如何 Embedding 的&#xff1f;因此&#xff0c;笔者特意写作此文加以解答。 1. 何为 Embedding &#xff1f; 关于 Embedding&#x…