MixTeX - 支持CPU推理的多模态LaTeX OCR

在这里插入图片描述

文章目录

    • 一、项目概览
      • 相关资源
      • 核心特性
      • 技术特点
    • 二、安装
    • 三、使用说明
      • 环境要求
    • 四、版本更新
    • 五、当前限制


一、项目概览

MixTeX是一款创新的多模态LaTeX识别小程序,支持本地离线环境下的高效CPU推理。

无论是LaTeX公式、表格还是混合文本,MixTeX都能轻松识别,并支持中英文处理。


在这里插入图片描述


相关资源

  • 源码:https://github.com/RQLuo/MixTeX-Latex-OCR
  • 论文:https://arxiv.org/abs/2406.17148
  • Colab演示:https://colab.research.google.com/github/RQLuo/MixTeX/blob/main/MixTex_Demo.ipynb
  • Hugging Face空间:https://huggingface.co/MixTex/ZhEn-Latex-OCR
  • 演示视频:https://www.youtube.com/watch?v=PqQdQ5xT-vk
  • 在线演示:https://mineai.top/
  • 赞赏支持:https://github.com/user-attachments/assets/9f52a771-ab84-466c-9a7e-629060e251cc

核心特性

1、LaTeX公式识别
准确识别复杂的LaTeX数学公式,确保数学表达式准确性

2、表格识别
高效处理并识别各类表格,生成对应的LaTeX表格代码

3、混合文本识别
同时处理包含文字、公式和表格的文本,保证识别结果的完整性

4、双语支持
支持中文和英文的高精度识别,满足不同语言环境需求


技术特点

  • 本地离线推理,无需网络连接
  • 轻量级设计,程序启动文件仅约50MB
  • 高效运行,模型加载后运行极快
  • 无需GPU,仅需CPU即可运行

二、安装

cd mixtexgui
conda create -n mixtex python=3.10.14
conda activate mixtex
pip install -r requirements.txt
pyinstaller mixtex_ui.spec

三、使用说明

1、剪贴板图片识别:按Win+V启用剪贴板功能
2、截图识别:使用Windows截图工具或键盘截图键


环境要求

推荐LaTeX配置:

\documentclass{ctexart}
\usepackage{amssymb}
\usepackage{amsmath}
\usepackage{stmaryrd}
\usepackage{color}

四、版本更新

v1.0.1 修复文件复制问题
v1.0.2 解决高色域显示器兼容问题
v1.1.2 优化花括号和表格识别
v2.1.2 支持手写文本混合公式
v2.2.3 支持黑色背景识别
v3.2.4 支持多选题OCR,优化多行公式处理


五、当前限制

  • 仅支持清晰印刷体中英文混合公式
  • 仅支持相对简单表格识别
  • 未来计划支持手写识别和多语言

伊织 xAI 2025-05-04(日)

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/bicheng/80538.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

简单 Linux 字符设备驱动程序

注:本文为 “Linux 字符设备驱动” 相关文章合辑。 英文引文,机翻未校。 中文引文,略作重排。 未整理去重,如有内容异常,请看原文。 Simple Linux character device driver 简单 Linux 字符设备驱动程序 Oleg Kutko…

NX949NX952美光科技闪存NX961NX964

NX949NX952美光科技闪存NX961NX964 在半导体存储领域,美光科技始终扮演着技术引领者的角色。其NX系列闪存产品线凭借卓越的性能与创新设计,成为数据中心、人工智能、高端消费电子等场景的核心组件。本文将围绕NX949、NX952、NX961及NX964四款代表性产品…

协议路由与路由协议

协议路由”和“路由协议”听起来相似,但其实是两个完全不同的网络概念。下面我来分别解释: 一、协议路由(Policy-Based Routing,PBR) ✅ 定义: 协议路由是指 根据预设策略(策略路由&#xff0…

Linux510 ssh服务 ssh连接

arning: Permanently added ‘11.1.1.100’ (ECDSA) to the list of known hosts. rooot11.1.1.100’s password: Permission denied, please try again. rooot11.1.1.100’s password: Permission denied, please try again 还没生效 登不上了 失效了 sshcaozx26成功登录 …

金融学知识笔记

金融学知识笔记 一、引言 金融学它结合了数学、概率论、统计学、经济学和计算机科学等多学科的知识,用于解决金融领域中的各种问题,如金融衍生品定价、投资组合优化、风险管理和固定收益证券分析等。通过对金融学的学习,我们可以更好地理解…

AB测试面试题

AB测试面试题 常考AB测试问答题(1)AB测试的优缺点是什么?(2)AB测试的一般流程/介绍一下日常工作中你是如何做A/B实验的?(3)第一类错误 vs 第二类错误 vs 你怎么理解AB测试中的第一、二类错误?(4)统计显著=实际显著?(5)AB测试效果统计上不显著?(6)实验组优于对…

USR-M100采集数据并提交MQTT服务器

本文为记录备忘,不做过多解释。 模块自身带有2路数字量输入,2路模拟量输入,2路485接口 数字量接报警输入,模拟量接压力传感器,液位传感器,485接口分别接流量计,温湿度传感器。 正确接线&…

Octave 绘图快速入门指南

目录 1. 基本的 2D 绘图 2. 自定义图形样式 3. 绘制散点图 4. 绘制柱状图 5. 绘制直方图 6. 3D 绘图 6.6.1 3D 曲面图 6.6.2 3D 散点图 7. 绘制极坐标 8. 多子图绘制 总结 Octave 是一个类似于 MATLAB 的开源数学软件,广泛用于数值计算和数据分析。它提供…

RabbitMQ--基础篇

RabbitMQ 简介:RabbitMQ 是一种开源的消息队列中间件,你可以把它想象成一个高效的“邮局”。它专门负责在不同应用程序之间传递消息,让系统各部分能松耦合地协作 优势: 异步处理:比如用户注册后,主程序将发…

【MySQL】事务(重点)

目录 一、什么是事务: 二、事务的前置知识了解 引擎是否支持事务 事务的提交方式 事务操作的前置准备: 三、事务回滚: 四、事务崩溃: 原子性: 持久性: 五、自动提交和手动提交: 六、…

C++STL——stack,queue

stack与queue 前言容器适配器deque 前言 本篇主要讲解stack与queue的底层,但并不会进行实现,stack的接口 queue的接口 ,关于stack与queue的接口在这里不做讲解,因为通过前面的对STL的学习,这些接口都是大同小异的。 …

STM32智能手表:基于FreeRTOS

引言 随着物联网和可穿戴设备的快速发展,智能手表作为典型代表,集成了传感器数据采集、实时显示、无线通信等多项功能。本文将深入剖析一个基于STM32和FreeRTOS的智能手表项目,从硬件架构到软件设计,逐步讲解如何构建一个完整的嵌…

leetcode504.七进制数

标签:进制转换 机试真题 给定一个整数 num,将其转化为 7 进制,并以字符串形式输出。 示例 1: 输入: num 100 输出: "202" 示例 2: 输入: num -7 输出: "-10" 思路:求n进制就是循环取余数,…

中国古代史2

夏朝(公元前2070-公元前1600年) 1.禹建立了我国历史上第一个奴隶制国家–夏朝,定都阳城。禹传启,世袭制代替禅让制。 2.夏代都城:二里头遗址位于今河南洛阳偃师二里头村。发现了大型绿松石龙形器,被命名为…

死锁的形成

死锁的形成 背景学习资源死锁的本质 背景 面试可能会被问到. 学习资源 一个案例: https://www.bilibili.com/video/BV1pz421Y7kM 死锁的本质 互相持有对方的资源. 存在资源竞争都没有释放. 可能出现死锁. insert into demo_user (no, name) values (6, ‘test1’) on dupl…

MapReduce架构-打包运行

(一)maven打包 MapReduce是一个分布式运算程序的编程框架,是用户开发“基于Hadoop的数据分析应用”的核心框架。 MapReduce核心功能是将用户编写的业务逻辑代码和自带默认组件整合成一个完整的分布式运算程序(例如:jar…

C++发起Https连接请求

需要下载安装openssl //stdafx.h #pragma once #include<iostream> #include <openssl/ssl.h> #include <openssl/err.h> #include <iostream> #include <string>#pragma comment(lib, "libssl.lib") #pragma comment(lib, "lib…

ADI ADRV902x的射频模拟信号输入输出端口的巴伦匹配

根据规格书可知ADRV902x系列的&#xff1a; 【1】输入阻抗是100Ω差分&#xff0c;包括RX端口和ORX端口。 【2】输出阻抗是50Ω差分&#xff0c;包括TX端口。 而射频系统通常采用50Ω的单端走线&#xff0c;所以需要通过正确规格的巴伦完成差分转单端/单端转差分的处理。 巴…

【计算机视觉】OpenCV实战项目:Athlete-Pose-Detection 运动员姿态检测系统:基于OpenCV的实时运动分析技术

运动员姿态检测系统&#xff1a;基于OpenCV的实时运动分析技术 1. 项目概述1.1 技术背景1.2 项目特点 2. 技术架构与算法原理2.1 系统架构2.2 核心算法2.3 模型选择 3. 项目部署与运行指南3.1 环境准备硬件要求软件依赖 3.2 项目配置3.3 运行项目基本运行模式高级参数 4. 常见问…

linux perf top分析系统性能

1,看到内核宏是否支持perf功能 perf top -g 查看linux 内核宏定义 CONFIG_PERF_EVENTS=y CONFIG_HAVE_PERF_EVENTS=y CONFIG_FRAME_POINTER=y # 确保帧指针支持以捕获完整堆栈 2,使用perf top -g 报错 Access to performance monitoring and observability operations is l…