解决安装PyMuPDF(也被称为fitz库)的问题(可成功安装且使用)

解决安装PyMuPDF(也被称为fitz库)的问题(可成功安装且使用)

  • 安装方法:
  • 一些安装时报错的原因解析:
    • 报错1:
    • 报错2:
    • 报错3-无效的分发包警告:
    • 报错4:
  • 使用实例

在使用PyMuPDF 发现 直接pip install PyMuPDF 会安装失败或者安装后无法使用

安装方法:

1.在https://pypi.org/project/PyMuPDF/#files 查找到适合自己电脑python版本的.whl文件
2.下载.whl文件在当前项目目录下,以PyMuPDF-1.23.26-cp310-none-win_amd64.whl为例

3,在终端命令行输入 pip install PyMuPDF-1.23.26-cp310-none-win_amd64.whl即可

在这之前,需要把安装错误的卸载掉

一些安装时报错的原因解析:

报错1:

pip install PyMuPDF-1.23.26-cp312-none-win_amd64.whl ERROR:
PyMuPDF-1.23.26-cp312-none-win_amd64.whl is not a supported wheel on this platform.

错误信息表明 PyMuPDF-1.23.26-cp312-none-win_amd64.whl 不是一个在您当前平台上受支持的 wheel 文件。这通常是因为 wheel 文件是为特定的 Python 版本和操作系统构建的。cp312 表示这个 wheel 文件是为 Python 3.12 版本构建的,而 win_amd64 表示它是为 Windows 64 位系统构建的。要选择适合自己的版本

报错2:

pip 版本过旧:有时候,较旧的 pip 版本可能无法正确识别或安装某些 wheel 文件。请尝试更新 pip 到最新版本:

python -m pip install --upgrade pip

报错3-无效的分发包警告:

WARNING: Ignoring invalid distribution -illow
(c:\users\zhuang\pycharmprojects\pythonproject2\venv\lib\site-packages)
WARNING: Ignoring invalid distribution -atplotlib
(c:\users\zhuang\pycharmprojects\pythonproject2\venv\lib\site-packages)

这些警告表明在您的虚拟环境site-packages目录中,存在某些名称不正确的分发包。可能是在安装或升级包时出现了问题,导致包的元数据受损。您可以尝试删除这些损坏的包并重新安装它们。

进入c:\users\zhuang\pycharmprojects\pythonproject2\venv\lib\site-packages找到相关的包,删除以~为开头的相关文件夹即可
在这里插入图片描述

报错4:

Installing collected packages: PyMuPDFb, PyMuPDF Successfully
installed PyMuPDF-1.23.26 PyMuPDFb-1.23.22WARNING: You are using pip version 21.3.1; however, version 24.0 is available.

在安装过程中,pip似乎又尝试从缓存中安装了一个名为 PyMuPDFb 的包,并且成功安装了 PyMuPDF 和 PyMuPDFb 两个包。这可能是因为您有一个名为 PyMuPDFb 的依赖项在您的 requirements.txt 文件中或者是由其他某个过程触发的

如果 PyMuPDFb 不是一个您需要的包,您可能想要卸载它以避免潜在的冲突。您可以使用以下命令来卸载它:pip uninstall PyMuPDFb

使用实例

使用PyMuPDF(也被称为fitz库)来获取PDF文献的标题通常涉及读取PDF的元数据。PDF文档的元数据可以包含诸如标题、作者、创建日期等信息。以下是一个基本的示例,

import fitz  # PyMuPDF的别名  # 打开PDF文件  
pdf_path = 'path_to_your_document.pdf'  # 替换为你的PDF文件路径  
doc = fitz.open(pdf_path)  # 获取PDF的元数据字典  
metadata = doc.metadata  # 尝试从元数据字典中获取标题  
title = metadata.get('title')  if title:  print(f"PDF标题: {title}")  
else:  print("PDF标题未找到。")  # 关闭文档  
doc.close()

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/744970.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

SpringBoot异常:Unsatisfied dependency expressed through field ‘mapper‘解决办法

在创建SpringBoot项目时,项目页面报错,显示Bean错误时,原因是底层原因无法找到Mapper文件的依赖关系,导致Spring无法自动装配 Caused by: org.springframework.beans.factory.NoSuchBeanDefinitionException: No qualifying bean …

电子学会 2023.03 Python 3级(yanpuxin)

十进制数111转换成二进制数是? 1、十进制数111转换成二进制数是?( ) A 111 B 1111011 C 101111 D 1101111 正确答案:D 试题解析: 十进制转二进制,采用除二倒取余数,直到商为0为止。 2、某班有36人…

YOLO v8:目标检测的最新王者

本文来自公众号“AI大道理” —————— Yolov8是Yolo系列模型的最新王者,各种指标全面超越现有目标检测模型。 Yolov8借鉴了Yolov5、Yolov6、YoloX等模型的设计优点,全面改进了Yolov5模型结构,同时保持了Yolov5工程化简洁易用的优势。 …

hex文件格式解析

本文框架 1. hex文件格式1.1 数据长度1.2 地址域1.3 数据类型1.4 数据域1.5 CRC校验域 本文对hex文件格式进行解析,介绍各部分组成及其含义,在此mark下,方便后续开发脚本对hex文件进行操作。 1. hex文件格式 Intel HEX文件是由一行行符合Int…

Vue3调用钉钉api,内嵌H5微应用单点登录对接

钉钉内嵌H5微应用单点登录对接 https://open.dingtalk.com/document/isvapp/obtain-the-userid-of-a-user-by-using-the-log-free 前端需要的代码 1、安装 dingtalk-jsapi npm install dingtalk-jsapi2、在所需页面引入 import * as dd from dingtalk-jsapi; // 引入钉钉a…

揭秘阿里巴巴中国站1688商品详情API的奥秘:如何高效获取数据?

阿里巴巴中国站1688并没有公开的商品详情API供普通开发者使用。其API主要服务于官方应用、合作伙伴和内部使用。对于普通的第三方开发者或商家,获取1688的商品详情数据通常需要通过爬虫技术或官方的数据服务接口(如果有的话)。 但请注意&…

使用vscode+clangd+bear+publickeyssh远程开发Linux程序

目录 配置ssh密钥远程登录登录远程Linux主机安装必要软件安装vscode插件1.安装remote-ssh插件2.通过vscode远程连接到linux机器3.在远程安装插件clangd4.关闭C/C Intellense engine 使用vscodeclangdbear1.修改Makefile2.编译内核3.结果 配置ssh密钥远程登录 一定要配置成密钥…

MyBatis 之四:结果映射和关联映射

结果映射 当查询的 SQL 中&#xff0c;出现了表字段名和实体类属性名不一致情况时&#xff0c;需要指定映射关系 常见方式&#xff1a; 使用 SQL 的 AS 别名方式ResultMap 方式 普通属性映射配置 第一步&#xff1a;编写结果映射 <resultMap id"empMap" type&qu…

暗光增强——IAT网络推理测试(详细图文教程)

IAT模型由两个独立的分支组成&#xff0c;局部分支用于像素调整&#xff0c;并输出两个用于加法和乘法的特征图。全局分支用于全局调整并输出颜色矩阵和gamma值&#xff0c;全局分支受DETR启发&#xff0c;网络通过动态查询学习的方式更新颜色矩阵和gamma值。整个模型只有超过9…

Pytorch入门实战 P2-CIFAR10彩色图片识别

目录 一、前期准备 1、数据集CIFAR10 2、判断自己的设备&#xff0c;是否可以使用GPU运行。 3、下载数据集&#xff0c;划分好训练集和测试集 4、加载训练集、测试集 5、取一个批次查看下 6、数据可视化 二、搭建简单的CNN网络模型 三、训练模型 1、设置超参数 2、编…

脚手架原理之webpack处理html文件和模块打包

脚手架原理之webpack处理html文件和模块打包 为了更好的理解项目脚手架的使用&#xff0c;我们来学习一下webpack工具&#xff0c;因为脚手架的底层就是基于webpack工具实现的。 安装 webpack工具是基于nodejs的&#xff0c;所以首先要有nodejs环境&#xff0c;其次需要下载…

Linux学习-shell

目录 Shell: 3.Shell命令: command [-options] arg1 arg2 .. 1.Shell基本命令: 2.文件查看命令: 3.文件查找命令: 通配符: 7.压缩解压命令: 8.让虚拟机上网: 9.apt-get工具集: Shell: 1.保护Linux内核(用户和Linux内核不直接操作,通过操作Shell,Shell和内核交互) 2.命令…

【CSP试题回顾】201709-3-JSON查询

CSP-201709-3-JSON查询 解题思路 1. 初始化数据结构 map<string, string> strContent: 存储字符串类型属性的内容。键是属性名&#xff08;可能包含通过点.连接的多级属性名&#xff09;&#xff0c;值是属性的字符串值。vector<string> keyVec: 存储当前正在处…

Java基础知识总结(1)

Java概况 JavaSE是java分类中的标准版&#xff0c;是刚接触java要学习的基础知识。 JavaEE是java分类中的企业版&#xff0c;是java中的高级&#xff0c;涉及到的知识广泛。 JavaME中M是Micro的缩写&#xff0c;用在嵌入式等电子设备中。 Java软件工程师&#xff1a;通过Ja…

TongWeb+springboot部署war包失败问题

1.版本问题 关于 springboot2x 以上版本要用Tongweb6.1.7.5 以上版本 否则启动会各种报错 2.JPA冲突 TongWeb自带JPA&#xff0c;所以如果项目用的是hibernate的JPA 如:Spring Data JPA 那么就会冲突 解决方案: 找到 /TongWeb安装目录/bin 下面有个external.vimoptions文件…

Java必须掌握的遍历字符串和个数(含面试大厂题含源码)

在Java编程中&#xff0c;遍历字符串和统计字符个数是非常基础且常用的技能。下面我将介绍一些必须掌握的相关知识点和示例代码&#xff1a; 1. 字符串遍历 遍历字符串意味着逐个访问字符串中的每个字符。在Java中&#xff0c;可以使用for循环或charAt方法来实现。 使用for循…

【DAY11 软考中级备考笔记】数据结构 排序操作系统

数据结构 排序&&操作系统 3月14日 – 天气&#xff1a;晴 今天天气非常热&#xff0c;已经到20度了&#xff0c;春天已经来了。 1. 堆排序 堆排序的思想是首先建立一个堆&#xff0c;然后弹出堆顶元素&#xff0c;剩下的元素再形成一个堆&#xff0c;然后继续弹出元素&…

为什么要用scrapy爬虫库?而不是纯python进行爬虫?

为什么要用scrapy爬虫库&#xff1f;而不是纯python进行爬虫&#xff1f; Scrapy的优点Scrapy节省的工作使用纯Python编写爬虫的不足 Scrapy是一个使用Python编写的开源和协作的web爬虫框架&#xff0c;它被设计用于爬取网页数据并从中提取结构化数据。Scrapy的强大之处在于其广…

js进阶-函数参数-展开预算符-解构

一.函数参数 动态参数 剩余参数 1.1 动态参数 arguments是函数内部内置的伪数组变量&#xff0c;它包含了调用函数时传入的所有实参 function getSum() {// arguments 动态参数 只存在于 函数里面// 是伪数组 里面存储的是传递过来的实参console.log(arguments) // Argument…

自注意力机制函数(SelfAttention)python实现

Self-Attention。和Attention类似都是一种注意力机制。不同的是Attention是source对target&#xff0c;输入的source和输出的target内容不同。例如英译中&#xff0c;输入英文&#xff0c;输出中文。而Self-Attention是source对source&#xff0c;是source内部元素之间或者targ…