【Ragflow】22.RagflowPlus(v0.3.0):用户会话管理/文件类型拓展/诸多优化更新

概述

在历经三周的阶段性开发后,RagflowPlus顺利完成既定计划,正式发布v0.3.0版本。

开源地址:https://github.com/zstar1003/ragflow-plus

新功能

1. 用户会话管理

在后台管理系统中,新增用户会话管理菜单。在此菜单中,可以查看每个用户的聊天历史信息。

用户会话管理菜单功能演示

2. 知识库图像预览显示

在前台知识库管理界面中,增加了一块关联图片显示区域

如果chunk块具有关联图片,会在此区域显示。

关联图像显示示例

3. 解析文件类型拓展

v0.2.1版本中,解析仅支持三种简单类型:pdf、word、ppt。

v0.3.0版本对文件类型进行进一步拓展,目前支持各种主流文件类型,包括:pdf、word、ppt、excel、txt、md、html、jpg、png、bmp。

其中,对于excel类型,做了单独的处理优化。

每个表格会单独将每行作为一个独立的chunk块,同时会自动添加表格表头。

学生花名单-excel表格解析结果示例

上图展现了一个学生花名单的解析效果,通过自动添加表头,可以保证每列信息的准确含义,从而能够准确问答检索。

比如,我问某学生的学号,它能够找到正确的分块,从而进行回答。

信息查询问答实例:查询某学生的学号

此外,对于图像类型的文件,也能正常解析。

图像文件解析示例

4. 聊天对话字体动态调节

在前台聊天界面中,额外添加了一个设置按钮,可以动态调节聊天窗口显示的字体大小。

经测试,使用docker部署时,该功能可能不生效,仍需进行排查修复。

改进优化

1. 信息自定义排序

在后台管理系统中,大部分表格都配置了排序功能。

这样可以根据条件(如创建时间)进行排序,从而快速筛选出记录。

在向知识库添加文件时,也可以通过该方式,快速添加最新上传的文件内容。

点击表头,可升序/降序排列信息

2. 知识库创建优化

在知识库创建界面中,新增创建人选项,可以在已有用户中添加。

通过该选项,可为不同用户单独添加知识库。

新建知识库时,指定创建人

同时,对于每个知识库,新增修改选项,从而可以让知识库权限在个人和团队中自由设定。

知识库权限修改

3. 嵌入模型适配硅基流动API

v0.2.1版本中,后台解析并不支持配置的在线嵌入模型。

v0.3.0版本中,增加了对硅基流动平台的模型适配。

硅基流动平台的bge-m3可免费使用

如果不想在本地下载embedding模型,可以直接在硅基流动平台上,注册密钥,配置使用。

硅基流动地址:https://cloud.siliconflow.cn/i/J8xf97VO

具体修改方式是先用初始用户(第一个创建的用户)登录前台系统,配置好模型信息。

前台配置模型信息

配置完成后,后台测试嵌入模型配置时,信息自动更新。

后台配置模型连接测试

需要注意的是,对于同一个知识库,不能混用不同的解析模型,否则会出现异常。

为防止误操作,该版本强制统一嵌入模型为bge-m3,使用其它嵌入模型将可能无法正常工作。

4. 修复用户人数>10人时,团队添加成员显示不全问题

当前版本,团队中可自由添加所有成员,且默认采用倒序排序,可以快速选择新用户。

5. 修复用户创建时间异常问题

设置时区为东八区(UTC+8时区),解决用户创建时间显示异常问题。

6. 移除vllm的docker默认配置

docker配置文件中,移除vllm的默认容器配置,因为 vllm 默认拉取使用的模型是 float16 精度,导致众多用户因显存不足无法正常使用。

对于个人用户,推荐使用ollama,默认拉取的模型为 int4 精度,比较友好。

7. MinerU版本更新

采用当前最新版本的MinerU(v1.3.11),性能较先前版本会略有提升。

8. minio地址可编辑

docker/.env文件中,新增MINIO_VISIT_HOST用于动态控制minio上传文件时的ip地址。

如需将解析图片配置公网访问,可修改此地址为公网地址。

9. 其它优化

其它细碎更新点,不逐一罗列,具体可见仓库Commits记录。

下版本开发计划

下版本的工作重点将围绕临时文件上传和文档撰写两个功能项进行优化。

文件上传优化方向

在原版的 ragflow 中,用户在问答界面中,上传文件后,文件会自动将文件添加进知识库,并自动进行解析。

v0.3.0中,临时移除上传文件功能

ragflow-plus的改进思路是:将用户上传的文件进行临时解析,插入缓存数据库,而不是直接塞入存储库中。

根据解析得到的文件文本信息,作为问答参考的一部分。

文档撰写优化方向

文档撰写主要有以下优化方向:

  • 1.文档模板支持自定义

  • 2.文档内容支持暂存

  • 3.文档撰写时,调用单独的模型问答接口

  • 4.支持问答结果的流式输出

  • 5.导出word时,支持图文内容

该方向部分功能原本计划在此版本完成,但鉴于鸽🕊得过久,移到下版本在做。

问题反馈

在使用过程中,如遇到问题,可以在开源仓库中提交issue。

提交同时,推荐附上容器日志信息,比如在后台管理系统中,遇到解析失败的问题,可以查看后台容器日志信息:

docker logs ragflowplus-management-backend

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/pingmian/81228.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

c++重要知识点汇总(不定期更新)

前言 真心希望各位dalao点赞收藏~ 树状数组 作用:高效求出区间前缀和,允许进行修改操作。 举个栗子: 刚开始有8项,分别为1-8。 首先构建二叉树: 1-8/ |/ |/ |/ |/ |1-4 5-8/ | / |/ | / |1-…

Predict Podcast Listening Time-(回归+特征工程+xgb)

Predict Podcast Listening Time 题意: 给你没个播客的信息,让你预测观众的聆听时间。 数据处理: 1.构造新特征收听效率进行分组 2.对数据异常处理 3.对时间情绪等进行数值编码 4.求某特征值求多项式特征 5.生成特征组合 6.交叉验证并enc…

Class类的详细说明

Class类的详细说明 Class 类是Java反射机制的核心,每个Java类或接口在JVM中都有一个对应的 Class 对象,用于表示该类的元数据(如类名、方法、字段、构造器等)。以下是其核心知识点: 1. 获取Class对象的三种方式 方式…

[逆向工程]C++实现DLL注入:原理、实现与防御全解析(二十五)

[逆向工程]C实现DLL注入:原理、实现与防御全解析(二十五) 引言 DLL注入(DLL Injection)是Windows系统下实现进程间通信、功能扩展、监控调试的核心技术之一。本文将从原理分析、代码实现、实战调试到防御方案&#x…

【ROS2实战】在中国地区 Ubuntu 22.04 上安装 ROS 2 Humble 教程

本文介绍如何在中国大陆环境下顺利安装 ROS 2 Humble,包括使用清华镜像源、解决 locale 和 GPG 密钥问题、安装 ROS 软件包以及配置自动环境加载。 🌟 ROS 2 版本简介 ROS 2 是机器人操作系统的第二代版本,目前主要有两个长期支持&#xff0…

嵌入式学习笔记 - STM32 ADC 模块工作模式总结

ADC 模式总结: 一 单ADC模式(是指ADC1,ADC2,ADC3中只有一个ADC被使用) ①单通道: 非连续模式:非连续的意思就是单次,一次转换完成后就停止转换,除非再次被软件或者被外部触发启动&#xff1b…

Python训练打卡Day26

函数专题1:函数定义与参数 知识点回顾: 函数的定义变量作用域:局部变量和全局变量函数的参数类型:位置参数、默认参数、不定参数传递参数的手段:关键词参数传递参数的顺序:同时出现三种参数类型时 到目前为…

使用Docker部署Nacos

sudo systemctl start docker sudo systemctl enable docker docker --version 步骤 2: 拉取 Nacos Docker 镜像 拉取 Nacos 镜像: 你可以从 Docker Hub 上拉取官方的 Nacos 镜像,使用以下命令: docker pull nacos/nacos-server 这会从 …

Ubuntu 添加系统调用

实验内容 通过内核编译法添加一个不用传递参数的系统调用,其功能可自定义。 (1)添加系统调用号,系统会根据这个号找到syscall_table中的相应表项。具体做法是在syscall_64.tbl文件中添加系统调用号和调用函数的对应关系。 &#…

Javascript:WebAPI

获取网页元素 queryselector queryselector是 JavaScript 中用于选择 DOM 元素的重要方法,它允许使用 CSS 选择器语法来查找页面中的元素。 一般queryselector获取的元素都是html中第一个选择器的元素 支持选择器类型:类选择器(.class) &#xff0c…

十二、Hive 函数

作者:IvanCodes 日期:2025年5月1日 专栏:Hive教程 在数据处理的广阔天地中,我们常常需要对数据进行转换、计算、清洗或提取特定信息。Hive 提供了强大的内置运算符和丰富的内置函数库,它们就像魔法师手中的魔法棒&…

Linux之Nginx安装及配置原理篇(一)

Nginx安装及配置 前情回顾 首先针对Nginx进程模型,我们回顾一下它的原理机制,我们知道它是通过Master通过fork分发任务节点给予work节点,然后work节点触发了event事件,之后通过一个access_muttex互斥锁,来单线程调用我…

嵌入式培训之数据结构学习(五)栈与队列

一、栈 (一)栈的基本概念 1、栈的定义: 注:线性表中的栈在堆区(因为是malloc来的);系统中的栈区存储局部变量、函数形参、函数返回值地址。 2、栈顶和栈底: 允许插入和删除的一端…

深度学习---知识蒸馏(Knowledge Distillation, KD)

一、知识蒸馏的本质与起源 定义: 知识蒸馏是一种模型压缩与迁移技术,通过将复杂高性能的教师模型(Teacher Model)所学的“知识”迁移到轻量级的学生模型(Student Model),使学生模型在参数量和计…

ARP Detection MAC-Address Static

一、ARP Detection(ARP检测) ✅ 定义: ARP检测是一种防止ARP欺骗攻击的安全机制。它通过监控或验证网络中的ARP报文,来判断是否存在伪造的ARP信息。 🔍 工作原理: 网络设备(如交换机&#xf…

基于 Python 的界面程序复现:标准干涉槽型设计计算及仿真

基于 Python 的界面程序复现:标准干涉槽型设计计算及仿真 在工业设计与制造领域,刀具的设计与优化是提高生产效率和产品质量的关键环节之一。本文将介绍如何使用 Python 复现一个用于标准干涉槽型设计计算及仿真的界面程序,旨在帮助工程师和…

Python绘制南丁格尔玫瑰图:从入门到实战

Python绘制南丁格尔玫瑰图:从入门到实战 引言 南丁格尔玫瑰图(Nightingale Rose Chart),也被称为极区图(Polar Area Chart),是一种独特的数据可视化方式。这种图表由弗洛伦斯南丁格尔&#xff…

计算机操作系统概要

不谋万世者,不⾜谋⼀时。不谋全局者 ,足谋⼀域 。 ——陈澹然《寤⾔》《迁都建藩议》 操作系统 一.对文件简单操作的常用基础指令 ls ls 选项 目录或⽂件名:罗列当前⽬录下的⽂件 -l:以长格式显示⽂件和⽬录的详细信息 -a 或 --all&…

<PLC><视觉><机器人>基于海康威视视觉检测和UR机械臂,如何实现N点标定?

前言 本系列是关于PLC相关的博文,包括PLC编程、PLC与上位机通讯、PLC与下位驱动、仪器仪表等通讯、PLC指令解析等相关内容。 PLC品牌包括但不限于西门子、三菱等国外品牌,汇川、信捷等国内品牌。 除了PLC为主要内容外,相关设备如触摸屏(HMI)、交换机等工控产品,如果有…

从专家编码到神经网络学习:DTM 的符号操作新范式

1st author: Paul Soulos paper: Differentiable Tree Operations Promote Compositional Generalization ICML 2023 code: psoulos/dtm: Differentiable Tree Machine 1. 问题与思路 现代深度学习在连续向量空间中取得了巨大成功,然而在处理具有显式结构&#x…