我做了一个本地AI搜索工具,今天正式开源了!

前言

花了一段时间,我终于把小遥搜索 XiaoyaoSearch做出来了。

这是一个支持语音、文本、图片多模态输入的本地AI搜索桌面应用。最特别的是,它100%通过Vibe Coding(AI辅助编程)实现,从零开始,所有源码、设计文档、开发经验,今天全部开源。


为什么要做这个工具?

作为知识工作者,我经常遇到这些痛点:

  • 文件太多找不到:电脑里存了成千上万个文档、图片、音视频,想找个特定内容翻半天
  • 搜索不够智能:系统自带的搜索只能匹配文件名,搜不到文件内容
  • 隐私安全担忧:很多搜索工具要上传数据到云端,不太放心
  • AI工具太复杂:想用AI提升效率,但不会配置,门槛太高

所以我就想:能不能做一个本地运行的、支持多种输入方式的AI搜索工具?


小遥搜索是什么?

简单来说,它是一个本地AI搜索桌面应用,核心特点:

🎤 多模态输入

  • 语音搜索:点一下录音,说出你要找的内容,30秒内语音自动转文字搜索
  • 文本搜索:输入关键词,AI理解语义,精准匹配文件内容
  • 图片搜索:上传一张图片,AI理解图像内容,帮你搜索相关文件

🔍 深度检索

  • 文档:TXT、Markdown、Word、Excel、PPT、PDF 全文检索
  • 音视频:MP4、AVI、MP3、WAV 内容索引和搜索(支持10分钟内音视频字幕提取)
  • 文件名:传统的文件名搜索也不缺席

🧠 AI技术

集成了多个先进AI模型:

  • BGE-M3:文本嵌入,理解语义
  • FasterWhisper:语音识别,语音转文字
  • CN-CLIP:图像理解,以图搜图
  • Ollama:本地大语言模型

🔒 隐私安全

  • 完全本地:所有数据处理都在本地,不上传云端
  • 隐私模式:可选不记录搜索历史
  • 自主可控:数据完全由你自己掌控

核心界面一览

搜索主界面

文本搜索

语音搜索

图片搜索


技术架构

前端:Electron + Vue 3 + TypeScript 后端:Python 3.10 + FastAPI AI引擎:BGE-M3 + FasterWhisper + CN-CLIP + Ollama 搜索:Faiss(向量搜索)+ Whoosh(全文搜索) 数据库:SQLite

系统架构图


Vibe Coding 实践案例

这是我特别想分享的部分。

这个项目从零开始,完全通过Vibe Coding实现,包括:

  • ✅ 完整源代码(前端 + 后端 + 所有功能模块)
  • ✅ 设计文档(PRD、技术方案、数据库设计、API文档)
  • ✅ 开发流程(任务分解、进度跟踪、测试验证)
  • ✅ 部署配置(环境搭建、依赖管理、打包发布)

开源的价值:对于想要学习AI辅助开发、本地AI应用、Electron桌面应用的开发者,这是一个完整的参考实现。


快速体验

环境要求

  • 操作系统:Windows / MacOS / Linux
  • Python:3.10.11+
  • Node.js:21.x+
  • 内存:建议8GB以上

安装步骤

1. 克隆项目
git clone https://github.com/dtsola/xiaoyaosearch.git cd xiaoyaosearch
2. 后端启动
cd backend pip install -r requirements.txt python main.py
3. 前端启动
cd frontend npm install npm run dev

详细安装指南:README.md


产品路线图

当前版本(v1.1.1)✅

  • 多模态AI搜索(语音、文本、图片)
  • 本地文件深度检索
  • AI模型灵活配置
  • 隐私安全保护

未来规划

🚀 微内核架构演进

插件化系统,支持自定义扩展

🌐 多数据源扩展
  • 文档协作平台(语雀、飞书、Notion)
  • 项目管理平台(Jira、禅道、GitHub)
  • 实时同步和智能缓存
🎬 音视频搜索增强
  • 视频画面内容理解和搜索
  • 长视频处理(集成水母平台)
  • 音频声纹识别和情感分析
🧠 RAG系统升级
  • 自适应分块算法
  • 知识图谱构建
  • 检索结果智能增强
💬 智能聊天助手
  • 多轮对话和上下文记忆
  • 基于本地知识库的问答
🔌 MCP能力集成

连接Claude生态,扩展AI能力

详细路线图:ROADMAP.md


适合谁使用?

知识工作者

搜索本地文档、笔记、研究报告,快速定位关键信息

内容创作者

搜索素材和灵感,整理音视频内容,管理创作资源

技术开发者

搜索代码库和技术文档,整理学习资料,管理项目文件

研究人员

搜索论文和研究资料,整理文献笔记,管理研究数据


邀请你参与

为什么需要你?

一个人的力量有限,开源社区的力量是无限的!

优先贡献方向

  1. 插件系统开发(高优先级)
    • 设计插件接口规范
    • 实现插件加载机制
  1. 多数据源连接器(高优先级)
    • 语雀、飞书、Notion API集成
  1. UI/UX优化(中优先级)
    • 搜索结果展示优化
    • 暗色模式支持
  1. 性能优化(中优先级)
    • 大文件处理优化
    • 索引构建速度提升
  1. 测试覆盖(中优先级)
    • 单元测试补充
    • 集成测试完善

如何贡献?

# 1. Fork 项目 # 2. 创建分支 git checkout -b feature/your-feature-name # 3. 提交代码 git commit -m "feat: 添加XX功能" git push origin feature/your-feature-name # 4. 提交 Pull Request

贡献者权益

  • 📝 在贡献者列表中展示你的名字
  • 🏆 对项目有重大贡献者可成为核心维护者
  • 💼 优秀贡献者可获得推荐信或工作机会

项目地址

GitHub:https://github.com/dtsola/xiaoyaosearch

欢迎:

  • ⭐️Star本项目,关注最新进展
  • 🍴Fork本项目,开始你的贡献
  • 👀Watch本项目,及时获取更新
  • 🐛提Issue,报告问题和建议功能
  • 💡参与讨论,分享你的想法

关于我

dtsola- IT解决方案架构师 | 一人公司实践者

  • 网站:https://www.dtsola.com
  • B站:https://space.bilibili.com/736015

开源协议

本项目采用小遥搜索软件授权协议

  • ✅ 免费使用(非商业用途)
  • ✅ 可以学习和研究代码
  • ✅ 可以修改后二次分发(需保留版权声明和协议)
  • ✅ 可以集成到其他非商业项目
  • ❌ 商业使用需授权

这是一个类似 CC-BY-NC-SA 的开源协议,鼓励学习、分享和贡献!

详细协议:LICENSE


结语

小遥搜索是我对本地AI搜索工具的一次探索和实践,也是Vibe Coding的完整案例展示。

我相信,开源社区的力量会让这个项目变得更好。

无论你是:

  • 🔨 想要贡献代码的开发者
  • 💡 想要提供建议的产品经理
  • 📖 想要学习AI应用的学生
  • 🚀 想要参与创业的伙伴

都欢迎加入我们,一起打造更好的本地AI搜索工具!

让我们一起,用AI技术改变知识管理方式!🚀


#独立开发者 #知识工作者 #知识库 #AI工具 #内容创作者 #一人公司 #ai搜索 #dify #ragflow #vibecoding

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/1195727.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

【C++数据结构进阶】玩转并查集:从原理到实战,C++ 达成与高频面试题全解析

pre { white-space: pre !important; word-wrap: normal !important; overflow-x: auto !important; display: block !important; font-family: "Consolas", "Monaco", "Courier New", …

我用 XinServer 给客户做后台,效率翻 3 倍

我用 XinServer 给客户做后台,效率翻 3 倍 兄弟们,最近接了个外包项目,客户要一个带用户管理、内容发布、数据统计的管理后台,时间紧任务重。要是放以前,我肯定得拉着后端兄弟一起,先定接口文档&#xff0c…

ARMxy BL335 智慧农业实践:秦安水蜜桃智慧种植与冷链保鲜一体化方案

在很多果农眼里,水蜜桃是一门“看天吃饭、看人下手”的生意。什么时候升温、什么时候控湿、什么时候浇水、什么时候入库,全靠经验。 但在秦安,一套用数据说话、用系统控环境的水蜜桃种植新模式,已经跑通。 今天,我…

基于Python的出行路线规划与推荐系统的设计与实现-计算机毕业设计源码+无LW文档

基于Python的出行路线规划与推荐系统的设计与实现 摘要:本文围绕基于Python的出行路线规划与推荐系统展开,阐述了其设计与实现过程。随着交通出行需求的增长和技术的进步,此类系统具有重要价值。系统采用相关技术架构,具备路线类型…

企业网盘可以在局域网使用吗?

根据《中国互联网络发展状况统计报告》显示,截至今年上半年,中国网民总数已突破10亿,且其中超过9亿人具备个人文件存储需求。不少企业也在数字化转型的过程中意识到,长期以来传统的文件管理模式已经无法满足业务高速发展和协作效率…

Cortex-M系列,Cortex-A系列,汇编启动文件的区别

Cortex-M系列:可以不自己写汇编启动代码,因为芯片厂商提供了完整的启动文件,但理解汇编对调试和优化很重要。 Cortex-A系列:通常需要懂汇编启动原理,但实际开发中常使用现成的bootloader(如U-Boot&#xf…

中央音乐学院联合研究:视频自动配乐还卡点

中央音乐学院联合研究:视频自动配乐还卡点论文标题: Video Echoed in Music: Semantic, Temporal, and Rhythmic Alignment for Video-to-Music Generation 作者团队: 中央音乐学院、北京大学、阿里巴巴等 发布时间: …

Django项目,sqlite版本太低问题

报错 命令:python manage.py runerver 0.0.0.0:8001 原因:django版本更新,需要使用更高版本的sqlite,但是sqlite在python中被内置,无法直接升级卸载 Traceback (most recent call last): File "/home/project/new…

基于Python的大学生就业信息推荐系统的设计与实现-计算机毕业设计源码+无LW文档

基于Python的大学生就业信息推荐系统的设计与实现 摘要:本文详细阐述了基于Python的大学生就业信息推荐系统的设计与实现过程。随着高校扩招及就业形势变化,大学生就业信息获取与匹配面临挑战。该系统利用Python相关技术,具备用户管理、招聘信…

IVT 映像向量表, DCD 设备配置数据

一、IVT(Image Vector Table,映像向量表)作用:ROM的"导航地图",告诉ROM:程序入口在哪(entry)硬件配置在哪(指向DCD)镜像信息在哪(指向B…

企业网盘收费吗?企业网盘收费标准

根据《中国企业数字化转型白皮书》的数据显示,超过87%的企业正在积极采用云计算和企业网盘等数字化工具,帮助优化业务流程,提高团队协作效率,并增强数据安全性。 在这个信息化深度渗透各行各业的时代,企业网盘早已不只…

2026年国产冻干机厂家权威推荐榜:大型冻干机/实验室冻干机/真空冻干机/中试型冻干机/国产药用冻干机/真空冷冻冻干机选择指南

2026年国产冻干机厂家权威推荐榜:大型冻干机/实验室冻干机/真空冻干机/中试型冻干机/国产药用冻干机/真空冷冻冻干机选择指南行业背景与市场概况冷冻干燥技术(冻干技术)作为现代生物医药、食品科学、材料科学等领域…

ollama

ollama.exe下载 https://modelscope.cn/models/Lixiang/ollama-release ollama run 在资源管理器地址栏输入 %USERPROFILE%\.ollama。 新建 config.json 文件,内容如下: { "registry": { "mirrors": { "r…

深圳金鑫磁材|深圳坡莫合金磁芯:如何实现“磁导率”百万级跃升

在5G通信、新能源汽车、高精度医疗设备等尖端科技领域,磁性材料作为能量转换与信号传输的核心载体,其性能直接决定了设备的效率与精度。深圳作为中国高端制造业的标杆城市,依托完整的产业链配套与持续的技术创新,已成为全球坡莫合…

2026最新招投标系统、采购管理系统深水区:TOP5平台全景解析

随着“人工智能 + 采购”行动与信创战略的深度融合,2026年采购数字化市场呈现 “技术深耕、场景细分、合规升级” 三大特征。企业选型已从“功能堆砌”转向“全链路适配 + 长期运维保障”,结合100+政企实践案例调研、…

什么网盘能够解决超大文件传输难题?

一、超大文件传输为何成为难题?现代社会的数字化程度从未像今天这样深刻影响我们的生活和工作。先做一个简单的思维试验:每次需要传输视频文件、设计素材、数据库备份或者超大文档时,你是不是曾经历过以下这些问题?电子邮件容量有…

WPF 用户控件(UserControl)继承

在WPF项目中,你是否遇到过希望编写一个UserControl继承自另一个UserControl的场景? 比如下面:DerivedUserControl继承自BaseUserControl UserControl继承另一个UserControl 步骤: 1、新建一个UserControl命名为 Ba…

2026年贵州装修设计公司TOP5推荐:三修设计工作室领衔口碑榜单

引言 随着贵州城镇化进程加快与居民生活品质提升,家装行业正从“满足功能”迈向“追求体验”的新阶段。消费者不再仅关注价格,更看重设计审美、施工质量、服务透明度与长期信任关系。在此背景下,一批深耕本地、注重…

Windows系统下Git换行符问题的完整解决方案

这个问题是换行符差异导致的,通常是 CRLF(\r\n) 和 LF(\n) 在 Windows 和 Unix/Linux 系统之间的差异。 如果你使用的是小乌龟,通过修改小乌龟的设置即可解决问题,亲测有效。 常见解决方案&a…

基于Django的在线考试与评估系统设计与实现-计算机毕业设计源码+无LW文档

基于Django的在线考试与评估系统设计与实现 摘要:本文详细阐述了基于Django的在线考试与评估系统的设计与实现过程。随着教育信息化的快速发展,传统考试模式面临诸多挑战,在线考试与评估系统应运而生。该系统采用Django框架,具备学…