前言
花了一段时间,我终于把小遥搜索 XiaoyaoSearch做出来了。
这是一个支持语音、文本、图片多模态输入的本地AI搜索桌面应用。最特别的是,它100%通过Vibe Coding(AI辅助编程)实现,从零开始,所有源码、设计文档、开发经验,今天全部开源。
为什么要做这个工具?
作为知识工作者,我经常遇到这些痛点:
- 文件太多找不到:电脑里存了成千上万个文档、图片、音视频,想找个特定内容翻半天
- 搜索不够智能:系统自带的搜索只能匹配文件名,搜不到文件内容
- 隐私安全担忧:很多搜索工具要上传数据到云端,不太放心
- AI工具太复杂:想用AI提升效率,但不会配置,门槛太高
所以我就想:能不能做一个本地运行的、支持多种输入方式的AI搜索工具?
小遥搜索是什么?
简单来说,它是一个本地AI搜索桌面应用,核心特点:
🎤 多模态输入
- 语音搜索:点一下录音,说出你要找的内容,30秒内语音自动转文字搜索
- 文本搜索:输入关键词,AI理解语义,精准匹配文件内容
- 图片搜索:上传一张图片,AI理解图像内容,帮你搜索相关文件
🔍 深度检索
- 文档:TXT、Markdown、Word、Excel、PPT、PDF 全文检索
- 音视频:MP4、AVI、MP3、WAV 内容索引和搜索(支持10分钟内音视频字幕提取)
- 文件名:传统的文件名搜索也不缺席
🧠 AI技术
集成了多个先进AI模型:
- BGE-M3:文本嵌入,理解语义
- FasterWhisper:语音识别,语音转文字
- CN-CLIP:图像理解,以图搜图
- Ollama:本地大语言模型
🔒 隐私安全
- 完全本地:所有数据处理都在本地,不上传云端
- 隐私模式:可选不记录搜索历史
- 自主可控:数据完全由你自己掌控
核心界面一览
搜索主界面
文本搜索
语音搜索
图片搜索
技术架构
前端:Electron + Vue 3 + TypeScript 后端:Python 3.10 + FastAPI AI引擎:BGE-M3 + FasterWhisper + CN-CLIP + Ollama 搜索:Faiss(向量搜索)+ Whoosh(全文搜索) 数据库:SQLite系统架构图
Vibe Coding 实践案例
这是我特别想分享的部分。
这个项目从零开始,完全通过Vibe Coding实现,包括:
- ✅ 完整源代码(前端 + 后端 + 所有功能模块)
- ✅ 设计文档(PRD、技术方案、数据库设计、API文档)
- ✅ 开发流程(任务分解、进度跟踪、测试验证)
- ✅ 部署配置(环境搭建、依赖管理、打包发布)
开源的价值:对于想要学习AI辅助开发、本地AI应用、Electron桌面应用的开发者,这是一个完整的参考实现。
快速体验
环境要求
- 操作系统:Windows / MacOS / Linux
- Python:3.10.11+
- Node.js:21.x+
- 内存:建议8GB以上
安装步骤
1. 克隆项目
git clone https://github.com/dtsola/xiaoyaosearch.git cd xiaoyaosearch2. 后端启动
cd backend pip install -r requirements.txt python main.py3. 前端启动
cd frontend npm install npm run dev详细安装指南:README.md
产品路线图
当前版本(v1.1.1)✅
- 多模态AI搜索(语音、文本、图片)
- 本地文件深度检索
- AI模型灵活配置
- 隐私安全保护
未来规划
🚀 微内核架构演进
插件化系统,支持自定义扩展
🌐 多数据源扩展
- 文档协作平台(语雀、飞书、Notion)
- 项目管理平台(Jira、禅道、GitHub)
- 实时同步和智能缓存
🎬 音视频搜索增强
- 视频画面内容理解和搜索
- 长视频处理(集成水母平台)
- 音频声纹识别和情感分析
🧠 RAG系统升级
- 自适应分块算法
- 知识图谱构建
- 检索结果智能增强
💬 智能聊天助手
- 多轮对话和上下文记忆
- 基于本地知识库的问答
🔌 MCP能力集成
连接Claude生态,扩展AI能力
详细路线图:ROADMAP.md
适合谁使用?
知识工作者
搜索本地文档、笔记、研究报告,快速定位关键信息
内容创作者
搜索素材和灵感,整理音视频内容,管理创作资源
技术开发者
搜索代码库和技术文档,整理学习资料,管理项目文件
研究人员
搜索论文和研究资料,整理文献笔记,管理研究数据
邀请你参与
为什么需要你?
一个人的力量有限,开源社区的力量是无限的!
优先贡献方向
- 插件系统开发(高优先级)
- 设计插件接口规范
- 实现插件加载机制
- 多数据源连接器(高优先级)
- 语雀、飞书、Notion API集成
- UI/UX优化(中优先级)
- 搜索结果展示优化
- 暗色模式支持
- 性能优化(中优先级)
- 大文件处理优化
- 索引构建速度提升
- 测试覆盖(中优先级)
- 单元测试补充
- 集成测试完善
如何贡献?
# 1. Fork 项目 # 2. 创建分支 git checkout -b feature/your-feature-name # 3. 提交代码 git commit -m "feat: 添加XX功能" git push origin feature/your-feature-name # 4. 提交 Pull Request贡献者权益
- 📝 在贡献者列表中展示你的名字
- 🏆 对项目有重大贡献者可成为核心维护者
- 💼 优秀贡献者可获得推荐信或工作机会
项目地址
GitHub:https://github.com/dtsola/xiaoyaosearch
欢迎:
- ⭐️Star本项目,关注最新进展
- 🍴Fork本项目,开始你的贡献
- 👀Watch本项目,及时获取更新
- 🐛提Issue,报告问题和建议功能
- 💡参与讨论,分享你的想法
关于我
dtsola- IT解决方案架构师 | 一人公司实践者
- 网站:https://www.dtsola.com
- B站:https://space.bilibili.com/736015
开源协议
本项目采用小遥搜索软件授权协议:
- ✅ 免费使用(非商业用途)
- ✅ 可以学习和研究代码
- ✅ 可以修改后二次分发(需保留版权声明和协议)
- ✅ 可以集成到其他非商业项目
- ❌ 商业使用需授权
这是一个类似 CC-BY-NC-SA 的开源协议,鼓励学习、分享和贡献!
详细协议:LICENSE
结语
小遥搜索是我对本地AI搜索工具的一次探索和实践,也是Vibe Coding的完整案例展示。
我相信,开源社区的力量会让这个项目变得更好。
无论你是:
- 🔨 想要贡献代码的开发者
- 💡 想要提供建议的产品经理
- 📖 想要学习AI应用的学生
- 🚀 想要参与创业的伙伴
都欢迎加入我们,一起打造更好的本地AI搜索工具!
让我们一起,用AI技术改变知识管理方式!🚀
#独立开发者 #知识工作者 #知识库 #AI工具 #内容创作者 #一人公司 #ai搜索 #dify #ragflow #vibecoding