
原文:https://mp.weixin.qq.com/s/1AGCABJHMGzXZ3tYFl4vqg
Open Notebook:隐私至上,16+AI 模型解锁科研笔记新玩法!
项目地址:https://github.com/lfnovo/open-notebook
主要语言:TypeScript
stars: 7.4k


项目简介
Open Notebook是一个开源、注重隐私的笔记工具,作为Google Notebook LM的替代方案,它提供了多模型支持、本地部署等功能,让用户能够更好地掌控自己的数据和研究过程。
核心功能
- 数据掌控:确保研究数据的隐私和安全,无需依赖云服务。
- 多模型选择:支持16种以上的AI模型提供商,如OpenAI、Anthropic、Ollama、LM Studio等。
- 多模态内容管理:可以组织PDF、视频、音频、网页等多种类型的内容。
- 专业播客生成:支持高级多主播播客生成,具备节目配置文件。
- 智能搜索:提供全文和向量搜索功能,可搜索所有内容。
- 上下文聊天:基于研究内容进行AI对话。
优势
- 隐私性强:数据完全由用户控制,无需依赖云服务。
- 成本可控:用户可选择更便宜的AI提供商,或使用Ollama本地运行模型。
- 高度可定制:开源项目,可根据需求进行修改、扩展和集成。
- 无供应商锁定:用户可以自由切换提供商,在任何地方部署,并拥有自己的数据。
技术栈
该项目使用了Python、Next.js、React、SurrealDB和LangChain等技术。
部署方式
提供了本地机器和远程服务器两种部署方式,同时推荐使用Docker Compose进行管理。
- 本地机器部署:适用于在运行Docker的同一台计算机上访问Open Notebook。
- 远程服务器部署:适用于服务器、树莓派、NAS、Proxmox等远程机器。
注意事项
- v1.0版本有重大更改,升级时需注意Docker标签的变化、端口5055的暴露,并阅读迁移指南。
- 新用户可使用
v1-latest-single标签进行快速启动。
文档与支持
项目提供了详细的文档,包括入门指南、用户手册、高级主题等。同时,还有AI安装助手和Discord社区提供帮助。
路线图
- 即将推出的功能:实时前端更新、异步处理、跨笔记本资源共享、书签集成。
- 最近完成的功能:Next.js前端、全面的REST API、多模型支持、高级播客生成器、内容转换、增强引用、多聊天会话。
哈佛开源教材揭秘!掌握机器学习系统全栈开发,解锁AI新未来
harvard-edge/cs249r_book 是一个介绍机器学习系统的开源书籍项目。简单讲,它是一本教你如何构建和理解机器学习底层系统的电子书,涵盖从基础概念到实际代码实现的内容。适用人群:机器学习工程师、系统开发者及对ML系统原理感兴趣的中高级学习者。
项目地址:https://github.com/harvard-edge/cs249r_book
主要语言:Python
stars: 4.4k
项目简介
这个GitHub仓库是一本名为 Principles and Practices of Engineering Artificially Intelligent Systems 的开源教科书,旨在教授读者构建从边缘设备到云部署的实际AI系统。以下为你详细介绍:
核心信息
- 书籍背景:最初是哈佛大学CS249r课程,由Prof. Vijay Janapa Reddi开发,现在被全球多所大学和学生使用。其创作源于对学生虽能训练AI模型,但缺乏构建实际运行系统能力的担忧。
- 学习内容:读者可以学习到真实世界机器学习系统的全栈知识,包括系统设计(可扩展、可维护的ML架构)、数据工程(强大的数据收集、标注和处理管道)、模型部署(将原型转化为生产就绪的系统)、MLOps与监控(可靠且持续运行的系统)以及边缘AI(在移动、嵌入式和物联网设备上进行资源高效的部署)。
代码架构特点
- Book Binder CLI:推荐使用的快速开发命令行工具,支持单章或多章的快速构建和预览,也能构建完整的网站(HTML)、PDF和EPUB格式的书籍,还具备清理工件、显示状态、运行健康检查等管理功能。
- 项目结构清晰:包含
binder(快速开发CLI)、quarto(主书籍内容,使用Quarto编写)、tools(开发自动化工具)、config(项目配置)、docs(文档)等目录,每个目录下又细分多个子目录进行不同功能的管理。
项目优势
- 开源免费:以开放源码的形式提供,读者可在线阅读或下载PDF、ePub格式的书籍,降低了学习成本。
- 多平台支持:提供在线阅读、离线下载等多种方式,方便不同场景下的学习。
- 社区活跃:有众多贡献者参与,提供了多种贡献途径,包括内容、工具、设计、本地化和基础设施等方面,且所有贡献都有自动化的质量保证。
- 自动化部署:通过GitHub Actions工作流进行发布,确保了部署的一致性和自动化,同时在部署前进行自动化验证,保证了质量。
应用场景
- 学生学习:适合计算机科学、人工智能等相关专业的学生,帮助他们掌握实际的AI系统构建技能,提升实践能力。
- 教育工作者教学:为教育工作者提供了丰富的课程材料、教学指南和教师资源,可用于课堂教学。
- 开发者实践:对于从事机器学习系统开发的开发者,可作为参考资料,学习系统设计、部署和维护的最佳实践。