大模型日报
2024-06-18
大模型资讯
大模型产品
- Olvy 3.0:AI加速客户反馈分析
- 摘要: Olvy 3.0推出AI自动监听和智能标签功能,通过Google Meet集成轻松提取洞察,贴近客户,激发同理心。
- PlantIdentify-免费植物识别应用
- 摘要: PlantIdentify是一款免费植物识别应用,使用AI通过相机或图片快速识别植物,支持多语言并保存识别历史。
- VidAU:批量生成引人入胜的视频
- 摘要: VidAU让您通过产品链接或描述,快速生成多语言、多口音的拟真头像视频,并提供换脸、翻译等视频编辑功能。
- Teameet:实时语音翻译视频会议
- 摘要: Teameet是一款AI视频会议平台,新增语音翻译功能,实时翻译并保留讲话者的语调、音高和情感,实现无缝跨语言交流。
- rnbw: 现代设计与代码编辑器
- 摘要: rnbw 🌈 是一款现代设计与代码编辑器,简单灵活,开源开放,支持AI,完全遵循开放网络标准。
- Drip:AI自省与日记工具
- 摘要: Drip是一款由AI驱动的自省和日记工具,帮助用户探索内心想法和情感,并将其转化为行动。
大模型论文
- 金鱼损失:减少生成模型的记忆化
- 摘要: 提出金鱼损失,通过随机排除部分训练数据,减少大规模语言模型的记忆化,降低隐私和版权风险。
- 评估基准中的方差量化研究
- 摘要: 本文定义并测量评估基准中的方差,包括种子方差和训练单调性,并提供减少方差的建议。
- VEGA: 视觉语言模型的交错图文理解
- 摘要: 本文提出了交错图文理解任务IITC,并引入VEGA数据集以提升模型的图文关联能力,验证了其有效性。
- VideoGUI:评估GUI自动化的新基准
- 摘要: VideoGUI是一种多模态基准,用于评估在视觉为主的GUI任务中GUI助手的表现,涵盖高、中、低三个层次的任务规划和执行。
- 语义成员推断攻击提升语言模型性能
- 摘要: 引入语义成员推断攻击,通过分析输入及其扰动的语义内容,显著提升成员推断攻击的性能。
- 隐状态正则化提升奖励模型泛化能力
- 摘要: 本文提出通过正则化隐状态提升奖励模型在分布转移下的泛化能力,有效缓解RLHF中的过度优化问题。
- TRIP-PAL:结合LLM与自动规划的旅游计划生成
- 摘要: TRIP-PAL结合大语言模型和自动规划器,生成满足约束和优化用户满意度的旅游计划,实验表明其优于单独使用LLM。
- 医疗多模态领域幻觉检测与评估
- 摘要: 本文提出Med-HallMark基准和MediHall Score评估指标,用于检测和评估医疗多模态模型中的幻觉,并引入MediHallDetector模型以提高检测精度。
- 基于子空间投影的LLM高效卸载框架
- 摘要: 提出LSP_Offload框架,通过学习子空间投影器,实现LLM在普通硬件上的高效微调,显著提升性能并减少时间。
- IntentionQA:评估电商购买意图理解的基准
- 摘要: IntentionQA是一个用于评估语言模型在电商场景中理解购买意图能力的基准,包含4,360个问题,展示了模型在理解和推理方面的不足。
大模型开源项目
- 强大模块化的稳定扩散GUI
- 摘要: comfyanonymous项目提供了一个功能强大的稳定扩散图形界面、API和后端,采用图形/节点界面,使用Python编写。
- Ollama: 快速使用大型语言模型
- 摘要: Ollama项目使用Go语言编写,帮助用户快速上手Llama 3、Mistral、Gemma等大型语言模型。
- StableSwarmUI:模块化稳定扩散界面
- 摘要: StableSwarmUI 是一个模块化的稳定扩散网页用户界面,强调易用的强大工具、高性能和可扩展性,用C#编写。
- Stable Diffusion Web UI
- 摘要: AUTOMATIC1111开发的Stable Diffusion网络界面,使用Python编写,提供便捷的图像生成功能。
- 增强版ChatGPT克隆项目
- 摘要: 一个开源的ChatGPT克隆项目,支持多种AI模型切换、消息搜索、插件等功能,适合自托管。
- 基于深度神经网络的人声移除GUI
- 摘要: Anjok07项目提供一个基于Python的图形用户界面,用于使用深度神经网络技术移除音频中的人声。