欧洲最好的AI大模型:Mistral 7B!(开源、全面超越Llama 2)

你可能已经听说过Meta(原Facebook)的Llama 2,这是一款拥有13亿参数的语言模型,能够生成文本、代码、图像等多种内容。

图片

但是你知道吗,有一家法国的创业公司Mistral AI,推出了一款只有7.3亿参数的语言模型,却能够在各种标准的英文和代码基准测试中,击败Llama 2和其他所有目前可用的开源模型。

这款神奇的语言模型就是Mistral 7B。

Mistral AI是谁?

Mistral AI是一家成立于2023年6月的法国人工智能创业公司,由前Meta和DeepMind的研究员组成。他们在6月份就获得了1.13亿美元的种子轮融资,显示出投资者对他们开源理念的信心。他们的愿景是创建一个开放、可靠、高效、可扩展、可解释和可审计的人工智能平台。

图片

Mistral 7B有什么特点?

Mistral 7B最大的特点就是它是完全开源的,没有任何使用限制。

Mistral AI认为,开源的、社区驱动的模型开发是未来的趋势,也是对抗审查和偏见等人工智能伦理挑战的最有效的方式。他们希望通过公开透明的模型,让公共机构和私营企业能够审计生成系统的缺陷,以及检测生成模型的不良用途。

Mistral 7B各项指标都十分优秀

Mistral 7B 与 Llama 2 家族模型进行了比较

图片

基准测试分类:

  • 常识推理:Hellaswag、Winogrande、PIQA、SIQA、OpenbookQA、ARC-Easy、ARC-Challenge 和 CommonsenseQA 的 0-shot 平均值;

  • 世界知识:NaturalQuestions 和 TriviaQA 的 5-shot 平均值;

  • 阅读理解:BoolQ 和 QuAC 的 0-shot 平均值;

  • 数学:maj@8 的 8-shot GSM8K 和 maj@4 的 4-shot MATH 的平均值;

  • 代码:0-shot Humaneval 和 3-shot MBPP 的平均值;

  • 热门聚合结果:5-shot MMLU、3-shot BBH 和 3-5-shot AGI Eval(仅限英文多项选择题)。

图片

Mistral 7B能够根据特定的任务和用户需求进行定制。这对于那些希望降低成本同时保持性能的企业来说,是非常有利的。

Mistral AI还采用了一些先进的技术,如分组查询注意力(Grouped-query attention)和滑动窗口注意力(Sliding window attention),来提高推理速度和处理长序列的效率。

总结

Mistral 7B是一款开源的超大语言模型,能够超越Llama 2和其他开源模型,在各种任务上表现出惊人的能力。

Mistral 7B Instruct 模型快速演示了基本模型可以轻松微调以实现引人注目的性能。

图片

它是Mistral AI的第一个重要产品,也是他们实现开放、可靠、高效、可扩展、可解释和可审计的人工智能平台的第一步。

公司网址:

https://mistral.ai/

开发文档:

https://docs.mistral.ai/

模型地址:

https://docs.mistral.ai/llm/mistral-v0.1

欧洲最好的AI大模型:Mistral 7B!(开源、全面超越Llama 2)_腾讯新闻

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/600801.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

GitHub Copilot 最佳免费平替:阿里通义灵码

之前分享了不少关于 GitHub Copilot 的文章,不少粉丝都评论让我试试阿里的通义灵码,这让我对通义灵码有了不少的兴趣。 今天,阿七就带大家了解一下阿里的通义灵码,我们按照之前 GitHub Copilot 的顺序分享通义灵码在相同场景下的…

Vue 之 修饰符汇总

一、简介 在Vue中,修饰符是一种特殊的语法,用于修改指令或事件绑定的行为,它们以点号(.)的形式添加到指令或事件的后面,并可以改变其默认行为或添加额外的功能,如:禁止事件冒泡、数…

java 中数组常用排序方法举例说明

java 中数组常用排序方法举例说明 在Java中,数组的排序是常见的操作之一,而Java提供了多种排序方法来满足不同场景的需求。下面详细介绍5种常用的数组排序方法: 冒泡排序(Bubble Sort): 冒泡排序是一种简单…

【mars3d】new mars3d.layer.GeoJsonLayer(实现环状面应该怎么传data

问题:【mars3d】new mars3d.layer.GeoJsonLayer(实现环状面应该怎么传data 解决方案: 1.在示例中修改showDraw()方法的data数据,实现以下环状面效果 2.示例链接: 功能示例(Vue版) | Mars3D三维可视化平台 | 火星科技 export f…

Ubuntu20.04安装ROS2 Foxy

Ubuntu20.04安装ROS2 Foxy 实操安装 安装ROS2的教程在网上很多,但是我操作之后都有问题,大部分的问题是在 sudo apt update 时访问packages.ros.org无法成功,主要的原因是没有外网,而自己整一个外网代理又非常麻烦,所…

读书之深入理解ffmpeg_简单笔记3(初步)

通读完只能对书中内容有大概的了解,具体的细节还得一一实践攻克。 10: libavformat接口使用 媒体流,文件等封装,解封装,转封装 视频截取,AVFormatContext,AVPacket等介绍 11:libavcodec接口使用 视频&…

Android开发中“真正”的仓库模式

原文地址:https://proandroiddev.com/the-real-repository-pattern-in-android-efba8662b754原文发表日期:2019.9.5作者:Denis Brandi翻译:tommwq翻译日期:2024.1.3 Figure 1: 仓库模式 多年来我见过很多仓库模式的实…

pytest安装失败,报错Could not find a version that satisfies the requirement pytest

问题 安装pytest失败,尝试使用的命令有 pip install pytest pip3 install pytest pip install -U pytest pip install pytest -i https://pypi.tuna.tsinghua.edu.cn/simple但是都会报同样的错: 解决方案 发现可能是挂了梯子的原因,关掉…

代码随想录算法训练营Day20|654.最大二叉树、617.合并二叉树、700.二叉搜索树中的搜索、98.验证二叉搜索树

目录 654.最大二叉树 前言 递归法 617.合并二叉树 前言 递归法 700.二叉搜索树中的搜索 前言 递归法 递归法 98.验证二叉搜索树 前言 递归法 迭代法 总结 654.最大二叉树 题目链接 文章链接 前言 本题延续昨天最后一题,依然是一道构造二叉树的题目…

烟花燃放如何管控?智能分析网关V4烟火检测保障烟火安全

一、方案背景 随着元旦佳节的热潮退去,春节也即将来临,在众多传统的中国节日里,烟花与烧纸祭祀都是必不可少的,一方面表达了人们对节日的庆祝的期许,另一方面也是一种对故者思念的寄托。烟花爆竹的燃放不仅存在着巨大的…

Node.js中的模块,常用模块具体代码示例

核心模块:https://blog.csdn.net/kkkys_kkk/article/details/135409851?spm1001.2014.3001.5501 目录 第三方模块 代码示例 Express示例 Lodash示例 MongoDB示例 Async示例 Request示例 发送GET 发送POST请求 自定义模块 创建步骤 常见示例 导出一个函数&a…

【PHP】TP5 使用模型一对一关联查询,条件筛选及字段过滤

目录 方法一:使用Eloquent ORM的with关联查询 方法二:使用JOIN进行查询 方法一:使用Eloquent ORM的with关联查询 在 ThinkPHP5 中,可以使用模型关联和条件查询来实现一对一关联查询。以下是一个示例: 假设有两个表&a…

跑通大模型领域的 hello world

跑通书生浦语大模型的 3 个趣味 demo(InternLM-Chat-7B 智能对话、Lagent工具调用解简单数学题、浦语灵笔多模态图文创作和理解)视频和文档。 1、两个框架 InternLM 是⼀个开源的轻量级训练框架,旨在⽀持⼤模型训练⽽⽆需⼤量的依赖。 Lage…

Underactuated Robotics - 欠驱动机器人学(一)- 全驱动与欠驱动系统

系列文章目录 前言 如今的机器人行动过于保守,只能完成机械性能所能完成的一小部分任务,实现一小部分性能。在某些情况下,我们仍然从根本上受限于在结构化工厂环境中成熟的刚性机械臂控制技术,在这种环境中,可以使用大…

烧录FRU方法

烧录FRU ipmitool远程命令示例: ipmitool -I lanp -H 127.0.0.1 -U admin -P admin write FRUID FRUfilename 1、修改Chassis PN ipmitool fru edit 0 field c 0 01234567892、修改 Board PN ipmitool fru edit 0 field b 3 01234567893、修改 Product PN ipmitool fru ed…

docker一键安装命令

docker一键安装命令 curl -fsSL https://get.docker.com | bash -s docker开机自动运行 systemctl start docker systemctl enable docker配置镜像仓库 sudo vim /etc/docker/daemon.json增加或修改以下配置内容 {"registry-mirrors": ["https://dockerprox…

将文本文件导入Oracle数据库的简便方法:SQL Loader Express

需求 我有一个文本文件dbim.txt,是通过alert log生成的,内容如下: 2020-09-11 2020-09-11 ... 2023-12-03 2023-12-03 2023-12-26我已经在Oracle数据库中建立了目标表: create table dbim(a varchar(16));我想把日志文件导入Or…

C++之STL库简介

目录 一、STL(Standard Template Library,标准模板库) 二、容器(Containers) 1.vector(动态数组) 2.list(双向链表) 3.deque(双端队列) 4.st…

用友U8 Cloud smartweb2.RPC.d XXE漏洞复现

0x01 产品简介 用友U8 Cloud 提供企业级云ERP整体解决方案,全面支持多组织业务协同,实现企业互联网资源连接。 U8 Cloud 亦是亚太地区成长型企业最广泛采用的云解决方案。 0x02 漏洞概述 用友U8 Cloud smartweb2.RPC.d接口处存在 XXE漏洞,攻击者可通过该漏洞获取敏感文件…

软件工程:用例图相关知识和多实例分析

目录 一、用例图相关知识 1. 基本介绍 2. 常用符号 二、用例图实例分析 1. 新闻管理系统 2. 医院病房监护系统 3. 实验上机安排系统 4. 远程网络教学系统 一、用例图相关知识 1. 基本介绍 用例图(use case diagram)是用户与系统交互的最简表示…