斯坦福抄袭清华、面壁智能大模型,当事人已道歉、删项目

6月4日,两名斯坦福大学生Aksh Garg和Siddharth Sharma,承认抄袭清华和面壁智能联合开发的MiniCPM-Llama3-V2.5(以下简称V2.5)多模态大模型事件,并在社交平台公开道歉、删掉开源项目。

该抄袭事件也得到了斯坦福大学AI实验室主任Christopher Manning的认证,表扬了国内大学、企业对开源大模型的贡献,并表示对该事件毫不知情。

V2.5开源地址:https://github.com/OpenBMB/MiniCPM-V?tab=readme-ov-file

图片


两位同学发的道歉信一样

整个抄袭事件全过程

其实昨天这个事情在国内相当炸裂,登上了好几个平台的热搜榜首,「AIGC开放社区」就根据多方已经证实的内容,为大家梳理一下抄袭事件的全过程。

5月29日,斯坦福大学的AI团队宣称,他们开源了一款名叫Llama3-V的多模态模型(https://github.com/mustafaaljadery/llama3v已删除无法访问),只需要500美元就能训练出超过GPT-4V、GeminiUltra、ClaudeOpus等众多知名模型。

发布没多久,Llama3-V便成为Hugging Face上非常火热的一款开源产品。

6月2日,有开发者质疑Llama3-V抄袭国内清华和面壁智能联合开源的最新项目V2.5,主要抄袭的证据有以下几点。

图片

1)特色功能一样:V2.5的特色功能之一是可以识别“清华简”,这是中国战国时期写在竹子上的一种非常特殊且罕见的中国古文字。

而Llama3-V居然也能识别。但这个训练数据是清华2500多张竹简中扫描下来的,并非是从公开训练数据中提取的。

图片

2)Llama3-V的模型架构、代码、配置文件、分词器基本一样,只是增加了高斯噪声、变量名称不一样而已。

图片

3)重叠度高达87%:为了验证是否抄袭,用户将V2.5与其他几个基于Llama3的多模态模型进行了比较,例如,Bunny-Llama-3-8B-V、Bunny-Llama-3-8B-V,模型的重叠率为0。但与Llama3-V进行比对时,重叠率居然高达87%。

此外,两者还有非常相似的误差分布。Llama3-V和V2.5分别做出了236个和194个错误预测,而重叠部分为182个。如果是原创模型根本不会有如此高的重叠度

图片

4)犯的错误一样:用户将Llama3-V用于测试WebAgent时,居然与V2.5犯的错误一样。但V2.5使用的是内部从未公开过的训练数据,这也再一次证明Llama3-V的抄袭行为。

图片

网上还罗列出了不少抄袭的证据,但上面4点是最致命的,基本都是同一架构、训练数据才能犯的错误Llama3-V居然全中了。

相当于两个人的脸型、眼睛、鼻子、嘴巴几乎一模一样,只是你的头发比我多一些,难道就不认我这个秃头兄弟了吗~

斯坦福AI实验室主任证实

起初这个抄袭事件并没有引起太大关注,但随着证据越来越多被实锤,就连斯坦福大学AI实验室主任Christopher Manning也下场道歉了,表示,犯了错误就要勇于承!

同时表扬了清华大学对开源项目的贡献,而他自己对该事件毫不知情。但是有人指出,这位教授在6月3日是知道该事件的。

图片

两位学生迫于各界压力,昨天在社交平台进行了公开道歉,但是态度并不是很诚恳。首先,他们居然使用了同样的道歉信,难道不需要仔细说明一下你在这个项目的角色、最初想法以及为什么要这么做吗?

图片

还有一个就是甩锅,两位公开道歉的学生表示,他们只是负责该模型的社区宣传,实际写代码的是一位叫Mustafa Aljadery的。

图片

这就更严重了,既然你们只是负责宣传,那为啥在作者栏那里加上自己的名字呢?在宣发的时候难道不验证一下论文和项目吗?并且表示对V2.5这个开源项目毫不知情。

都是成年人,既然犯错了,就应该像个爷们一样勇敢承担起来,下次改过就可以了。如果试图继续掩盖,只会越描越黑。

这个抄袭事件也折射出了我国在AI芯片制裁的大背景下对大模型开发、训练的无奈,没有超强GPU集群支撑,只能从算法、脚骨、训练数据去打磨。

同时我们的大模型开源生态也被低估了,通义千问、面壁智能、百川智能等一大批优秀的开源项目已经获得了世界的认可并迅速崛起。

图片

本文素材来源网络、斯坦福社交平台,如有侵权请联系删除

END

图片

图片

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/web/22492.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

阿里云计算之linux入门命令学习笔记(二)

Linux 提供了丰富的命令行工具,用于系统管理、文件操作、网络管理、进程控制等。以下是一些常用的 Linux 命令及其简要说明: 切换用户 su 命令 su (substitute user) 命令用于切换用户。 su - username # 切换到指定用户,并加载…

【python】成功解决“ImportError: cannot import name ‘triu’ from ‘scipy.linalg’”错误的全面指南

成功解决“ImportError: cannot import name ‘triu’ from ‘scipy.linalg’”错误的全面指南 在Python编程中,尤其是在使用scipy这个科学计算库时,可能会遇到ImportError错误,提示无法从scipy.linalg模块中导入名为triu的函数。这个错误通…

程序员职业生涯中的重要职业素养

程序员应该有什么职业素养? 作为一名程序员,职业素养在日常工作中至关重要。这不仅关系到个人职业发展的成功,也影响团队的整体效率和项目的成功。以下是几项对程序员而言尤为重要的职业素养: 1. 技术能力与学习能力 持续学习&…

浏览器原理---进程与线程

1、进程与线程的概念 从本质上说,进程和线程都是 CPU 工作时间片的一个描述: 进程描述了 CPU 在运行指令及加载和保存上下文所需的时间,放在应用上来说就代表了一个程序。线程是进程中的更小单位,描述了执行一段指令所需的时间。…

过滤器:Vue.js允许你自定义过滤器,可用于常见的文本格式化。过滤器可以用在两个地方:mustache插值和v-bind表达式

简介 Vue.js过滤器的概念 在Vue.js中,过滤器是一些用于处理和转换文本的函数。它们可以用在模板中的两个地方:mustache插值和v-bind表达式。过滤器应该被添加在JavaScript表达式的尾部,由“管道”符号表示。 过滤器的作用和优点 过滤器的主要作用是在不改变原始数据的…

Unity3D Delaunay德罗内三角算法详解

Unity3D是一款强大的游戏开发引擎,它提供了丰富的功能和工具,使开发者能够轻松创建出色的游戏和应用程序。其中,Delaunay德罗内三角算法是一种常用的计算几何算法,用于生成三角形网格,其在Unity3D中的应用也非常广泛。…

探索Linux中的rename命令:强大的文件名重命名工具

探索Linux中的rename命令:强大的文件名重命名工具 在Linux系统中,处理文件和目录时,经常需要对文件或目录进行重命名。虽然基本的mv命令可以用于此目的,但在面对需要按照特定模式进行批量重命名时,mv命令就显得有些力…

ROS系列rqt的安装以及使用方法介绍

目录 1. 安装 2. 部分工具的功能介绍及使用方法 1)rqt_gui 2)rqt_topic 3)rqt_graph 4)qt_plot 5)rqt_service_caller 6)rqt_bag 1. 安装 安装极其简单,不多介绍,直接上命令…

EDI系统的使用场景

EDI全称Electronic Data Interchange,中文名称是电子数据交换。EDI系统是专为企业间的电子数据传输而设计的,需要满足的基本功能包括:支持AS2、OFTP、SFTP等EDI传输协议,能够生成和解析符合X12、EDIFACT、VDA等EDI报文标准下的报文…

反向海淘代购系统中的API接口列表

API测试入口|代购系统演示 item_get 获得淘宝商品详情item_get_pro 获得淘宝商品详情高级版item_review 获得淘宝商品评论item_fee 获得淘宝商品快递费用item_password 获得淘口令真实urlitem_list_updown 批量获得淘宝商品上下架时间seller_info 获得淘宝店铺详情item_search…

CrossPrefetch: Accelerating I/O Prefetching for Modern Storage——论文泛读

ASPLOS 2024 Paper 论文阅读笔记整理 问题 目前计算设备和存储设备之间的性能差距仍然很大。因此,主内存缓存和缓冲区被广泛用于操作系统、用户级文件系统[32]和I/O运行时,在隐藏性能差距和减少I/O瓶颈方面发挥关键作用[23,26,3…

python运算符和表达式

目录 算数运算符 赋值运算符 关系运算符 逻辑运算符 位运算符 成员运算符 运算符优先级 易错点: 算数运算符 赋值运算符 关系运算符 int可以转换成float 逻辑运算符 可以是一个运算也可以是一个字符串 左边为空格,为假,输出为空 优…

[React]用 flushSync 同步更新 state

参考:使用 ref 操作 DOM – React 中文文档 同时操作state和ref的情况还是有的,按我的原来的处理肯定是使用setTimeout了,看到官方有解决方案,摘录下来以便查看。 源代码就不完整贴了,直接看问题代码块: …

MySQL中获取时间的方法

大家好,在MySQL数据库开发中,获取时间是一个常见的需求。MySQL提供了多种方法来获取当前日期、时间和时间戳,并且可以对时间进行格式化、计算和转换。 以下是一些常用的MySQL时间函数及其示例: 1、NOW():用于获取当前…

Mysql:通过一张表里的父子级,递归查询并且分组分级

表:gc_jzst_single_base 需求:要求返回这张表里符合条件的数据,且有父子级关系的,展示为同一组且分级,给后续业务调用 代码 WITH RECURSIVE t1 AS (SELECTsingle_id,old_build_single_id,single_name,bulid_code,1 A…

Mybatis Map接收数据tinyint(1)类型错误

Mybatis Map接收数据tinyint 1 类型错误 问题描述数据库字段Mybatis查询语句问题处理方案一方案二方案三 问题描述 Mybatis开发过程中,使用Map接收返回数据时发现tinyint(1)类型字段自动转换成了Boolean类型,导致查询的数据出现问题 数据库字段 数据库…

实验四、零比特插入《计算机网络》

但凡这句话有一点用的话也不至于一点用都没有。 目录 一、实验目的 二、实验内容 三、实验小结 一、实验目的 掌握零比特插入原理及方法使用任意编程语言实现零比特插入方法。 二、实验内容 掌握零比特插入原理及方法 点对点协议 PPP(Point-to-Point Protoco…

android apk签名

android apk签名 命令: java -jar signapk.jar platform.x509.pem platform.pk8 **.apk ***.apk note: apk密钥为: platform.pk8和platform.x509.pem 路径: build\target\product\security apk签名工具:sign…

Elasticsearch:基于多个 kNN 字段对文档进行评分

作者:来自 Elastic Madhusudhan Konda 通过具有多个 kNN 字段的最接近的文档对文档进行评分 Elasticsearch 不仅仅是一个词法(文本)搜索引擎。 Elasticsearch 是多功能搜索引擎,除了传统的文本匹配之外,还支持 k 最近…

【C++】优先级队列介绍与模拟实现

💞💞 前言 hello hello~ ,这里是大耳朵土土垚~💖💖 ,欢迎大家点赞🥳🥳关注💥💥收藏🌹🌹🌹 💥个人主页&#x…