OpenCompass 大模型评测实战——作业

OpenCompass 大模型评测实战——作业

  • 一、基础作业
    • 1.1、使用 OpenCompass 评测 internlm2-chat-1_8b 模型在 C-Eval 数据集上的性能
      • 1.1.1、安装基本环境
      • 1.1.2、解压数据集
      • 1.1.3、查看支持的数据集和模型
      • 1.1.4、启动评测
  • 二、进阶作业
    • 2.1、将自定义数据集提交至OpenCompass官网

一、基础作业

1.1、使用 OpenCompass 评测 internlm2-chat-1_8b 模型在 C-Eval 数据集上的性能

1.1.1、安装基本环境

studio-conda -o internlm-base -t opencompass
source activate opencompass
git clone -b 0.2.4 https://github.com/open-compass/opencompass
cd opencompass
pip install -e .# 如果pip install -e .安装未成功,请运行:
pip install -r requirements.txt

在这里插入图片描述

在这里插入图片描述

建议这边直接用 pip install -r requirements.txt 这个命令,pip install -e . 我使用的时候是运行成功了,但后面依然出现了对应包没有的问题。

1.1.2、解压数据集

cp /share/temp/datasets/OpenCompassData-core-20231110.zip /root/opencompass/
unzip OpenCompassData-core-20231110.zip

在这里插入图片描述

1.1.3、查看支持的数据集和模型

在这里插入图片描述

这边就出现了 tabulatemmengine 这两个包没有的情况,那就 pip install 装上。

在这里插入图片描述

1.1.4、启动评测

python run.py
--datasets ceval_gen \
--hf-path /share/new_models/Shanghai_AI_Laboratory/internlm2-chat-1_8b \  # HuggingFace 模型路径
--tokenizer-path /share/new_models/Shanghai_AI_Laboratory/internlm2-chat-1_8b \  # HuggingFace tokenizer 路径(如果与模型路径相同,可以省略)
--tokenizer-kwargs padding_side='left' truncation='left' trust_remote_code=True \  # 构建 tokenizer 的参数
--model-kwargs device_map='auto' trust_remote_code=True \  # 构建模型的参数
--max-seq-len 1024 \  # 模型可以接受的最大序列长度
--max-out-len 16 \  # 生成的最大 token 数
--batch-size 2  \  # 批量大小
--num-gpus 1  # 运行模型所需的 GPU 数量
--debug

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

实在受不了了,运行了几次,每次都缺包,果断 pip install -r requirements.txt

在这里插入图片描述

再次运行,没有出现缺包的情况,不过也是出现了和教程上说过的问题。

在这里插入图片描述

先按照教程的做法设置 export MKL_SERVICE_FORCE_INTEL=1

在这里插入图片描述

但运行发现还是报同样的错误,那就换第二种方法 export MKL_THREADING_LAYER=GNU

在这里插入图片描述

这次运行以后没有再出现 MKL MKL_THREADING_LAYER=INTEL 的问题了,不过出现了新的问题。

在这里插入图片描述

出现这个问题是因为缺少 prtobuf 这个包,再 pip install protobuf,然后再次运行。

在这里插入图片描述

这次终于成功,安心等待结果。

在这里插入图片描述

想截出来完整的图片,所以就直接将包含结果的 csv 文件下载下来。

二、进阶作业

2.1、将自定义数据集提交至OpenCompass官网

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/web/2897.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

2024春季春日主题活动策划方案

2024解冻派对“春日浪漫”主题活动策划方案-32P 方案页码:32页 文件格式:pptx 方案简介: 春来一季,新生欢喜 花香丨微风丨阳光 活动唤起【春日浪漫记忆】! 年轻人不一样的派对活动 可以与朋友/小朋友/家人互动…

深度学习-线性代数

目录 标量向量矩阵特殊矩阵特征向量和特征值 标量由只有一个元素的张量表示将向量视为标量值组成的列表通过张量的索引来访问任一元素访问张量的长度只有一个轴的张量,形状只有一个元素通过指定两个分量m和n来创建一个形状为mn的矩阵矩阵的转置对称矩阵的转置逻辑运…

03-JAVA设计模式-访问者模式

访问者模式 什么是访问者模式 访问者模式(Visitor Pattern)是软件设计模式中的一种行为模式,它用于将数据结构中的元素与操作这些元素的操作解耦。这种模式使得可以在不修改数据结构的情况下添加新的操作。 在访问者模式中,我们…

数据结构 - 链表详解二 - 无头单向非循环链表

一. 单链表的介绍 上篇文章已经介绍了各种链表的概念了,这篇文章就带大家来实现一下无头单向非循环链表 无头单向非循环链表是一种简单而基本的链表结构,它没有哨兵或额外的头节点来简化操作,且不形成闭环。这种链表直接从首个数据节点开始&…

图文教程 | Git安装配置、常用命令大全以及常见问题

前言 因为多了一台电脑,平时写一些代码,改一些文件,用U盘存着转来转去特别麻烦。于是打算用Git管理我的文件,方便在两个终端之间传输数据啥的。也正好给新电脑装好Git。 📢博客主页:程序源⠀-CSDN博客 &…

HFSS端口介绍2---波端口

前面我们讨论了Lumped Port设定相关的内容,这节我们继续讨论Wave Port(波端口)使用相关的问题。 波端口使用范围 封闭结构:如波导、同轴电缆等 包含多个传播模式的模型 端口平面在求解区域外的模型 模型中包含均匀的波导或者传输线结构 波端口的大小 对于封闭的传输线结构:边…

Ajax技术是啥?在web开发中有啥用?

一、Ajax是啥? Ajax技术是一种让网页能在不完全刷新页面的情况下,通过JavaScript与服务器进行异步数据交换,并更新部分网页内容的技术。 简单来说,Ajax的核心原理就是在JavaScript的控制下,网页悄悄地向服务器请求数…

Kubeedge:edgecore源码速读

Kubeedge源码版本:v1.15.1 首先,我们从edgehub的start函数看起: 它主要干几件事情: 初始化证书相关,这里的证书主要用于webskt的连接启动edgehub,开启三个协程,分别把云发过来的消息路由到边缘…

蝴蝶书--ChatGPT基础科普

temperature的参数调整输出的概率分布,这个参数值越大,分布就看起来越平滑,也就是高概率和低概率的差距拉小了(对输出不那么确定) Top-P在累计概率超过P的词里进行选择,对于概率分布比较均匀的情况&#x…

视频教程下载:用ChatGPT的 API 开发AI应用指南

通过这门关于 OpenAI API 和 ChatGPT API 的全面课程,在您的应用中释放人工智能的力量。随着人工智能技术的快速发展,比以往任何时候都更重要的是保持领先地位,并为您的项目利用这些尖端工具。在本课程中,您将深入了解人工智能驱动…

ADB 命令大全

Case1:报错Remote couldnt create file:Read-only file system 输入 adb disable-verity adb reboot adb root adb remount Case2:/system/bin/sh: cant create C:xxx.txt: Read-only file system Android设备的文件系统是基于Linux的&…

物联网硬件设计开发全攻略:十大关键阶段深度解析

为物联网应用设计开发高效稳定的硬件系统本身是一项既复杂又精细的艰巨任务。看似小巧的物联网设备一般由软件、固件和硬件组件组成,其中,硬件组件更是占据了约80%的成本与开发挑战。那么,为何硬件部分如此棘手?在这篇文章中&…

x汽车登陆网站登陆rsa加密逆向

声明: 本文章内容仅供学习交流,不用于其他其他任何目的,严禁用于商业用途和非法用途,否则由此产生的一切后果均与作者无关, 各位看官好哇,今天给大家带来一篇web自动化逆向的文章,如下图当前我…

C++ 几句话彻底点通虚表

#include <iostream>using namespace std;class Base { public:virtual void show() // 声明虚函数{cout << "Base" << endl;} };class Derived : public Base { public:void show() override // 覆盖虚函数{cout << "Derived" &l…

芯科科技大大简化面向无电池物联网的能量采集产品的开发

芯科科技推出其迄今最高能量效率且支持能量采集功能的无线SoC 中国&#xff0c;北京 – 2024年4月22日 – 致力于以安全、智能无线连接技术&#xff0c;建立更互联世界的全球领导厂商Silicon Labs&#xff08;亦称“芯科科技”&#xff0c;NASDAQ&#xff1a;SLAB&#xff09;…

Day1: 5道C++ 面向对象高频题整理

1、什么是类&#xff1f; 在C中&#xff0c;类是一种用户定义的数据类型&#xff0c;它可以包含数据成员和函数成员。数据成员用于存储与类相关的状态&#xff0c;而函数成员可以定义对这些数据进行操作的方法。可以把类想象为一个蓝图&#xff0c;根据这个蓝图可以创建对象&am…

超星图书转成PDF格式

转为pdf 为避免浪费您的时间&#xff0c;本篇转载文章不值得花费您的宝贵时间阅读 方法一 感谢医学插画动画杜鹏 Roison An两位提供的方法&#xff0c;经试验后简化了一下&#xff0c;得出以下方法:1、使用超星打开你想要转换的图书2、依次打开本书的所有页面&#xff0c;不要…

Property ‘auth‘ does not exist on type ‘AGCApi‘.

Property ‘auth’ does not exist on type ‘AGCApi’. 解决 清理项目重新运行模拟器就可以了

程序员开发必备,开发资源资料分享【4】

第4部分内容 130-100051801-专栏课-罗剑锋-罗剑锋的 C实战笔记&#xff08;完结&#xff09;提取码&#xff1a; 131-100051901-专栏课-陈亦峰-互联网人的英语私教课&#xff08;完结&#xff09;提取码&#xff1a; 132-100051101-视频课-程超-分布式缓存高手课&#xff08…

CentOS-7安装clickhouse并允许其他主机登录

一、通用设置 1、配置主机名 hostnamectl set-hostname --static 主机名2、修改hosts文件 vim /etc/hosts 输入&#xff1a; 192.168.15.129 master 192.168.15.133 node1 192.168.15.134 node2 192.168.15.136 node33、 保持服务器之间时间同步 yum install -y ntpdate &…