阿里开源编程大模型 CodeQwen1.5:64K92编程语言,Code和SQL编程,评测接近GPT-4-Turbo

前言

阿里巴巴最近发布的CodeQwen1.5模型标志着其在编程语言模型领域的一次重大突破。这款开源模型不仅支持高达92种编程语言和64K的上下文长度,而且在多项性能评测中显示出接近或超过当前行业领导者GPT-4-Turbo的能力。

  • Huggingface模型下载:https://huggingface.co/Qwen/CodeQwen1.5-7B

  • AI快站模型免费加速下载:https://aifasthub.com/models/Qwen

模型概述

CodeQwen1.5是基于Qwen语言模型的进阶版本,拥有70亿参数,并使用GQA架构。模型在约3万亿token的代码相关数据上进行了预训练,这使得它在代码生成、长序列建模、代码修改和SQL编程等多个方面表现卓越。

编程语言支持

模型支持的92种编程语言覆盖了从Python、Java、C++到较少见的语言如Elixir和Go,使其成为多语言编程环境中的强大工具。这种广泛的语言支持对于开发多平台应用程序尤为重要,能够满足不同开发者的需求。

长序列建模能力

CodeQwen1.5的一个重要特点是其长序列建模能力,能处理高达64K的上下文输入。这对于理解大型代码库和执行复杂的代码重构任务至关重要。模型在处理长序列时展现了极低的困惑度,表明其对代码结构和语义的深入理解。

SQL编程专长

除了通用编程能力,CodeQwen1.5还展现了出色的SQL编程专长,能够通过自然语言查询实现复杂的数据库操作。这一功能特别适合非技术用户,帮助他们轻松地进行数据检索和管理。在两个流行的文本到SQL基准测试Spider和Bird上评估了CodeQwen1.5-Chat的性能。实验结果显示,CodeQwen1.5在接近GPT-4的位置排名第二(结果来自DIN-SQL,一种 SOTA 的提示方法)。

性能评测

在标准的编程能力评测如HumanEval和MBPP中,CodeQwen1.5的表现堪比顶级商业模型。例如,在HumanEval的0-shot测试中,CodeQwen1.5的得分高达51.8%,而在MBPP的3-shot测试中,得分达到61.8%。这些成绩显示了其在理解和执行复杂编程任务方面的能力。

CodeQwen1.5不仅在 Python 方面表现出色,还是一个多编程语言的编程模型。在 MultiPL-E 平台上,包括 Python、C++、Java、PHP、TypeScript、C#、Bash 和 JavaScript 在内的 8 种主流语言上进行了全面评估,这些结果证明了CodeQwen1.5强大的编程能力。

结论

CodeQwen1.5的发布不仅证明了阿里巴巴在开源社区中的影响力,也标志着开源编程模型在性能和通用性上达到了一个新的高度。它不仅为开发者社区提供了一个强大的工具,还为编程语言模型的未来发展设定了新的标准。随着更多的开源项目和开发者参与到CodeQwen1.5的持续改进中,我们可以期待这一模型在未来解决更多复杂的软件开发挑战。

模型下载

Huggingface模型下载

https://huggingface.co/Qwen/CodeQwen1.5-7B

AI快站模型免费加速下载

https://aifasthub.com/models/Qwen

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/836277.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Boost库的使用

1 下载与安装 1.1 下载 网址:Boost C Libraries 进入后选择自己需要的版本安装即可 1.2 安装 1.2.1 解压 1.2.2 编译安装 双击bootstrap.bat 这一步完成后会生成一个b2.exe文件 双击b2.exe文件运行(此步需要花费较长的时间) 之后再stag…

双向链表(双向带头循环)的增删查改的实现(简单易懂)

一:双向链表的概念 每个节点除开存有数据,还有一个指针指向前一个节点,一个指针指向后一个节点,尾节点和哨兵位互相指向,从而形成一个循环。 二:双向链表的实现第一点: 本文采用三个文件进行实…

Pycharm中安装tablepyxl失败

tablepyxl是一个存在的 Python 包,它是一个桥接 HTML 表格和 openpyxl 的工具,允许你将 HTML 表格转换成 Excel 工作簿。如果你想在 conda 环境中安装 tablepyxl,可以按照以下步骤进行: (1)打开conda终端。…

GIS数据—1984-2020中国1km人造夜间灯光观测数据

夜间灯光观测数据(Nighttime Light,NTL)是评估人类活动边界的常用手段,目前,该数据已经广泛应用于城市范围、不透水面、基础设施建设等一系列过程。今天,小编要带来的是长时间序列中国区域边界的夜间灯光观测数据。 数…

springcloud -nacos实战

一、nacos 功能简介 1.1.什么是Nacos? 官方简介:一个更易于构建云原生应用的动态服务发现(Nacos Discovery )、服务配置(Nacos Config)和服务管理平台。 Nacos的关键特性包括: 服务发现和服务健康监测动态配置服务动态DNS服务服务及其元数…

C++语法|explicit关键字

文章目录 1.C的隐式对象转换问题举例产生的问题 2.使用explicit解决上述问题总结 1.C的隐式对象转换问题 在C中,隐式对象转换(Implicit Object Conversion)指的是编译器在不需要程序员明确指示的情况下,自动将对象从一种类型转换…

VMware配置Kali linux + 物理机连接Xshell

VMware 配置 kali linux 首先需要先安装VMware Workstation 我是在Windows 安装的 VMware Workstation Pro 17 虚拟化,产品密钥。。这里不做多说了 下载kali linux 这里我下载的是kali-linux-2024.1 Note:这里选Virtual Machines,建议不要…

景源畅信:抖音小店的商品怎么同步到橱窗?

在数字营销的海洋中,抖音小店与橱窗的同步操作无疑是商家们关注的焦点。这不仅能增加商品的曝光度,还能提高交易的可能性。那么,如何将抖音小店的商品同步到橱窗呢? 一、核心步骤解析 要实现商品从抖音小店同步到橱窗,你需要确保…

【Linux 网络】网络编程套接字 -- 详解

⚪ 预备知识 1、理解源 IP 地址和目的 IP 地址 举例理解:(唐僧西天取经) 在 IP 数据包头部中 有两个 IP 地址, 分别叫做源 IP 地址 和目的 IP 地址。 如果我们的台式机或者笔记本没有 IP 地址就无法上网,而因为…

Unity引擎是什么?有哪些优点

大家好,我是咕噜土豆,很高兴又和大家见面了。今天我们一起来了解一下Unity引擎和它有哪些优点。 首先带大家了解什么是Unity引擎 Unity引擎是一款由Unity Technologies开发的跨平台游戏开发引擎,广泛用于创建2D和3D游戏以及其他交互式内容&…

C++动态内存区域划分、new、delete关键字

目录 一、C/C中程序的内存区域划分 为什么会存在内存区域划分? 二、new关键字 1、内置类型的new/delete使用方法: 2、new和delete的本质 一、C/C中程序的内存区域划分 为什么会存在内存区域划分? 因为不同数据有不同的存储需求&#xff0…

【SpringBoot记录】从基本使用案例入手了解SpringBoot-数据访问(1)

前言 在程序开发尤其是网页应用开发中,数据访问是必不可少的。通过前面的基本案例我们完成了一个简单的SpringBoot Web应用并对自动配置原理有了一定了解,本节在上述案例基础上,继续编写数据访问案例,将通过SpringBoot中数据访问…

音视频开发6 音视频录制原理和播放原理

音视频录制原理 音视频播放原理

VO、PO、DTO的区别

VO:值对象,用于视图层,它的作用是把某个指定页面(或组件)的所有数据封装起来。 PO:持久化对象,它跟持久层(通常是关系型数据库)的数据结构形成一一对应的映射关系&#…

# 电脑突然连接不上网络了,怎么办?

电脑突然连接不上网络了,怎么办? 一、原因分析: 1、IP 地址冲突 2、DNS 解析出现问题。 3、电脑网络设置是否打开了【移动热点】或【飞行模式】。 4、【WLAN AutoConfig】服务是否打开。 5、无线网卡驱动损坏。 6、检查 WIFI 开关是否…

java线程池源码解析:ThreadPoolExecutor源码,execute方法、addWorker方法解析

1. 概述 线程池 的作用不用太说了,线程池会按照一定的规则,创建和维护一定数量的线程。这些线程可以被循环利用,来处理用户提交的任务。对比不同线程池的使用方式,节省了频繁的创建和销毁线程带来的性能开销。 2. 概念理解 2…

从FasterTransformer源码解读开始了解大模型(2.0)代码通读01

从FasterTransformer源码解读开始了解大模型(2.0)代码解读01-看看头文件 写在前面的话 本篇的内容直接开始我们的代码通读,整个通读可能需要好几篇文章来将一整个gpt的代码结构给讲清楚。目前的计划是先从整体model层次开始讲,将…

Java8 Stream API在集合上执行复杂的数据处理查询

Java 8 引入的 Stream API 是一个高级工具,用于在集合上执行复杂的数据处理查询。Stream API 通过提供一系列的中间操作和最终操作,支持声明式处理(类似于SQL声明式语句)并且可以轻松使用多核架构。 创建Stream流 创建Stream 流…

HTML+VUE3组合式+ELEMENT的容器模板示例(含侧栏导航,表格,...)

一个简单的在html中使用Vue3及Element-plus vue-icons的整合示例&#xff1a; 一、示例截图 二、文件代码 直接复制到html文件在浏览器打开即可预览 <!DOCTYPE html> <html lang"en"> <head><meta charset"UTF-8"><title&g…

CCleaner系统优化与隐私保护工具,中文绿色便携版 v6.23.11010

01 软件介绍 CCleaner 是一款高级的系统优化工具&#xff0c;其设计宗旨在于彻底清理 Windows 操作系统中积累的无用文件和冗余的注册表项。此举旨在显著提升计算机的运行效率并回收磁盘空间。该软件拥有高效的能力&#xff0c;可以清除包括临时文件、浏览器缓存及其历史记录在…