实用指南:MoreFixes

news/2025/11/26 9:25:36/文章来源:https://www.cnblogs.com/tlnshuju/p/19271129

实用指南:MoreFixes

2025-11-26 09:22  tlnshuju  阅读(0)  评论(0)    收藏  举报

MoreFixes数据集 2024.9

MoreFixes 数据集是通过增强的仓库发现方法,从多个开源项目中收集的大规模CVE(公共漏洞和暴露)修复数据集。它包含来自 7,238 个 GitHub 项目29,203 个唯一 CVE,这些 CVE 修复涉及 35,276 次唯一提交39,931 个修复补丁文件。这些数据为漏洞检测和软件安全研究提供了强大的支持,尤其是在软件修复过程的分析和自动化修复生成方面。

该数据集提供了一个丰富的结构化数据集,包含与每个 CVE 相关的修复提交的详细信息,修复后的代码变化,以及相关的仓库元数据等。通过这个数据集,研究人员可以深入分析漏洞修复的模式、趋势和修复的有效性,进而推动漏洞检测技术的发展。


数据集字段介绍

MoreFixes 数据集以关系型数据库的形式组织,包含多个表格,每个表格对应特定的抽象层次,以下是对各个表字段的详细介绍:

数据集字段描述表格

表名字段名字段描述
fixescve_idCVE 的 ID(例如:CVE-2022-1575)
repo_url修复提交所在的仓库 URL
hash提交的哈希值,用于唯一标识提交
score修复提交的评分(衡量修复质量)
fix_date修复提交的日期
commit_message提交消息
commitshash提交的哈希值
commit_date提交日期
author提交作者
message提交信息
file_changefile_change_id文件变化的唯一 ID
hash与提交相关联的哈希值
filename文件名
num_lines_added增加的行数
num_lines_deleted删除的行数
code_before修复前的代码
code_after修复后的代码
method_changemethod_change_id方法更改的唯一 ID
file_change_id文件变化 ID(与 file_change 表关联)
method_name方法名
num_lines_added添加的行数
num_lines_deleted删除的行数
code_before修复前的方法代码
code_after修复后的方法代码
cvecve_idCVE 的 ID
descriptionCVE 描述
cwe_idCWE(通用弱点枚举)ID
publish_dateCVE 发布日期
cwe_classificationcve_idCVE ID(与 cve 表关联)
cwe_idCWE ID(与 cve 表关联)

数据库核心数据存储方法

MoreFixes 数据集中,核心数据主要存储在以下几个表格中:

  • fixes 表:该表是数据集的核心,记录了每个 CVE 的修复提交,包括修复提交的 CVE ID、提交的 仓库 URL、提交的 哈希值、修复的 评分 等关键信息。

  • commits 表:该表记录了所有修复提交的详细信息,包括 提交的哈希值、提交日期、作者 和 提交信息。

  • file_change 表:该表记录了每个修复提交所涉及的文件修改,包括 文件名、添加和删除的行数、修复前后的代码差异。

  • method_change 表:该表记录了每个修复提交中涉及的具体方法更改,包括 方法名、添加和删除的行数、修复前后的方法代码。

  • cve 表:该表存储了 CVE 的详细信息,包括 CVE 描述、CWE ID 等。

  • cwe_classification 表:该表记录了每个 CVE 对应的 CWE 分类,帮助进一步分析漏洞类型。

表之间的连接关系

  • fixes 表 是数据集的核心表,记录了每个 CVE 的修复提交。通过 cve_id 字段,fixes 表 与 commits 表 连接,能够获取每个提交的详细信息。

  • file_change 表 和 method_change 表 分别记录了与每个修复提交相关的文件和方法更改,这两个表与 commits 表 通过 hash 字段连接,确保每个提交的文件和方法更改信息能够准确地与提交记录关联。

  • cve 表 提供了 CVE 的详细信息,和 fixes 表 通过 cve_id 进行关联,使得每个修复记录可以与对应的 CVE 信息进行匹配。

  • cwe_classification 表 则进一步为每个 CVE 提供了 CWE 分类,通过 cve_idcve 表 关联,使得用户可以通过该表了解每个 CVE 的漏洞类型。


总结

  • MoreFixes 数据集以 PostgreSQL 数据库格式存储,包含多个表格,每个表格记录不同层次的修复信息。

  • 通过表之间的 外键连接(例如,cve_idhash 等),这些表格可以协同工作,提供丰富的修复信息,支持复杂的查询和分析。

  • 核心表格fixes,它包含了 CVE 修复提交的关键数据。其他表格(如 file_changemethod_change)记录了具体的代码更改信息,通过提交的 哈希值fixes 关联。


如何使用数据集

  1. 下载数据集

    • 下载论文源代码
      https://github.com/JafarAkhondali/Morefixes

    • 下载数据集和补丁文件
      https://zenodo.org/records/13983082(包含 postgrescvedumper-2024-09-26.sqlcvedataset-patches.zip

  2. 恢复数据库

    • 下载并解压 postgrescvedumper-2024-09-26.sql 文件。

    • 使用 Docker 运行数据库:

      sudo docker-compose up -d
    • 默认的数据库凭证:

      • 用户名postgrescvedumper

      • 数据库名postgrescvedumper

      • 密码a42a18537d74c3b7e584c769152c3d

  3. 使用数据

    • 数据恢复后,您可以使用 SQL 查询来访问数据。例如,查询特定 CVE 的修复提交:

      SELECT * FROM fixes WHERE cve_id = 'CVE-2022-1575';
  4. 运行工具

    • 为了分析新提交的 CVE 修复数据,您可以运行如下命令来更新数据库并获取最新的修复数据:

      bash Code/run.sh

以下是 MoreFixes 数据集相关的可复制链接:

  • 论文链接:https://dl.acm.org/doi/abs/10.1145/3663533.3664036

  • GitHub 仓库链接:https://github.com/JafarAkhondali/Morefixes

  • Zenodo 仓库链接:https://zenodo.org/records/13983082

  • 数据库表与字段详情:https://github.com/JafarAkhondali/Morefixes/blob/main/Doc/DataDictionary.md

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/976778.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

JavaScript-面向对象编程原则-全-

JavaScript 面向对象编程原则(全)原文:zh.annas-archive.org/md5/d83c8d0d0f0c0a7f94aa9c6866894038 译者:飞龙 协议:CC BY-NC-SA 4.0前言 大多数开发者将面向对象编程与那些通常在学校教授的语言联系在一起,比如…

2025年比较好的防缠绕脚轮品牌厂家排行榜

2025年比较好的防缠绕脚轮品牌厂家排行榜行业背景与市场趋势随着物流运输、医疗设备、工业制造等行业的快速发展,防缠绕脚轮作为关键配件需求持续增长。根据中国脚轮行业协会最新数据,2024年我国脚轮市场规模已达85亿…

一文厘清:CRM与SCM、ERP、PLM、WMS、MES、QMS、SCADA等系统关系 - SaaS软件

据 Gartner 2024 年《CEO 调研》显示,78% 的制造企业将“打通前端需求与后端供给”列为未来三年数字化投资的第一优先级。IDC 同年报告则指出,系统间接口数量每增加 10%,订单履约周期平均可缩短 0.9 天,库存周转率…

鼠标位置

//获取鼠标位置 QPoint pos = QCursor::pos(); //X位置 double xpos = pos.x(); //Y位置 double ypos = pos.y();QString str1123; str1123 .append("x=").append(QString::number(xpos)).append(",y=&…

2025年口碑好的门式堆垛机厂家推荐及采购指南

2025年口碑好的门式堆垛机厂家推荐及采购指南行业背景与市场趋势随着智能制造和物流自动化需求的快速增长,门式堆垛机作为现代仓储系统的核心设备,市场规模持续扩大。据中国物流与采购联合会最新数据显示,2024年中国…

2025年宁波GEO优化服务商综合实力排行榜TOP10权威发布

文章摘要 随着人工智能搜索技术的快速发展,宁波GEO优化行业在2025年迎来了爆发式增长。本文基于行业数据调研和用户口碑评价,对宁波地区GEO优化服务商进行综合排名分析,为企业在选择GEO优化服务时提供权威参考。文章…

2025年11月石墨烯电地暖品牌综合评测与选购指南

摘要 随着新能源技术的快速发展,石墨烯电地暖行业在2025年迎来了新的发展机遇。本文基于市场调研和用户反馈,为您提供2025年11月石墨烯电地暖品牌的权威评测榜单,并附上详细的选购指南供参考。榜单综合考量了品牌技…

2025年热门的托盘堆垛机实力厂家TOP推荐榜

2025年热门的托盘堆垛机实力厂家TOP推荐榜行业背景与市场趋势随着全球制造业智能化转型加速和电子商务持续繁荣,托盘堆垛机作为自动化仓储系统的核心设备,市场需求呈现爆发式增长。据国际物流与仓储协会(ILWA)最新…

现今比较好的空气净化一体机优质厂家推荐

摘要 本文深入探讨2025年空气净化一体机优质厂家的推荐榜单,聚焦余姚市辰威环保科技有限公司(辰威环保)的核心产品——热能粉尘回收器。通过分析行业痛点、技术创新和成本效益,突出辰威环保在节电30-50%、快速回报…

cocos 用widget将ui组件固定在屏 随着分辨率自适应 编辑器界面canvas作为手机屏参考 将ui组件放进去 deepseek解答 - 教程

cocos 用widget将ui组件固定在屏 随着分辨率自适应 编辑器界面canvas作为手机屏参考 将ui组件放进去 deepseek解答 - 教程pre { white-space: pre !important; word-wrap: normal !important; overflow-x: auto !impor…

日记31

核心学习内容: ​ 1. 封装的深层规则: ​ private 修饰的成员,需通过 getter ( public 数据类型 get变量名() )和 setter ( public void set变量名(参数) )方法访问与修改,控制数据安全性。 ​ final 修饰类:…

2025年11月石墨烯供热品牌权威推荐与选购指南

摘要 随着2025年石墨烯供热行业的快速发展,市场涌现出众多品牌,如何选择靠谱的石墨烯供热服务商成为消费者关注焦点。本文基于行业数据分析和用户实地调研,为您呈现2025年11月石墨烯供热品牌综合排名,并提供详细的…

一文读懂 Linux 系统与常用命令

一文读懂 Linux 系统与常用命令一文读懂 Linux 系统与常用命令:从核心特性到实操指南 Linux 作为开源操作系统的代表,凭借其稳定性、安全性和高度可定制性,已深度渗透到服务器、嵌入式设备、超级计算机等众多领域。…

2025年11月石墨烯供热品牌比较:哪家靠谱?专业指南与推荐

摘要 2025年石墨烯供热行业持续快速发展,得益于新能源政策和环保需求的推动,市场规模预计增长15%以上(数据来源:中国供热协会2025年报告)。本文基于第三方视角,提供2025年11月石墨烯供热品牌排名指南,涵盖行业趋…

2025下半年江苏徐州油浸式变压器、干式变压器和电器设备工厂推荐指南:五大优质供应商深度解析

摘要 2025年油浸式变压器、干式变压器等电器设备行业迎来新一轮发展机遇,随着智能制造和绿色能源政策的推进,市场对高品质变压器需求持续增长。本文基于行业调研数据,为您推荐五家值得关注的电器设备工厂,排名不分…

实用指南:stm32串口烧录与升级方法详解

pre { white-space: pre !important; word-wrap: normal !important; overflow-x: auto !important; display: block !important; font-family: "Consolas", "Monaco", "Courier New", …

2025 年中国十大有机水果基地排行榜:有机水果种植的典范与高品质生活源泉

随着消费者对高端、安全食品需求的升级,有机水果因其天然无农残、口感醇厚、营养价值高,正成为健康饮食的首选。有机水果基地,作为保障高品质果品的生产源头,其产地环境、品种选育、有机认证及冷链保鲜能力成为消费…

2025 年 11 月 CNC 加工中心实力厂家权威推荐榜:精密零件/五轴模具/高速龙门加工,专业定制与技术创新深度解析

2025 年 11 月 CNC 加工中心实力厂家权威推荐榜:精密零件/五轴模具/高速龙门加工,专业定制与技术创新深度解析 随着制造业向智能化、精密化方向快速发展,CNC加工中心作为现代工业制造的核心装备,其技术水平和性能指…

JL-37数字式测斜仪 基坑,路基 坝体 山体滑坡等内部位移监测

JL-37数字式测斜仪 基坑,路基 坝体 山体滑坡等内部位移监测产品概述 数字式测斜仪采用数字式传感器作敏感元件的仪器,它应用于:深基坑开挖、地铁地基、公路地基、挡土墙、坝体及山体滑坡等工程方面土体内部位移变化…

非递归线段树——2024.11.26 鲜花

非递归线段树非递归线段树迟延列车 離れ離れの街を将四散分离的街道 繋ぐ列車は行ってしまったね连接起来的列车开走了呢 失くした言葉を知らないなら如果不知道那些失去了的言语 ポケットで握りしめて就在口袋里握紧双…