[论文笔记] Interleaving Static Analysis and LLM Prompting

news/2025/12/7 19:27:41/文章来源:https://www.cnblogs.com/sysss-blogs/p/19318229

Introduction

来自 PLDI’24 的 workshop SOAP。一种交错使用 LLM 和静态分析工具的方法,应用于 C 语言编写的系统代码中函数的错误规范推断问题。

image

Background

EESI

C 语言并没有错误处理。开发者会把错误代码作为返回值返回,对这些返回值的处理不当容易引发 bug。错误规范是指函数在发生错误时返回的值的集合。

EESI 就是针对错误规范的一个静态分析工具。EESI 接受多种形式的用户提供的可选初始领域知识:(1) 初始错误规范,(2) 一组已知的错误代码,(3) 成功代码,以及 (4) 仅在错误路径中被调用的错误函数。借助这些初始的领域知识,EESI 使用静态分析推断新的错误规格。推理规则包括:若函数返回一个预定义的错误码,则该值为错误值;若函数调用了“仅错误路径调用的函数”,则其返回值应为错误值等等。

EESI 具有两个固有缺陷:(1)EESI 的推理规则是对惯用的代码模式的建模,提供的近似不足以建模所有的程序,(2)EESI 无法处理第三方代码。

LLM

Overview example

image

EESI 对于 x509_get_attr_type_value 只推断出了 \(\bot\)。LLM 也没有推理出正确的错误规范,推断出错误路径上的返回值是负错误代码 MBEDTLS_ERR_X509_INV_NAME 加上任何非零值,也就是 \(\top\)。如果我们还在LLM提示中包含来自 EESI 的中间结果(图中的 Function Context),那么 LLM 能够返回 x509_get_attr_type_value 在错误时返回的值 \(< 0\)。LLM 也可以帮助 EESI 分析下面的这个代码的错误规范:

image

LLM 另一个好处是可以通过语义关系推测错误代码和未知外部函数的关系,比如函数 otrng_global_state_instance_tags_read_ from 和代码 OTRNG_ERROR

Approach

Prompt

提示词包括 common context,function context 和 question。

  • Common context 包括问题描述和EESI静态分析器使用的抽象域的解释,共同上下文还包含来自领域知识输入的任何错误代码、成功代码和错误函数。还提供多个基本的思维链示例以便 LLM 生成可解析的输出。
  • Function context 与正在被 LLM 查询的函数的任何相关的错误规范有关。

Error specification inference

image

由于第三方函数没有源代码定义,因此我们无法对其进行静态分析,所以交给 LLM 看是否能学到错误规范。如果 EESI 分析失败了,再次调用 LLM 进行分析。

这个工作的思路比较简单。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/991730.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

必考

必考1 全排列取消同步流,严禁混用cincout和printg 对于数组printf(“%5d”,ve[i]) 注意记得判断size大小 if (x == n + 1&&ve.size()==n) 不然可能输出无效解 ve.pop_back(); //pop_back不需要传入数 回溯…

一种 DAG 上可达性判定问题的解决方案

1. 问题简述 给定一个有向无环图 \(G=(V,E)\),记 \(n=|V|\),\(m=|E|\)。有 \(q\) 次查询,每次给定两个点 \(a\) 和 \(b\),判断是否存在一条以 \(a\) 为起点,\(b\) 为终点的简单路径。 其中 \(n,m\) 同阶,保证 \(…

网络空间威慑:通过“曝光”手段反制国家级网络间谍活动

在本期“两个极客”节目中,安全研究员The Grugq与政策情报专家Tom Uren深入探讨了是否可能通过“人肉搜索”等干扰措施来威慑国家行为体,使其停止网络间谍活动。内容涉及对特定黑客组织如“迷人小猫”的曝光案例分析…

Gemini 2.5原生音频技术与多模态能力解析

本文详细介绍了Gemini 2.5在音频对话与生成方面的原生技术能力,涵盖实时对话、可控文本转语音、多语言支持以及安全部署等核心技术架构与应用实现。Gemini 2.5的原生音频能力 Gemini自设计之初便是多模态的,原生理解…

实用指南:多种时间序列预测算法的MATLAB实现

pre { white-space: pre !important; word-wrap: normal !important; overflow-x: auto !important; display: block !important; font-family: "Consolas", "Monaco", "Courier New", …

[开源项目] 蜜蜂记账 v2.2 发布:暗黑模式、标签系统、预算管理等 10+ 新功能

项目介绍 蜜蜂记账(BeeCount)是一款开源的跨平台记账应用,使用 Flutter 开发,支持 iOS 和 Android。 项目最大的特点是数据自主可控:支持 iCloud、Supabase、WebDAV、S3 协议等多种云同步方案,用户可以将数据存储…

12 月记录

QOJ14945 QOJ14949 QOJ14711 QOJ14718 QOJ2064 CF2161F QOJ14685 QOJ14025 QOJ14419 https://atcoder.jp/contests/fps-24/tasks/fps_24_r QOJ14426 QOJ5039 P11983 [JOIST 2025] 展览会 3 / Exhibition 3 P13740 [NWE…

嵌入式软件架构--多窗口表明1(后台软件实现)

pre { white-space: pre !important; word-wrap: normal !important; overflow-x: auto !important; display: block !important; font-family: "Consolas", "Monaco", "Courier New", …

【09】Word文档处理工具

【09】Word文档处理工具 原理图文档处理工具 原理图库文档处理工具 PCB文档处理工具 PCB库文档处理工具 [0901]Word文档批量转换成PDF.rar 下载链接 [0902]Word文档批量转换成TXT.rar 下载链接

谁在主导“芯片战争”

“芯片,不只是电子元件,更是国家角力的新战场。” 过去三年,全球半导体产业如同棋盘上疾速变动的局面:美国推动芯片立法、拔高工具出口壁垒;台湾、韩国厂商扩张制造版图;中国则在稀土、设备供应链端反击。参与者…

定制化 Live555 实战:按需开发低耗 RTSP 服务器,完美适配 C# 项目 - 源之缘

深耕 Live555 源码核心,具备成熟定制化开发能力,可按需打造高性能 RTSP 服务器。封装的极简 C 接口,4 步即可完成部署,C#/.NET 可无缝集成,大幅降低开发门槛。底层复用 Live555 事件驱动架构,两路高清流并发 CPU…

KEIL5软件查看函数最大调用深度12.7

KEIL5软件查看函数最大调用深度12.7在option设置Linker页面,添加--info stack再重新编译后就可以在Map文件中查看到函数调用深度这个好像没什么关系,开不开都可以看到

2025深圳CNC加工实力榜:金丰业五金塑胶以精密智造领跑,六家本土技术标杆企业核心优势深度解析

2025深圳CNC加工实力榜:金丰业五金塑胶以精密智造领跑,六家本土技术标杆企业核心优势深度解析 在制造业向高端化、智能化转型的浪潮中,CNC(计算机数控)加工技术已成为衡量一个地区乃至一个国家先进制造能力的核心…

Day13-20251207

本文介绍了Java编程中的包机制和JavaDoc文档生成方法。包机制通过域名倒置命名规范组织类文件,使用package和import语句管理命名空间。JavaDoc用于生成API文档,支持@author、@version等参数标注,可通过命令行工具生…

一些复数的有趣的恒等式

1 \[|z_1 + z_2|^2 + |z_1 - z_2|^2 = 2(|z_1|^2 + |z_2|^2|) \]2 \[|\alpha - \beta|^2 = |\alpha|^2 + |\beta|^2 - 2\text{Re}(\overline{\alpha}\beta) = |\alpha|^2 + |\beta|^2 - 2\text{Re}(\alpha\overline{\b…

DeepSeek-OCR 模型的下载

前提,安装命令行工具 huggingface-cli 或者 hf 或 modelscope 或 aistudio 等命令行工具以及 git. HF_ENDPOINT=https://hf-mirror.com hf download deepseek-ai/DeepSeek-OCR --cache-dir ~/.cache/huggingface/hu…

C# 与 .NET 跨平台制作实战(第一章:开发环境搭建与.NET概述-上篇)

C# 与 .NET 跨平台制作实战(第一章:开发环境搭建与.NET概述-上篇)2025-12-07 18:46 tlnshuju 阅读(0) 评论(0) 收藏 举报pre { white-space: pre !important; word-wrap: normal !important; overflow-x: auto …

2025散热风扇厂家实力排行榜:万航电子以智能温控技术领跑,六家高潜力本土品牌深度解析

2025散热风扇厂家实力排行榜:万航电子以智能温控技术领跑,六家高潜力本土品牌深度解析 在工业自动化、数据中心、消费电子及新能源等产业高速发展的驱动下,散热风扇作为保障设备稳定运行的核心部件,其技术迭代与市…

AI 清洁管理系统:响应 3 秒,人力成本降低 42%

餐厅大厅本该是味蕾与氛围的交响,却常被垃圾满溢、地面油渍、灯光闪烁破坏:垃圾桶溢出酸腐味,顾客皱眉离席;地面湿滑无人知,高峰翻台卡壳;灯闪如迪厅,安全+体验双崩——2025年,餐饮环境投诉占总差评48%,平均每…

2025东莞力利机械压铸设备实力榜:六家国产技术代表企业,热室与冷室压铸机核心优势深度解析

2025东莞力利机械压铸设备实力榜:六家国产技术代表企业,热室与冷室压铸机核心优势深度解析 在全球制造业持续升级与精密化转型的浪潮下,压铸技术作为现代工业,尤其是汽车、电子、通信及高端五金领域不可或缺的成型…