论文浅尝 | LGESQL: 结合线性有向图以及普通有向图的自然语言转换SQL语句模型...

LGESQL: Line Graph Enhanced Text-to-SQL Model with Mixed Local and Non-Local Relations

笔记整理:郭心南

来源:ACL2021

链接:https://arxiv.org/abs/2106.01093

Github地址:https://github.com/rhythmcao/text2sql-lgesql

概述

本文主要关注多表关联下的自然语言转换SQL语句(Text-to-SQL)的工作,在已有的数据库中,根据描述查询内容的自然语言问句来生成相应的SQL语句用于检索,其中表与表之间存在外键的关联。

为了更好建模问题与数据库schema之间,以及schema内部 的关系,本文提出了一种结合线性有向图以及普通有向图的Text-to-SQL模型(Line Graph Enhanced Text-to-SQL Model),通过引入线性有向图,在简化图的同时突出边信息。同时本文还设计了图修剪的辅助任务,并且对局部图特征和非局部图特征进行表示上的区分。

动机

3788e311bd57692521bcb4db4b012e4f.png

目前已经有多个工作提出用有向图的方法来构建问题与数据库schema内部之间的关系,并用图神经网络(GNN)来进行编码。然而这些方法普遍存在两个问题:

1)无法很好的找出整个查询所涉及的路径;

2)针对图中每个节点,没有对局部邻居以及非局部邻居进行区分。并且这些方法在图表征上比较注重节点的表示,而忽略了边中大量存在的语义信息。

方法

•线性有向图的构建

线性有向图中的节点和边分别是普通有向图中的边和节点,对普通有向图中顺序连接的边,在线性有向图中用有向边连接,而对于没有连接关系的边,则在线性有向图中不添加边。这种构图方法一方面增强了普通有向图中边的信息的使用,另一方面线型图能很好的找到查询所相关的主路径。

cb944d9dd670840cfea29909146a9662.png

•模型

在模型方面,本文使用了两个关系图注意力神经网络(Duel Relation Graph Attention Network,简称Duel RGAT),这两个RGAT分别对普通有向图和线性有向图进行编码。

f5044e60711ce5a66134d1c54e2ce2d5.png

其中RGAT^n和RGAT^e分别用于普通有向图和线性有向图,X^l和Z^l分别表示第层RGAT中普通有向图和线性有向图的矩阵表示;Z_{nlc}表示线性有向图中非局部邻居部分的图;G表示RGAT的层。

7850d4e879ca4c257f8a4a414e6a95de.png

RGAT的前向传播过程如下:

b9d0b3120af886a28285e4a9e0e5c88a.png

其中W是参数矩阵,H表示列的个数,FFN表示前向传播网络,N_i^n表示对节点v_i^n相应的表示,n表示table的序号,i表示列的序号,\phi表示对关系获取相应的向量表示。

在RGAT^n前向传播时,会使用RGAT^e中的表示,在这个过程中,本文采用了动态与静态相结合的方式。即对于RGAT^n中的某一节点来说,它会使用RGAT^e中局部邻居节点实时更新的向量表示,即动态;同时对于非局部邻居节点,它会使用预训练模型或者GloVe中的Embedding向量,即静态。

d512d8363355cd14803d3b26e9bd6335.png

•图修剪

e11d0eb5b72449414d22ece657149007.png

在主要的SQL生成任务的同时,本文还提出了图修剪的辅助任务,用于提升模型对自然语言问题相关联的schema部分的识别能力。这里采用的是分类,即对候选schema中的所有节点采用二分类的方式来判断当前节点是剪裁还是保留。

d34431326de98d9368f562dd9a513dd8.png

22c5f7c449d44798e32087228e3d6fa7.png

实验

本文的实验主要在Spider数据集上进行验证,并根据不使用预训练模型,实用泛用性预训练模型,和实用text-to-SQL领域特定的预训练模型来与已有办法进行对比。该方法目前结合ELECTRA结合能达到Spider的SOTA。

fd0db5dfa0394433b92bd0798f5ed783.png


OpenKG

OpenKG(中文开放知识图谱)旨在推动以中文为核心的知识图谱数据的开放、互联及众包,并促进知识图谱算法、工具及平台的开源开放。

529fd853e7ed0d74c23a153e7f6c13ad.png

点击阅读原文,进入 OpenKG 网站。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/477995.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

召回粗排精排-级联漏斗(上)

文 | 水哥源 | 知乎saying1. 把点击多的item曝光提升是推荐模型的基本能力,也是基本要求。后验不好的曝光提高也可能是好模型,后验好的曝光不提高,可以开除推荐模型了2. 在起量阶段,各路item需要争宠,谁能最快博取精排…

美团Android资源混淆保护实践

前言 Android应用中的APK安全性一直遭人诟病,市面上充斥着各种被破解或者汉化的应用,破解者可以非常简单的通过破解工具就能对一个APK进行反编译、破解、汉化等等,这样就可以修改原有代码的逻辑、添加新代码、添加或修改资源、或者更有甚者植…

细说ReactiveCocoa的冷信号与热信号(二):为什么要区分冷热信号

前一篇文章我们介绍了冷信号与热信号的概念,可能有同学会问了,为什么RAC要搞得如此复杂呢,只用一种信号不就行了么?要解释这个问题,需要绕一些圈子。 前面可能比较难懂,如果不能很好理解,请仔细…

jupyter 扩展工具添加自动补全代码功能+pep8+字体大小+代码行号+拼写检查+目录索引+代码自动补全

自动补全代码功能pep8字体大小代码行号拼写检查目录索引代码自动补全 我知道你会用Jupyter Notebook,但这些插件你都会了吗?

搞不懂,为啥现在什么公司都在考算法???

昨天在知乎上刷到一个热门问题:程序员需要达到什么水平才能顺利拿到 20k 无压力?其中一个最热门的回答是:“其实,无论你是前端还是后端、想进大厂还是拿高薪,算法都一定很重要。”为什么,算法会如此重要?不…

OpenKG开源系列 | 中文高中地理知识图谱CKGG(南京大学)

OpenKG地址:http://openkg.cn/dataset/ckggGitHub地址:https://github.com/nju-websoft/CKGG数据地址:https://doi.org/10.5281/zenodo.4668711论文地址:https://doi.org/10.1007/978-3-030-88361-4_25开放许可协议:CC…

LeetCode 892. 三维形体的表面积(数学)

1. 题目 在 N * N 的网格上,我们放置一些 1 * 1 * 1 的立方体。 每个值 v grid[i][j] 表示 v 个正方体叠放在对应单元格 (i, j) 上。 请你返回最终形体的表面积。 示例 1: 输入:[[2]] 输出:10示例 2: 输入&#x…

细说ReactiveCocoa的冷信号与热信号(一)

背景 ReactiveCocoa(简称RAC)是最初由GitHub团队开发的一套基于Cocoa的FRP框架。FRP即Functional Reactive Programming(函数式响应式编程),其优点是用随时间改变的函数表示用户输入,这样就不需要可变状态了…

淘宝数据,数据处理,时间序列分析,获客分析,购买路径分析

-- 创建数据库 create database taobao; use taobao; desc use_behaviour;-- 创建表格 create table use_behaviour( user_id int(9), item_id int(9), category_id int(9), behaviour_type varchar(5), timestamps int(14));-- 查询已导入多少条 select count(*) from use_…

谁说发 paper 一定要追快打新?2021年,研究 word2vec 也能中顶会!

文 | jxyxiangyu前言“小夕,小夕,你关注的任务sota又被刷新了!”“什么?!”还在跑实验的小夕默默流下了辛酸泪不得不说nlp领域的发展真的太快了,炼丹师们不光要时刻关注前沿热点,还要快速做出实…

论文浅尝 | Multilingual LAMA: 探索多语言预训练语言模型中的知识

笔记整理:谭亦鸣,东南大学博士生来源:EACL‘21链接:https://aclanthology.org/2021.eacl-main.284.pdf概述本文关注将语言模型(LM)视作一个知识库,然后用于解决例如句子填空这样的NLP任务&#…

LeetCode 860. 柠檬水找零(贪心)

1. 题目 在柠檬水摊上,每一杯柠檬水的售价为 5 美元。 顾客排队购买你的产品,(按账单 bills 支付的顺序)一次购买一杯。 每位顾客只买一杯柠檬水,然后向你付 5 美元、10 美元或 20 美元。你必须给每个顾客正确找零&…

召回粗排精排-级联漏斗(下)

文 | 水哥源 | 知乎saying召回区分主路和旁路,主路的作用是个性化向上管理,而旁路的作用是查缺补漏。推荐系统的前几个操作可能就决定了整个系统的走向,在初期一定要三思而后行。做自媒体,打广告,漏斗的入口有多大很重…

深入理解 Objective-C:方法缓存

摘要 只要用到Objective-C,我们每天都会跟方法调用打交道。我们都知道Objective-C的方法决议是动态的,但是在底层一个方法究竟是怎么找到的,方法缓存又是怎么运作的却鲜为人知。本文主要从源码角度探究了Objective-C在Runtime层的方法决议&am…

学术联赛 | 运用知识图谱技术,赋能多领域应用 ——“未来杯”AI学术联赛总决赛暨颁奖典礼圆满落幕...

本文转载自公众号:AI学习社。由北京大学软件工程国家工程研究中心主办,华为终端有限公司及中软国际教育科技集团全程战略支持,STEER TECH科技平台、北京乐智元素科技有限公司、艾肯文化传媒(北京)有限公司、AI TIME承办…

LeetCode 1013. 将数组分成和相等的三个部分

1. 题目 给定一个整数数组 A&#xff0c;只有我们可以将其划分为三个和相等的非空部分时才返回 true&#xff0c;否则返回 false。 形式上&#xff0c;如果我们可以找出索引 i1 < j 且满足 (A[0] A[1] … A[i] A[i1] A[i2] … A[j-1] A[j] A[j-1] … A[A.lengt…

异常值检测

#设定异常值比例 outliers_fraction 0.01# 初始化 LSCP 探测集 detector_list [LOF(n_neighbors5), LOF(n_neighbors10), LOF(n_neighbors15),LOF(n_neighbors20), LOF(n_neighbors25), LOF(n_neighbors30),LOF(n_neighbors35), LOF(n_neighbors40), LOF(n_neighbors45),LOF(…

谷歌 | 多任务学习,如何挑选有效的辅助任务?只需一个公式!

文 | 小伟编 | 小轶前言说到多任务学习&#xff0c;大家都不陌生&#xff0c;不管是在学术界还是工业界都已经有了很多成熟的探索与应用。在理想的多任务学习中&#xff0c;各个任务对彼此应当是有益的&#xff0c;所有任务相互促进&#xff0c;从而达到超过单任务学习的效果。…

LeetCode 888. 公平的糖果交换(哈希set)

文章目录1. 题目2. 解题2.1 暴力查找2.2 哈希set1. 题目 爱丽丝和鲍勃有不同大小的糖果棒&#xff1a;A[i] 是爱丽丝拥有的第 i 块糖的大小&#xff0c;B[j] 是鲍勃拥有的第 j 块糖的大小。 因为他们是朋友&#xff0c;所以他们想交换一个糖果棒&#xff0c;这样交换后&#…

剑指offer-python代码解释-习题解答-空白请点击阅读更多

版权声明&#xff1a;本文为博主原创文章&#xff0c;未经博主允许不得转载。 https://blog.csdn.net/u012505432/article/details/52071537 </div><link rel"stylesheet" href"https://csdnimg.cn/release/phoenix/template/css/ck_htmledit_v…