java 语义_Java文件合并变得语义化

java 语义

与任何程序员交谈,并询问他应该如何进行合并:“它应该理解代码,对其进行解析,然后根据结构进行合并” –他很可能会说。

而这恰恰是SemanticMerge for Java所做的:它解析要合并的文件(加上祖先或“文件在更改之前的状态”)并根据该信息进行操作。

为什么所有关于合并的嗡嗡声?

开发软件是一个协作过程。 如果您在团队中工作,迟早会有两个开发人员修改同一个文件。 每当发生这种情况

您必须合并。 实际上,合并并不仅限于创建分支(很多人会说),而是合并到处理相同文件的开发人员,即使他们在同一分支上进行合并(如果两个人在同一分支,同一文件上工作)他们将必须在签到时合并-或在Git行话中“提交”。

在合并方面,新一代的分布式版本控制系统(DVCS)比上一代做得更好。 这就是为什么许多人从SVN,CVS和较早的替代产品跳入Git的原因。

下一步不仅是在如何处理文件方面的更好算法,下一步是创建一种更好的机制来合并“文件内部”,这正是SemanticMerge的全部意义所在。

SemanticMerge旨在降低保持代码干净的成本

在开发合并工具时,我们始终牢记两个图形:1981年的Barry Bohem的更改成本和20年后的Kent Beck的相同图形:

时间贝克

一代又一代的开发人员被教导“波西姆原理”:“进行生产变更,与分析阶段引入的相同变更相比,这将花费您一笔巨款”。

然后,贝克提出了类似的建议:“保持代码干净,更改成本将保持不变”,这是敏捷方法背后的基石。

而这恰恰是SemanticMerge背后的口头禅:保持代码干净。 为什么? 因为它有回报。

通常,您会看到需要重新布置的类:“放下这两个私有方法,将公共构造函数上移,将私有字段移到底部……”但是您不这样做的原因是,也许有人触摸该文件,合并将变得地狱。 这正是SemanticMerge所解决的问题:它“知道”您移动了一个方法,因此不会被它所愚弄。

语义合并

现在让我们研究一个典型的语义合并案例。 假设您有一个带有几种方法的类。 第一个开发人员将其中一个方法移动到类中的其他位置,并且还修改了该方法。 同时,第二个开发人员在原始位置修改了该方法。

查看下图:

语义合并

常规的基于文本的合并工具将无法处理这种情况,但是SemanticMerge能够识别该方法发生了什么并提出以下合并情况:

语义合并无为

如您所见,它标识方法“ onBuildHeaders”已被并行修改(检查打印方法名称的栏两边的“ c”图标)并已移至其中一个贡献者(选中“ m”图标)。

现在,进行合并的开发人员可以在“ onBuildHeaders”方法上运行“合并”,该方法将仅合并冲突的方法,并保留新位置。

SemanticMerge如何工作?

您可能会猜到,SemanticMerge首先解析所涉及的3个文件的代码(原始文件加上两个贡献者),然后计算每个文件的结构:这是树的代码表示形式。

完成此操作后,SemanticMerge开始使用3棵树:首先计算一个贡献者与原始版本之间的差异,然后与另一个贡献者重复该过程。

第三步是合并计算本身:它将遍历两对差异并检查它们是否碰撞。 如果它们这样做,则存在合并冲突。 如果相同的方法已被移动或修改两次,以此类推,则可能发生这种情况。 计算稍微复杂一点,因为不仅必须在冲突相同方法时还要计算冲突,而且还必须在其容器中存在冲突时计算冲突(例如,在父类之间进行“有区别的”重命名等)。

还值得补充的是,为了在重命名方法(或字段,属性等)时跟踪它们,SemanticMerge计算“相似性索引”以查看方法主体之间的接近程度以及匹配度何时良好,它假定它是相同的元素。

一些数字

我们重新运行了约4万个合并,下载了将近500个开源项目。 这意味着我们拉出存储库,找到所有合并,然后通过SemanticMerge工具再次运行它们。

这样做,我们发现了以下数字:

  • 当前的合并中有23%是“语义”的,这意味着它们具有的内容不是“变-变”冲突。 它可以是代码移动,在同一位置添加多个方法,移动和更改方法等等。
  • 在这4万次合并中,我们发现1.54%的合并从手动变为全自动。 这不是一个很大的数字,这意味着一旦团队开始使用SemanticMerge,它就会增长。 (这些数字是使用与当前语言无关的合并工具重新运行合并的结果,因此开发人员倾向于避免对文件进行复杂的更改)。
  • 在通过SemanticMerge和传统的基于文本的合并工具运行代码时,我们计算了合并冲突中涉及的行数,我们发现,使用SemanticMerge,冲突中涉及的代码行减少了97%……这意味着工作量减少了去做!!

数字语义

免费开源

在测试SemanticMerge时,我们提取了约500个长期运行,狂热的开放源代码存储库,然后我们“重放”了所有合并。 在列表中,有像hibernate,openjdk,apache-lucene,jbos,monodevelop,mono,monomac,monogame,nhibernate之类的存储库,这确实很有帮助。

因此,我们决定免费为对开源项目做出贡献的开发人员免费使用SemanticMerge,因为我们相信可以回馈。 您可以在这里查看 !

参考:我们的JCG合作伙伴 Pablo Santos在SemanticMerge博客上对Java文件合并进行了语义化 。

翻译自: https://www.javacodegeeks.com/2013/06/java-file-merging-goes-semantic.html

java 语义

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/348447.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

python循环指令_Python循环

布尔运算学习循环之前,先了解一个概念:布尔运算布尔运算是数字符号化的逻辑推演法,包括联合、相交、相减。在图形处理操作中引用了这种逻辑运算方法以使简单的基本图形组合产生新的形体,并由二维布尔运算发展到三维图形的布尔运算…

Apache Pulsar:分布式发布订阅消息系统

Apache Pulsar是一个开源的分布式pub-sub消息传递系统,最初由Yahoo创建,并且是Apache Software Foundation的一部分 。 Pulsar是用于服务器到服务器消息传递的多租户高性能解决方案。 脉冲星的主要功能包括[4]: 对Pulsar实例中的多个集群的…

查看mysql进程ps_linux ps命令查看当前运行的进程

Linux中的ps命令是Process Status的缩写。ps命令用来列出系统中当前运行的那些进程。ps命令列出的是当前那些进程的快照,就是执行ps命令的那个时刻的那些进程,如果想对进程进行实时的监控,应该用 top 命令。要对进程进行监测和控制&#xff0…

java获取文件编码_java如何获取文件编码格式

1:简单判断是UTF-8或不是UTF-8,因为一般除了UTF-8之外就是GBK,所以就设置默认为GBK。按照给定的字符集存储文件时,在文件的最开头的三个字节中就有可能存储着编码信息,所以,基本的原理就是只要读出文件前三…

java上传文件功能_Java MemoryMapped文件的功能

java上传文件功能Java MemoryMapped文件的功能 在JDK 1.4中,内存映射文件的一个有趣功能被添加到Java中,该功能允许将任何文件映射到OS内存以进行有效读取。 内存映射文件可用于开发IPC类型的解决方案。 本文是使用内存映射文件创建IPC的实验。 有关内存…

java代码快速_java代码编写快捷途经

CtrlR 然后按下R键SHiftAltR:对选定属性进行全局命名CtrlD:删除当前行CtrlQ: 定位到最后编辑的地方CtrlL: 定位在某行CtrlM: 最大化当前的 Edit(命令)CtrlO:快速显示大纲CtrlD:显示继承结构CtrlW :关掉当…

控制Java并行流的并行度

在掌握了这些新功能之后,随着Java 9的最新发布,我们有了许多新功能可以用来改进我们的解决方案。 Java 9的发布也是修改我们是否掌握Java 8功能的好时机。 在本文中,我想解决关于Java并行流的最常见的误解。 人们通常说您不能以编程方式控制…

java小型超市系统_Java小型超市收银系统

【实例简介】Java SE开发的超市收银系统,实现了数据库操作,文件读取数据,写入数据等操作【实例截图】【核心代码】超市收银系统└── 期末综合├── bin│ ├── Driver.class│ ├── control│ │ ├── ExportMenuController…

double取值范围 java_Java中float/double取值范围与精度

Java浮点数浮点数结构要说清楚Java浮点数的取值范围与其精度,必须先了解浮点数的表示方法,浮点数的结构组成,之所以会有这种所谓的结构,是因为机器只认识01,你想表示小数,你要机器认识小数点这个东西&#…

开源点云数据处理 开源_大数据开源安全

开源点云数据处理 开源在安全性方面从未有(恕我直言)已经足够了开源解决方案和布鲁斯已经撰写了有关这几个 时间在过去 ,而且也没有必要再次改写参数。 现在,随着市场上“ NoSQL”和“大数据”开源趋势的发展,安全终于…

为您的Web应用程序启用两因素身份验证

支持两因素身份验证(2FA)几乎总是一个好主意,尤其是对于后台系统。 2FA有许多不同的形式,其中一些包括SMS,TOTP甚至是硬件令牌 。 启用它们需要类似的流程: 用户转到其个人资料页面(如果要在注…

redis java序列化_java处理redis的几种序列化策略

简单记录一下java处理redis的几种序列化策略,这里使用的环境是springboot 2.0.4springboot中提供了StringRedisTemplate和RedisTemplate两种序列化类,它们都只能读自己存的数据,即数据互不相通。主要区别如下:1、采用的序列化策略…

java 访问内部类的属性_java中的内部类详细总结

内部类不是很好理解,但说白了其实也就是一个类中还包含着另外一个类如同一个人是由大脑、肢体、器官等身体结果组成,而内部类相当于其中的某个器官之一,例如心脏:它也有自己的属性和行为(血液、跳动)显然,此处不能单方…

迟来总比没有好:SSE或服务器发送的事件现在已在JAX-RS中

服务器发送的事件 (或简称为SSE )是非常有用的协议,它允许服务器通过HTTP将数据推送到客户端。 这是我们的网络浏览器支持的年龄,但令人惊讶的是, JAX-RS规范在很长一段时间内都忽略了这一点。 尽管Jersey提供了适用于…

java 面向对象继承的思想_Java面向对象思想

Java类的定义:成员变量会默认初始化,局部变量不会默认初始化。如何在内存中区分类和对象:♦类是静态的概念,代码区♦对象是new出来的,位于堆内存,类的每一个成员变量在不同的对象中都有不同的值(除了静态变…

java 垃圾回收手动回收_Java垃圾回收(4)

java 垃圾回收手动回收G1:垃圾优先 G1收集器是热点JVM中要实现的最新收集器。 自Java 7 Update 4以来,它一直是受支持的收集器。OracleGC团队也公开表示,他们对低暂停GC的希望是完全实现的G1。 这篇文章来自我之前的垃圾收集博客文章&#xf…

使用正确的垃圾收集器将Java内存使用量降至最低

大小对于软件至关重要。 很明显,与大型整体方法相比,在微服务体系结构中使用小型组件具有更多优势。 最新的Java版本的Jigsaw可帮助分解旧应用程序或从头开始构建新的云原生应用程序。 这种方法减少了磁盘空间,构建时间和启动时间。 但是&am…

java 鼠标画多个圆形_点击鼠标不同的建(左、中、右)画一个不同颜色的圆

[java]代码库import java.awt.Color;import java.awt.Graphics;import java.awt.event.MouseEvent;import java.awt.event.MouseListener;import javax.swing.JFrame;public class T1 extends JFrame{int x;int y;Color c;public T1(){this.setSize(600,400);this.setDefaultCl…

jslint4java_JSLint检测javascript的错误提示

“Missing semicolon.” : “缺少分号.”,“Use the function form of \”use strict\”.” : “使用标准化定义function.”,“Unexpected space after ‘-’.” : “在’-后面不应出现空格.”,“Expected a JSON value.” : “请传入一个json的值.”,“Mixed spaces and tabs.…

jar运行 osgi保存_自动化的OSGi测试运行程序

jar运行 osgi保存在我的团队成员中,我以忘记维护(JUnit)测试套件而闻名。 我只是无法完成手动添加测试套件这一额外步骤。 幸运的是,有连续的集成服务器可以按命名模式收集测试。 如果我介绍的一项孤立测试失败了,那么…