linux与汇编

Linux操作系统是用C语言编写的,汇编只在必要的时候才被人们想到,但它却是减少代码尺寸和优化代码性能的一种非常重要的手段,特别是在与硬件 直接交互的时候,汇编可以说是最佳的选择。Linux提供了非常优秀的工具来支持汇编程序的开发,使用GCC的内联汇编能够充分地发挥C语言和汇编语言各 自的优点。

作为最基本的编程语言之一,汇编语言虽然应用的范围不算很广,但重要性却勿庸置疑,因为它能够完成许多其它语言所无法完成的功能。就拿 Linux 内核来讲,虽然绝大部分代码是用 C 语言编写的,但仍然不可避免地在某些关键地方使用了汇编代码,其中主要是在 Linux 的启动部分。由于这部分代码与硬件的关系非常密切,即使是 C 语言也会有些力不从心,而汇编语言则能够很好扬长避短,最大限度地发挥硬件的性能。
大多数情况下 Linux 程序员不需要使用汇编语言,因为即便是硬件驱动这样的底层程序在 Linux 操作系统中也可以用完全用 C 语言来实现,再加上 GCC 这一优秀的编译器目前已经能够对最终生成的代码进行很好的优化,的确有足够的理由让我们可以暂时将汇编语言抛在一边了。但实现情况是 Linux 程序员有时还是需要使用汇编,或者不得不使用汇编,理由很简单:精简、高效和 libc 无关性。假设要移植 Linux 到某一特定的嵌入式硬件环境下,首先必然面临如何减少系统大小、提高执行效率等问题,此时或许只有汇编语言能帮上忙了。
汇编语言直接同计算机的底层软件甚至硬件进行交互,它具有如下一些优点:


·         能够直接访问与硬件相关的存储器或 I/O 端口;


·         能够不受编译器的限制,对生成的二进制代码进行完全的控制;


·         能够对关键代码进行更准确的控制,避免因线程共同访问或者硬件设备共享引起的死锁;


·         能够根据特定的应用对代码做最佳的优化,提高运行速度;


·         能够最大限度地发挥硬件的功能。


 


同时还应该认识到,汇编语言是一种层次非常低的语言,它仅仅高于直接手工编写二进制的机器指令码,因此不可避免地存在一些缺点:


·         编写的代码非常难懂,不好维护;


·         很容易产生 bug,难于调试;


·         只能针对特定的体系结构和处理器进行优化;


·         开发效率很低,时间长且单调。


 


Linux 下用汇编语言编写的代码具有两种不同的形式。第一种是完全的汇编代码,指的是整个程序全部用汇编语言编写。尽管是完全的汇编代码,Linux 平台下的汇编工具也吸收了 C 语言的长处,使得程序员可以使用 #include、#ifdef 等预处理指令,并能够通过宏定义来简化代码。第二种是内嵌的汇编代码,指的是可以嵌入到C语言程序中的汇编代码片段。虽然 ANSI 的 C 语言标准中没有关于内嵌汇编代码的相应规定,但各种实际使用的 C 编译器都做了这方面的扩充,这其中当然就包括 Linux 平台下的 GCC。






二、Linux 汇编语法格式


绝大多数 Linux 程序员以前只接触过DOS/Windows 下的汇编语言,这些汇编代码都是 Intel 风格的。但在 Unix 和 Linux 系统中,更多采用的还是 AT&T 格式,两者在语法格式上有着很大的不同:

三、Hello World!


真不知道打破这个传统会带来什么样的后果,但既然所有程序设计语言的第一个例子都是在屏幕上打印一个字符串 “Hello World!”,那我们也以这种方式来开始介绍 Linux 下的汇编语言程序设计。


在 Linux 操作系统中,你有很多办法可以实现在屏幕上显示一个字符串,但最简洁的方式是使用 Linux 内核提供的系统调用。使用这种方法最大的好处是可以直接和操作系统的内核进行通讯,不需要链接诸如 libc 这样的函数库,也不需要使用 ELF 解释器,因而代码尺寸小且执行速度快。






Linux 是一个运行在保护模式下的 32 位操作系统,采用 flat memory 模式,目前最常用到的是 ELF 格式的二进制代码。一个 ELF 格式的可执行程序通常划分为如下几个部分:.text、.data 和 .bss,其中 .text 是只读的代码区,.data 是可读可写的数据区,而 .bss 则是可读可写且没有初始化的数据区。代码区和数据区在 ELF 中统称为 section,根据实际需要你可以使用其它标准的 section,也可以添加自定义 section,但一个 ELF 可执行程序至少应该有一个 .text 部分。下面给出我们的第一个汇编程序,用的是 AT&T 汇编语言格式:






例1. AT&T 格式


#hello.s


.data                    # 数据段声明


        msg : .string "Hello, world!\n" # 要输出的字符串


        len = . - msg                   # 字串长度


.text                    # 代码段声明


.global _start           # 指定入口函数


 


_start:                  # 在屏幕上显示一个字符串


        movl $len, %edx  # 参数三:字符串长度


        movl $msg, %ecx  # 参数二:要显示的字符串


        movl $1, %ebx    # 参数一:文件描述符(stdout)


        movl $4, %eax    # 系统调用号(sys_write)


        int  $0x80       # 调用内核功能


 


                         # 退出程序


        movl $0,%ebx     # 参数一:退出代码


        movl $1,%eax     # 系统调用号(sys_exit)


        int  $0x80       # 调用内核功能


 


初次接触到 AT&T 格式的汇编代码时,很多程序员都认为太晦涩难懂了,没有关系,在 Linux 平台上你同样可以使用 Intel 格式来编写汇编程序:


例2. Intel 格式


; hello.asm


section .data            ; 数据段声明


        msg db "Hello, world!", 0xA     ; 要输出的字符串


        len equ $ - msg                 ; 字串长度


section .text            ; 代码段声明


global _start            ; 指定入口函数


_start:                  ; 在屏幕上显示一个字符串


        mov edx, len     ; 参数三:字符串长度


        mov ecx, msg     ; 参数二:要显示的字符串


        mov ebx, 1       ; 参数一:文件描述符(stdout)


        mov eax, 4       ; 系统调用号(sys_write)


        int 0x80         ; 调用内核功能


                         ; 退出程序


        mov ebx, 0       ; 参数一:退出代码


        mov eax, 1       ; 系统调用号(sys_exit)


        int 0x80         ; 调用内核功能


 


上面两个汇编程序采用的语法虽然完全不同,但功能却都是调用 Linux 内核提供的 sys_write 来显示一个字符串,然后再调用 sys_exit 退出程序。在 Linux 内核源文件 include/asm-i386/unistd.h 中,可以找到所有系统调用的定义。






四、Linux 汇编工具


Linux 平台下的汇编工具虽然种类很多,但同 DOS/Windows 一样,最基本的仍然是汇编器、连接器和调试器。






1.汇编器


汇编器(assembler)的作用是将用汇编语言编写的源程序转换成二进制形式的目标代码。Linux 平台的标准汇编器是 GAS,它是 GCC 所依赖的后台汇编工具,通常包含在 binutils 软件包中。GAS 使用标准的 AT&T 汇编语法,可以用来汇编用 AT&T 格式编写的程序:


[xiaowp@gary code]$ as -o hello.o hello.s


 


Linux 平台上另一个经常用到的汇编器是 NASM,它提供了很好的宏指令功能,并能够支持相当多的目标代码格式,包括 bin、a.out、coff、elf、rdf 等。NASM 采用的是人工编写的语法分析器,因而执行速度要比 GAS 快很多,更重要的是它使用的是 Intel 汇编语法,可以用来编译用 Intel 语法格式编写的汇编程序:


[xiaowp@gary code]$ nasm -f elf hello.asm


 


2.链接器


由汇编器产生的目标代码是不能直接在计算机上运行的,它必须经过链接器的处理才能生成可执行代码。链接器通常用来将多个目标代码连接成一个可执行代 码,这样可以先将整个程序分成几个模块来单独开发,然后才将它们组合(链接)成一个应用程序。 Linux 使用 ld 作为标准的链接程序,它同样也包含在 binutils 软件包中。汇编程序在成功通过 GAS 或 NASM 的编译并生成目标代码后,就可以使用 ld 将其链接成可执行程序了:


3.调试器

有人说程序不是编出来而是调出来的,足见调试在软件开发中的重要作用,在用汇编语言编写程序时尤其如此。Linux 下调试汇编代码既可以用 GDB、DDD 这类通用的调试器,也可以使用专门用来调试汇编代码的 ALD(Assembly Language Debugger)。


从调试的角度来看,使用 GAS 的好处是可以在生成的目标代码中包含符号表(symbol table),这样就可以使用 GDB 和 DDD 来进行源码级的调试了。要在生成的可执行程序中包含符号表,可以采用下面的方式进行编译和链接:


[xiaowp@gary code]$ as --gstabs -o hello.o hello.s
[xiaowp@gary code]$ ld -o hello hello.o
执行 as 命令时带上参数 –gstabs 可以告诉汇编器在生成的目标代码中加上符号表,同时需要注意的是,在用 ld 命令进行链接时不要加上 -s 参数,否则目标代码中的符号表在链接时将被删去。
在 GDB 和 DDD 中调试汇编代码和调试 C 语言代码是一样的,你可以通过设置断点来中断程序的运行,查看变量和寄存器的当前值,并可以对代码进行单步跟踪。图1 是在 DDD 中调试汇编代码时的情景:
 用 DDD 中调试汇编程序


汇编程序员通常面对的都是一些比较苛刻的软硬件环境,短小精悍的ALD可能更能符合实际的需要,因此下面主要介绍一下如何用ALD来调试汇编程序。首先在命令行方式下执行ald命令来启动调试器,该命令的参数是将要被调试的可执行程序:

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/463214.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

MyBatis 逆向工程(MyBatis 自动生成接口以及xml)的使用

刚学MyBatis逆向工程(还以为要反汇编呢.....) MyBatis逆向工程 个人理解就是链接数据库自动生成相关的增删改查相关的类 以及xml文件 (其中有一些不足 应该就是多表链接的问题需要自己写吧) MyBatis逆向工程 一般和主项目分开 比较…

IE6-IE9兼容性问题列表及解决办法_补充之五:在IE9下, disabled的文本框内容被选中后,其他控件无法获得焦点问题...

先看一段Htm代码&#xff0c;里面一个disabled的文本框&#xff0c;一个普通可写的文本框&#xff0c;还有一个按钮&#xff0c;非常简单&#xff0c;代码如下&#xff1a;<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.o…

group by 的实现原理

转载&#xff1a;https://cloud.tencent.com/developer/article/1513067 写过 Sql 的同学应该都知道 group by 是用来对数据进行分组的&#xff0c;一般与聚合函数一起使用&#xff0c;对分组后的数据进行聚合。虽然大家都在用&#xff0c;但是有些同学还是不太清楚 group by …

怎么让sublime text3可以运行c/c++

轻巧便捷的sublime text 3代码编辑功能非常强大&#xff0c;并且很漂亮啊有木有&#xff01;&#xff01;&#xff01;&#xff01;以前我会在安装了CodeBlocks这样的编译器的基础上&#xff0c;再安装一个NotePad&#xff0c;作为编辑器。因为编辑器类似于记事本&#xff0c;只…

LeetCode:Path Sum II

Given a binary tree and a sum, find all root-to-leaf paths where each paths sum equals the given sum. For example: Given the below binary tree and sum 22, 5/ \4 8/ / \11 13 4/ \ / \7 2 5 1return [[5,4,11,2],[5,8,4,5] ]解题思路:通过遍历树保…

设有n个正整数,将他们连接成一排,组成一个最大的多位整数

题目描述&#xff1a; 设有n个正整数&#xff0c;将他们连接成一排&#xff0c;组成一个最大的多位整数。 如:n3时&#xff0c;3个整数13,312,343,连成的最大整数为34331213。 如:n4时,4个整数7,13,4,246连接成的最大整数为7424613。输入描述: 有多组测试样例&#xff0c;每组测…

C++中使用try{}catch()的优/缺点

优点&#xff1a;提高了代码的健壮性&#xff0c;防止因为没有接收到异常导致崩溃。 缺点&#xff1a;增加了系统的开销。 增加系统开销的原因 &#xff1a; try catch会在已有的代码上面增加额外的cost, 导致性能的降低。 这个额外的cost不是说只有throw exception的时候才会…

还在公司

原本都买好6点半回程的票了,但是突然来了个重要的会议.不得不留到现在&#xff0c;杯具的是参加会议的希腊人英语惨不忍睹. 10点钟坐GF的姐夫的车子回去&#xff0c;到家要12点以后了吧.转载于:https://www.cnblogs.com/JeffChen/archive/2009/12/18/2600174.html

odoo基础数据加载

odoo 基础数据加载 这里介绍的odoo基础数据加载分两种方式&#xff0c;一种是演示数据加载&#xff0c;一种是默认数据加载&#xff0c;下面就是详细介绍 首先&#xff0c;当然是创建一个date文件夹 项目目录&#xff0c;右键自定义一个文件夹XML数据定义格式 <record id&qu…

c++现在有一棵合法的二叉树,树的节点都是用数字表示,现在给定这棵树上所有的父子关系,求这棵树的高度

题目描述 现在有一棵合法的二叉树&#xff0c;树的节点都是用数字表示&#xff0c;现在给定这棵树上所有的父子关系&#xff0c;求这棵树的高度 输入描述: 输入的第一行表示节点的个数n&#xff08;1 ≤ n ≤ 1000&#xff0c;节点的编号为0到n-1&#xff09;组成&#xff0c; …

理解CSS3 transform中的Matrix(矩阵)

一、哥&#xff0c;我被你吓住了 打架的时候会被块头大的吓住&#xff0c;学习的时候会被奇怪名字吓住&#xff08;如“拉普拉斯不等式”&#xff09;。这与情感化设计本质一致&#xff1a;界面设计好会让人觉得这个软件好用&#xff01; 所以&#xff0c;当看到上面“Matrix(矩…

Rocksdb的优劣及应用场景分析

Rocksdb的优劣及应用场景分析 Rocksdb也是一样&#xff0c;也有它的优势劣势及特定的适用场景。今天我就从设计的角度来分析一下。 基础架构 上图就是Rocksdb的基础架构。Rocksdb中引入了ColumnFamily(列族, CF)的概念&#xff0c;所谓列族也就是一系列kv组成的数据集。所有…

MOSS服务器场迁移1-有关切换登录用户时需要刷新一次才能成功的问题

在本次的MOSS服务器场的迁移过程中&#xff0c;发现当我们新建好一个网站&#xff0c;然后用一个用户名和密码登录进去后&#xff0c;此时一切都很美好&#xff0c;但是当我们用其他的用户登录&#xff08;右上角的用其他的用户登录&#xff09;时&#xff0c;发现输入新的用户…

AWR报告中Top 10 Foreground Events存在”reliable message”等待事件的处理办法

操作系统版本&#xff1a;HP-UNIX B.11.31 数据库版本&#xff1a;11.2.0.4 RAC &#xff08;一&#xff09; 问题概要 &#xff08;1&#xff09;在AWR报告的Top 10 Foreground Events中发现reliable message占用了较高的DB Time&#xff0c;如下&#xff1a; Top 10 Foregrou…

疯狂java学习笔记1023---线程的同步

同步代码块&#xff1a; 文件并发被访问时容易造成异常。 同步代码块语法格式&#xff1a; synchronized(obj) { ... //此处的代码就是同步代码块 } obj是同步监视器 线程开始执行同步代码块之前&#xff0c;必须先获得对同步监视器的锁定。 注&#xff1a;任何时…

C语言const易错点

const int a; int const a; 这两个写法是等同的&#xff0c;表示a是一个int常量。const int *a; 表示a是一个指针&#xff0c;可以任意指向int常量或者int变量&#xff0c;它总是把它所指向的目标当作一个int常量。也可以写成int const* a;含义相同。int * const a; 表示a是一个…

Postgre体系结构图

原文链接&#xff1a;https://blog.csdn.net/q936889811/article/details/83030845 由于工作原因需要调研postgre部分的缓存模块&#xff1a;分给pg的内存不足时&#xff0c;将内存中的数据写出到外部file或者其他的介质中&#xff0c;防止内存不足时&#xff0c;系统运行缓慢…

业界资讯:adobe 技术开发中心 放出游戏单元

昨天晚上光顾了adobe 技术者开发中心&#xff0c;发现一个新的东西。看到大大标题显示出这个部分的内容. 可以看出adobe 未来一个动作&#xff0c;对游戏支持。flash 平台迅速进行推广&#xff0c;目前来讲flex 技术应用在社区开发和网页游戏比较多&#xff0c;这部分能够对企业…

asp.net 开发注意的几点

WIN7中组件服务中的DCOM配置找不到Microsoft Excel应用程序的解决办法: 这主要是64位系统的问题&#xff0c;excel是32位的组件&#xff0c;所以在正常的系统组件服务里是看不到的 可以通过在运行里面输入 comexp.msc -32 来打开32位的组件服务&#xff0c;在里就能看到excel组…

ubuntu安装codeblock的方法

由于本人比较喜欢体积较小的IDE&#xff0c;不喜欢太多东西&#xff0c;运行很慢的VS&#xff0c;所以在windows下发现了很好用的codeblock&#xff0c;现在把它安装到ubuntu系统的方法写下来总体方法很简单&#xff0c;用的最简单的apt安装的&#xff0c;也可以去官网下载code…