gcc/g++等编译器 编译原理: 预处理,编译,汇编,链接各步骤详解

http://blog.csdn.net/elfprincexu/article/details/45043971


概述

C和C++编译器是集成的,编译一般分为四个步骤:

  1. 预处理(preprocessing)  ----------------- cpp/ gcc -E 
  2. 编译(compilation) ------------------ cc1 / gcc -S
  3. 汇编(assembly)  -------------------- as / gcc -c
  4. 连接(linking) --------------------- ld / gcc -o




gcc

  认为预处理的文件是(.i)是C文件,并且设定C形式的连接;

g++

  认为预处理的文件是(.i)是C++文件,并且设定C++形式的连接;

 

源文件后缀名的一些含义和后续的操作:

  • .c       C源程序        预处理,编译,汇编
  • .C      C++源程序        预处理,编译,汇编
  • .cc       C++源程序  
  • .cxx       C++源程序        预处理,编译,汇编
  • .m       Objective-C源程序   预处理,编译,汇编
  • .i       预处理后的C文件     编译,汇编
  • .ii      预处理后的C++文件   编译,汇编
  • .s      汇编语言源程序     汇编
  • .S      汇编语言源程序     预处理,汇编
  • .h      预处理器文件      通常不出现在命令行上  


其他后缀名的文件被传递给连接器(linker).通常包括:


  .o 目标文件(Object file)


  .a 归档库文件(Archive file)

 

转载请注明出处: http://blog.csdn.net/elfprincexu


二、具体介绍一下GCC编译步骤

首先,有以下hello.c源代码

[cpp] view plain copy
  1. #include<stdio.h>  
  2.   
  3. int main()  
  4. {  
  5.       printf("Hello! This is our embedded world!\n");  
  6.   
  7.       return 0;  
  8. }  

(1)预处理阶段

在该阶段,编译器将上述代码中的stdio.h编译进来,并且用户可以使用Gcc的选项”-E”进行查看,该选项的作用是让Gcc在预处理结束后停止编译过程。预处理阶段主要处理#include和#define,它把#include包含进来的.h 文件插入到#include所在的位置,把源程序中使用到的用#define定义的宏用实际的字符串代替,我们可以用-E选项要求gcc只进行预处理而不进行后面的三个阶段,


 注意 : Gcc指令的一般格式为:Gcc [选项] 要编译的文件 [选项] [目标文件]

 其中,目标文件可缺省,Gcc默认生成可执行的文件,命为:编译文件.out
 

[root@localhost Gcc]# Gcc –E hello.c –o hello.i

 

在此处,选项"-o"是指目标文件,".i"文件为已经过预处理的C原始程序。以下列出了hello.i文件的部分内容:

[cpp] view plain copy
  1. typedef int (*__gconv_trans_fct) (struct __gconv_step *,  
  2.   
  3.          struct __gconv_step_data *, void *,  
  4.   
  5.          __const unsigned char *,  
  6.   
  7.          __const unsigned char **,  
  8.   
  9.          __const unsigned char *, unsigned char **,  
  10.   
  11.          size_t *);  
  12.   
  13. …  
  14.   
  15. # 2 "hello.c" 2  
  16.   
  17. int main()  
  18.   
  19. {  
  20.   
  21.  printf("Hello! This is our embedded world!\n");  
  22.   
  23.  return 0;  
  24.   
  25. }   

由此可见,Gcc确实进行了预处理,它把”stdio.h”的内容插入到hello.i文件中。

 

(2)编译阶段

接下来进行的是编译阶段,在这个阶段中,Gcc首先要检查代码的规范性、是否有语法错误等,以确定代码的实际要做的工作,在检查无误后,Gcc把代码翻译成汇编语言。用户可以使用”-S”选项来进行查看,该选项只进行编译而不进行汇编,生成汇编代码。

编译阶段是最重要的阶段,在这个阶段GCC首先检查语法然后把由上步生成的*.i编译成*.s文件。我们可以用如下命令告诉gcc进行这一步处理,gcc -S hello.i -o hello.s,-S选项告诉gcc把hello.i编译成.s文件;

上面这两步的输出文件都是文本文件,我们可以用诸如cat的文本处理等命令阅读这些输出文件。
这个阶段可以接收.c和.i类型的文件

[root@localhost Gcc]# Gcc –S hello.i –o hello.s


以下列出了hello.s的内容,可见Gcc已经将其转化为汇编了,感兴趣的读者可以分析一下这一行简单的C语言小程序是如何用汇编代码实现的。

[cpp] view plain copy
  1.  .file   "hello.c"  
  2.   
  3.      .section    .rodata  
  4.   
  5.      .align 4  
  6.   
  7. .LC0:  
  8.   
  9.      .string     "Hello! This is our embedded world!"  
  10.   
  11.      .text  
  12.   
  13. .globl main  
  14.   
  15.      .type main, @function  
  16.   
  17. main:  
  18.   
  19.      pushl %ebp  
  20.   
  21.      movl %esp, %ebp  
  22.   
  23.      subl $8, %esp  
  24.   
  25.      andl $-16, %esp  
  26.   
  27.      movl $0, %eax  
  28.   
  29.      addl $15, %eax  
  30.   
  31.      addl $15, %eax  
  32.   
  33.      shrl $4, %eax  
  34.   
  35.      sall $4, %eax  
  36.   
  37.      subl %eax, %esp  
  38.   
  39.      subl $12, %esp  
  40.   
  41.      pushl $.LC0  
  42.   
  43.      call puts  
  44.   
  45.      addl $16, %esp  
  46.   
  47.      movl $0, %eax  
  48.   
  49.      leave  
  50.   
  51.      ret  
  52.   
  53.      .size   main, .-main  
  54.   
  55.      .ident  "GCC: (GNU) 4.0.0 20050519 (Red Hat 4.0.0-8)"  
  56.   
  57.      .section    .note.GNU-stack,"",@progbits  
  58.   
  59.    


(3)汇编阶段

汇编阶段把*.s文件翻译成二进制机器指令文件*.o,如命令gcc -c hello.s -o hello.o,其中-c告诉gcc进行汇编处理。这步生成的文件是二进制文件,直接用文本工具打开看到的将是乱码,我们需要反汇编工具如GDB的帮助才能读懂它;
这个阶段接收.c, .i, .s的文件都没有问题。比如gcc -c hello.i -o hello.o等

汇编阶段是把编译阶段生成的”.s”文件转成目标文件,读者在此可使用选项”-c”就可看到汇编代码已转化为”.o”的二进制目标代码了。如下所示: 

[root@localhost Gcc]# Gcc –c hello.s –o hello.o

 

(4)链接阶段

在成功编译之后,就进入了链接阶段。在这里涉及到一个重要的概念:函数库。

读者可以重新查看这个小程序,在这个程序中并没有定义”printf”的函数实现,且在预编译中包含进的”stdio.h”中也只有该函数的声明,而没有定义函数的实现,那么,是在哪里实现”printf”函数的呢?最后的答案是:系统把这些函数实现都被做到名为libc.so.6的库文件中去了,在没有特别指定时,Gcc会到系统默认的搜索路径”/usr/lib”下进行查找,也就是链接到libc.so.6库函数中去,这样就能实现函数”printf”了,而这也就是链接的作用。


函数库一般分为静态库和动态库两种。

  • 静态库是指编译链接时,把库文件的代码全部加入到可执行文件中,因此生成的文件比较大,但在运行时也就不再需要库文件了。其后缀名一般为”.a”。
  • 动态库与之相反,在编译链接时并没有把库文件的代码加入到可执行文件中,而是在程序执行时由运行时链接文件加载库,这样可以节省系统的开销。动态库一般后缀名为”.so”,如前面所述的libc.so.6就是动态库。Gcc在编译时默认使用动态库。

[cpp] view plain copy
  1. 说下生成静态库的方法:  
  2.     ar cr libxxx.a file1.o file2.o  
  3. 就是把file1.o和file2.o打包生成libxxx.a静态库  
  4. 使用的时候  
  5.     gcc test.c -L/path -lxxx -o test  
  6.   
  7. 动态库的话:  
  8.     gcc -fPIC -shared file1.c -o libxxx.so  
  9. 也可以分成两部来写:  
  10.     gcc -fPIC file1.c -c //这一步生成file1.o  
  11.     gcc -shared file1.o -o libtest.so  


效果是一样的。
用的时候和上面的静态库的用法一样
但是到了运行程序的时候,需要指定动态库的位置,可以环境变量来指定
export LD_LIBRARY_PATH=path,否则会提示找不到动态库的位置

由于链接动态库和静态库的时候使用的方法是一样的,所以如果在库中有同名的静态库文件和动态库文件,比如libtest.a和libtest.so,根据gcc链接时默认优先选择动态库,会链接libtest.so,如果想要让gcc选择链接libtest.a那么需要指定一个选项,就是-static,这样就会强制gcc找静态库文件了。


静态库链接时搜索路径顺序:

  • 1. ld会去找GCC命令中的参数-L
  • 2. 再找gcc的环境变量LIBRARY_PATH
  • 3. 再找内定目录 /lib /usr/lib /usr/local/lib 这是当初compile gcc时写在程序内的

动态链接时、执行时搜索路径顺序:

  • 1. 编译目标代码时指定的动态库搜索路径
  • 2. 环境变量LD_LIBRARY_PATH指定的动态库搜索路径
  • 3. 配置文件/etc/ld.so.conf中指定的动态库搜索路径
  • 4. 默认的动态库搜索路径/lib
  • 5. 默认的动态库搜索路径/usr/lib


有关环境变量:

  • LIBRARY_PATH环境变量:指定程序静态链接库文件搜索路径
  • LD_LIBRARY_PATH环境变量:指定程序动态链接库文件搜索路径


完成了链接之后,Gcc就可以生成可执行文件,如下所示。

[root@localhost Gcc]# Gcc hello.o –o hello

 

运行该可执行文件,出现正确的结果如下。 

[root@localhost Gcc]# ./hello

Hello! This is our embedded world!


本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/243537.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

低级键盘钩子 DLL

C语言封装的低级键盘钩子(HOOK)的DLL程序, 源码, 并有测试程序...下载地址 : http://download.csdn.net/detail/hemmingway/4570548

并行信号赋值语句

并行信号赋值语句 并行信号赋值语句有3中形式,即简单信号赋值语句、条件信号赋值语句、选择信号赋值语句。 这3信号赋值语句的共同点是赋值目标必须都是信号,所有赋值语句与其他并行语句一样,在结构体内的执行是同时发生 简单信号赋值语句 语句格式赋值目标 <= 表达式…

让我们共同怀揣文学与艺术的梦想

勿声勿视系列之二 青铜 蔡劲松是我多年的朋友。他是个作家、诗人、大学时期还举办过个人的摄影展&#xff0c;近年开始绘画、雕塑以及装置的艺术创作&#xff0c;而且作品的数量和质量都令人刮目。 我们知道诗人与绘画的关系的紧密性&#xff0c;在中国古代的文人中是诗和画是…

中国文人这么多事儿

司马迁 看《文人那点子事儿》也许你会联想到《明朝那些事儿》&#xff0c;但书名的近似不过是一种策略。《明朝那些事儿》写的是一个朝代的历史&#xff0c;&#xff0c;而且加入了小说的笔法&#xff0c;既然有小说笔法&#xff0c;那肯定会有虚构、演义&#xff0c;甚至戏说的…

易错知识点

题目来源&#xff1a; 1、中兴、华为、慧通、英华达、微软亚洲技术中心等中外企业面试题目&#xff1b; 2、C 语言面试宝典(林锐《高质量编程第三版》)。 说明&#xff1a; 1、部分C 语言面试题中可能会参杂部分和C 相关的知识&#xff0c;为了保持题目的灵活性故保留&#xff…

随便写写....

最近有些恍恍惚惚的, 昨天晚上睡觉还做一个噩梦, 这好像是我第一次这样, 梦到自己裹在被子睡觉, 裹得紧紧的, 担心被外面的狼给发现了(为什么是狼我也百思不得其解), 但还是有一头狼咬了我的脚, 晚上就这样被自己的噩梦惊醒了, 不知道这几天是为什么, 感觉做什么都没有安全感…

数据类型定义语句

数据类型定义语句 用户自定义数据类型是用类型定义语句TYPE和子类型定义语句SUBTYPE实现的。TYPE语句最常用的用法有如下两种 第一种属于数组型数据类型定义语句; 数组类型又分为限定性数组和非限定性数组类型。 区别是:限定性数组下标的取值范围在数组定义时就被确定了,而…

甩开镣铐的精神舞蹈:推荐长篇小说《炼狱之花》

这是一部现实的复杂的小说&#xff0c;众多的声色男女&#xff0c;熟悉且陌生的领域&#xff0c;陆地和海底&#xff0c;天堂与地狱&#xff0c;让你拼命地应对、想象、思考、绞尽脑汁&#xff0c;心力焦瘁&#xff0c;绝望地想放弃和逃离。这也是一部天真的充满幻想的小说&…

雪洗北京

北京东便门。老城墙。一棵不成材的年轻小树&#xff0c;扭动身姿&#xff0c;成了一道风景。如果没有这漫天的白雪&#xff0c;我还会注意它么&#xff1f; 挂满银色雪粒的树丛&#xff0c;有一种冷色的脆弱的美。让人着迷。 从楼下看到的三环路。雪确实是好东西&#xff0c;它…

64ubuntu编译32位程序

今天做实验&#xff0c;64位ubuntu&#xff0c;sizeof指针得到8 想编译成32位程序 百度 需要安装32位库&#xff0c;已经安装了 libc6 libc6-dev 报错fatal error: sys/cdefs.h: No such file or directory 需要 sudo apt-get install libc6-dev-i386 然后再编译 ningu…

研究生念了些什么东西?

在这里不知道是不是自己走错了路&#xff0c;或者是没有认识到这种未知的价值&#xff0c;两年时间过去了&#xff0c;付出了什么&#xff0c; 得到了什么&#xff1f;自己在问自己念研究生能学到什么&#xff0c; 短短的两年时间&#xff0c;上课学不到多少有用的&#xff0c;…

信号属性及属性函数

信号属性及属性函数 综合器支持的属性有:LEFT(左)、RIGHT(正确的)、HIGH(高)、LOW(低)、RANGE(范围)、REVERS RANGE()、 LENGTH(长度)、EVENT(事件)及STABLE(稳定的)。 预定义属性描述语句实际上是一个内部预定义函数&#xff0c;其语句格式如下&#xff1a; 属性测试项目名’…

《中国当代乡土小说大系》明年出版

《中国当代乡土小说大系》编审会第一次会议在永安宾馆召开。在京的顾问和编委雷达、白烨、胡平、贺绍竣、阎晶明、白描、施战军、兴安、舒楠&#xff0c;以及著名作家周大新等出席。河北省作家协会主席、著名作家关仁山专程从河北赶来参加会议。该书将由农村读物出版社2010年4月…

《2012》:让灾难成为一场洗礼

■片名&#xff1a;《2012》 ■导演&#xff1a;罗兰艾默里奇 ■主演&#xff1a;约翰库萨克、阿曼达皮特、切瓦特埃加福特 ■发行: 哥伦比亚影片公司 ■上映时间&#xff1a;2009年11月 ■读家&#xff1a;兴安 ■推荐指数★★★★★☆ ■一句话点评&#xff1a;电影的神奇之…

C++ 输出调试信息 类似MFC的TRACE等宏

在MFC程序中有TRACE等一系列的宏可以输出调试信息, 但是其他的地方不能用了, 下面这个小程序测试了怎么输出调试信息,// Test_ErrorCode.cpp : 定义控制台应用程序的入口点。 //#include "stdafx.h" #include <Windows.h> #include <stdio.h> #include &…

QT打开二进制文件(.bin),串口定时发送

本例由《qt开发环境 - 简易二进制文件打开&#xff0c;串口自发自收》更改来。&#xff08;由qt官方terminal demo 修改&#xff09; 实现功能&#xff1a;打开.bin文件&#xff0c;显示文件内容 通过串口按固定字节大小发送文件 显示串口收到的内容 下面是源代码&#xff1a…

VHDL操作符

VHDL操作符 省略操作符 一般的&#xff0c;为了简化表达和位数不定情况下的赋值&#xff0c;可使用短语&#xff08;OTHERS > X&#xff09;, 这是一个省略赋值操作符&#xff0c;它可以在较多位的位矢量赋值中做省略化的赋值&#xff0c;如有&#xff1a;SIGNAL d1 :STD_…

深圳当代艺术家的一次聚会

在深圳创意园的雅库酒吧参加了一次当代艺术家酒会。注意看两个舞者的鞋子。女的高跟鞋的粉红很别致好看&#xff0c;而那位仁兄的红色拖鞋&#xff0c;还有两截的裤子以及腰间的包包——哈。 现场。背景映出的交织纠葛的锁链&#xff0c;很有意味。 “革命女性的幸福高于一切”…

关于STM32的IAP与APP互相跳转

关于STM32的IAP与APP互相跳转 之前做了一个不带系统的IAP与APP互相跳转&#xff0c;在网上找了资料后&#xff0c;很顺畅就完成了&#xff0c;后来在IAR集成开发环境下&#xff0c;IAP无系统&#xff0c;APP用UCOS系统做互相跳转出现了很多问题。现将IAP学习过程和实际遇到问题…

进程中的信号赋值与变量赋值

进程中的信号赋值与变量赋值 比较对象信号SIGNAL变量VARIABLE基本用法用于作为电路的信号连线用于作为进程中局部数据存储单元适用范围在整个结构体内的任何地方都能适用只能在所定义的进程中使用行为特性在进程的最后才对信号赋值,有延时立即赋值,无延时与Verilog对比信号赋…