在嵌入式开发和底层系统编程领域,裸机开发是一项极具挑战性但又至关重要的任务。想象一下,在没有操作系统支持的情况下,让 C 语言的标准库函数,如printf
正常工作,这听起来是不是很有趣又充满挑战?今天,我们就来深入探索如何利用 Newlib 在裸机系统上实现这一目标,以 RISC-V 平台为例,揭开裸机编程的神秘面纱。
软件抽象与 C 标准库:从常规系统到裸机的转变
在日常使用的电脑系统,比如 Mac 或 Linux 笔记本上运行printf
函数,背后有着一套复杂的机制。应用程序调用printf
,这个函数通常是动态链接的,经过多层 C 函数调用后,最终会触发操作系统内核的系统调用。内核会通过不同的子系统来处理输出,涉及终端和伪终端的相关操作,最后将printf
的输出呈现在屏幕上。而且,printf
还要依据提供的模板对输出字符串进行格式化处理,这一整套流程涉及众多软件抽象层。
然而,裸机系统与常规系统大不相同。在裸机环境下,大多数这样的抽象层并不存在,软件栈要简单得多。在裸机上进行 C 编程时,C 函数下方没有任何支持。在常规系统中,进程可以通过系统调用(由软件中断实现)将输出交给内核处理,但在裸机上没有内核可交付,可我们仍希望printf
之类的函数能够工作,最好是能输出到像通用异步收发传输器(UART)这样的简单 I/O 设备上。这时候,Newlib 就发挥作用了。
Newlib:裸机 C 标准库的构建利器
你或许熟悉 GNU 的glibc
、musl
等 C 标准库,但如果想在裸机上启用 C 标准库,Newlib 绝对值得关注。从本质上讲,Newlib 并不是一个完整的 C 标准库,而是一个构建定制、精简 C 标准库的工具包。
Newlib 将 C 标准库的实现简化为几个具有清晰接口的基本原语,这些原语可以作为独立函数来实现。像printf
和malloc
这样更复杂的函数会调用这些原语。例如,我们需要实现_write
原语,它的作用是向输出流写入单个字符,Newlib 会在这个基础上构建printf
函数,从而实现更复杂的输出功能。
此外,Newlib 还提供了一些预制的实现。在某些配置下,你甚至可以将底层平台指定为 Linux,这时 Newlib 提供的实现会像glibc
一样进行系统调用。而在极简配置中,Newlib 会以最小化的形式提供所有原语,这些原语要么返回零,要么抛出错误。开发者可以根据应用程序的实际需求,选择实现自己关心的构建模块,其余部分则依赖默认实现。
交叉编译工具链:连接不同平台的桥梁
在深入了解如何使用 Newlib 之前,我们需要先掌握交叉编译工具链的概念。交叉编译是指在一个平台上编译代码,生成另一个平台可执行的指令。例如,从 x86_64/Linux 平台编译代码,使其能在 ARM64/Mac 上运行。
在 Linux 平台下,情况更为复杂,因为不同的 Linux 发行版可能使用不同的 C 标准库。从使用一种标准库的平台编译到使用另一种标准库的同一架构平台,也属于交叉编译。比如,从 x86_64/Linux/glibc 平台编译到 x86_64/Linux/musl 平台。甚至从一个版本的glibc
编译到另一个版本,同样属于交叉编译,像从 x86_64/Linux/glibc_v1.0 编译到 x86_64/Linux/glibc_v1.1。
传统的构建和使用编译器的方式,比如使用 GCC,在处理交叉编译时可能会变得很复杂。不过,我们可以采用一种更便捷的方法来满足需求。我们需要一个满足特定要求的工具链:能从主机平台生成 RISC-V 指令,并且在调用 C 标准库功能时使用 Newlib 库。
在典型的 Linux 发行版中,安装的 GCC 或 clang 默认会为运行它的同一平台进行编译,即宿主平台和目标平台相同,这被称为本地编译。当包含<stdio.h>
头文件并调用printf
函数时,编译器会从标准位置查找相关文件和实现。例如,在 Debian 系统中,stdio.h
位于/usr/include
目录,标准 C 库glibc
的动态链接版本位于/lib/x86_64-linux-gnu/libc.so
(实际指向/lib/x86_64-linux-gnu/libc.so.6
)。
为了进行交叉编译,我们需要获取能为目标平台生成指令的编译器,为目标平台设置 C 标准库的路径,并确保目标平台的编译器知道如何使用该库。这一系列操作通常较为繁琐,不过我们可以借助一些自动化工具来简化流程。
自动化 RISC-V 工具链构建
为了简化在 RISC-V 平台上使用 Newlib 进行开发的过程,我们可以使用 RISC-V 工具链项目。该项目虽然仍需在主机上从源代码构建所有内容,但会通过脚本自动化处理繁琐的编排工作,包括编译器的搭建。
首先,从 GitHub 克隆相关仓库。需要注意的是,克隆时最好使用--recursive
标志,以避免后续问题,尽管官方说明该标志不是必需的,但在某些系统上不使用可能会出现问题。克隆过程可能会花费较长时间,因为要下载大量源代码。
克隆完成后,进行配置。例如:./configure --prefix=/opt/riscv-newlib --enable-multilib --disable-gdb --with-cmodel=medany
。这里的prefix
指定了新构建的工具链、C 标准库(这里是 Newlib)等的安装路径;enable-multilib
用于启用针对不同 RISC-V 配置的构建,但会使构建过程变慢;disable-gdb
是因为构建 GDB 时可能会出现问题,所以将其排除在工具链之外;with-cmodel=medany
这个参数稍后会详细解释,它对 64 位 RISC-V 构建的正常运行很关键。
配置完成后,通过make
命令启动构建过程。这里有个小提示,不要尝试使用-j16
等参数进行并行构建,可能会导致构建失败。构建过程会持续较长时间,期间可以做些其他事情。构建完成后,会在指定的prefix
路径下生成可执行文件、库文件等。
实现内存和 UART 构建模块
在拥有了可用的 RISC-V + Newlib 交叉工具链后,就可以开始构建 Newlib 的基础模块了。先从 UART 相关的代码入手,创建uart.h
文件:
#ifndef UART_H
#define UART_Hvoid uart_putc(char c);
char uart_getc(void);#endif
接着实现这两个函数,在这个示例中,针对 QEMU 的 16550A UART 进行操作:
#include "uart.h"
// QEMU UART寄存器地址
#define UART_BASE 0x10000000
#define UART_THR (*(volatile char *)(UART_BASE + 0x00))
#define UART_RBR (*(volatile char *)(UART_BASE + 0x00))
#define UART_LSR (*(volatile char *)(UART_BASE + 0x05))
#define UART_LSR_TX_IDLE (1 << 5)
#define UART_LSR_RX_READY (1 << 0)void uart_putc(char c) {// 等待发送器空闲while ((UART_LSR & UART_LSR_TX_IDLE) == 0);UART_THR = c;// 特殊处理换行符,发送CR+LFif (c == '\n') {while ((UART_LSR & UART_LSR_TX_IDLE) == 0);UART_THR = '\r';}
}char uart_getc(void) {// 等待数据while ((UART_LSR & UART_LSR_RX_READY) == 0);return UART_RBR;
}
接下来是syscalls.c
文件,实现printf
等函数依赖的原语,同时处理输入操作:
// 省略部分代码...void* _sbrk(int incr) {extern char _end; // 由链接器定义,静态段结束标志extern char _stack_bottom; // 链接器脚本中定义,栈底地址static char *heap_end = &_end;char *prev_heap_end = heap_end;// 计算安全的栈限制,栈从_stack_top向下增长到_stack_bottomchar *stack_limit = &_stack_bottom;// 检查堆是否会增长到太靠近栈的位置if (heap_end + incr > stack_limit) {errno = ENOMEM;return (void*) -1; // 返回错误}heap_end += incr;return (void*) prev_heap_end;
}
应用示例:输入与输出
现在来构建一个裸机应用示例。编写main.c
文件:
#include <stdio.h>int main(void) {printf("Hello from RISC-V UART!\n");char buffer[100];printf("Type something: ");scanf("%s", buffer);printf("You typed: %s\n", buffer);while (1) {}return 0;
}
这个应用会通过 UART 输出问候语,提示用户输入内容,读取用户输入并再次输出。由于没有运行在常规的 Shell 环境中,输入时不会回显按键内容。
还需要一个简单的 C 运行时文件startup.S
:
.section .text.init
.global _start
_start:la sp, _stack_top# 清空BSS段,使用链接器脚本中定义的符号la t0, _bss_startla t1, _bss_end
clear_bss:bgeu t0, t1, bss_donesb zero, 0(t0)addi t0, t0, 1j clear_bss
bss_done:# 跳转到C代码call main# 如果main函数返回,进入无限循环j .
最后是链接器脚本link.ld
:
OUTPUT_FORMAT("elf64-littleriscv")
OUTPUT_ARCH("riscv")
ENTRY(_start)MEMORY {RAM (rwx) : ORIGIN = 0x80000000, LENGTH = 64M
}SECTIONS {/* 代码段 */.text : {*(.text.init)*(.text)} > RAM/* 只读数据段 */.rodata : {*(.rodata)} > RAM/* 已初始化数据段 */.data : {*(.data)} > RAM/* 小的已初始化数据段 */.sdata : {*(.sdata)} > RAM/* BSS段,有明确符号 */.bss : {_bss_start =.; /* 定义BSS段开始符号 */*(.bss)*(COMMON).= ALIGN(8);_bss_end =.; /* 定义BSS段结束符号 */} > RAM/* 小BSS段 */.sbss : {_sbss_start =.;*(.sbss)*(.sbss.*).= ALIGN(8);_sbss_end =.;} > RAM/* 堆起始标记 */.= ALIGN(8);_end =.; /* 堆从这里开始向上增长 *//* 栈从RAM末尾向下增长 */_stack_size = 64K;_stack_top = ORIGIN(RAM) + LENGTH(RAM);_stack_bottom = _stack_top - _stack_size;/* 确保堆和栈不重叠 */ASSERT(_end <= _stack_bottom, "Error: Heap collides with stack")
}
链接器脚本负责安排代码和数据在内存中的位置,确保各个段正确放置,并且堆和栈不会冲突。
关键要点与应用运行
在构建工具链时,--with-cmodel=medany
这个参数至关重要。由于我们构建的是 64 位 RISC-V 机器代码,应用程序代码需要使用能够处理高地址的内存地址模型。如果没有这个参数,Newlib 库可能会使用无法有效处理高地址的 RISC-V 指令,导致链接错误。
在 GitHub 仓库中提供了Makefile
来简化构建和运行过程。运行make debug
命令,它会调用交叉编译器编译代码,并使用 QEMU 进行仿真。Makefile
中的CFLAGS
包含-specs=nosys.specs
,这会让工具链使用 Newlib 的nosys
版本,该版本所有构建模块默认是存根,返回零或错误。链接器标志-nostartfiles
表示我们将提供自己的最小 C 运行时。
运行make debug
后,QEMU 启动,输入内容并回车,就能看到应用的输出。同时,debug
目标会生成一个qemu_debug.log
文件,它记录了 VM 的完整运行轨迹,有助于深入了解printf
等函数的工作原理以及 RISC-V 核心的执行过程。
总结
通过这个示例,我们成功地在裸机平台上实现了printf
等 C 标准库函数的功能,让裸机编程有了更接近在完整内核上编程的体验。利用 Newlib 定义的构建模块,我们可以进一步扩展功能,实现文件访问、更完善的内存管理等。而且,这为在裸机代码中使用强大的库提供了可能。尽管在极简环境下,最终软件镜像的大小和指令数量需要考虑,但我们构建的ELF
文件大小为220K
,还算比较合理。希望这篇文章能为你的开发工作提供新的思路和方法,祝大家在裸机编程的世界中探索愉快!
科技脉搏,每日跳动。
与敖行客 Allthinker一起,创造属于开发者的多彩世界。
- 智慧链接 思想协作 -