裸机上的 printf：在无操作系统环境下构建 C 标准库

在嵌入式开发和底层系统编程领域，裸机开发是一项极具挑战性但又至关重要的任务。想象一下，在没有操作系统支持的情况下，让 C 语言的标准库函数，如printf正常工作，这听起来是不是很有趣又充满挑战？今天，我们就来深入探索如何利用 Newlib 在裸机系统上实现这一目标，以 RISC-V 平台为例，揭开裸机编程的神秘面纱。

软件抽象与 C 标准库：从常规系统到裸机的转变

在日常使用的电脑系统，比如 Mac 或 Linux 笔记本上运行printf函数，背后有着一套复杂的机制。应用程序调用printf，这个函数通常是动态链接的，经过多层 C 函数调用后，最终会触发操作系统内核的系统调用。内核会通过不同的子系统来处理输出，涉及终端和伪终端的相关操作，最后将printf的输出呈现在屏幕上。而且，printf还要依据提供的模板对输出字符串进行格式化处理，这一整套流程涉及众多软件抽象层。

然而，裸机系统与常规系统大不相同。在裸机环境下，大多数这样的抽象层并不存在，软件栈要简单得多。在裸机上进行 C 编程时，C 函数下方没有任何支持。在常规系统中，进程可以通过系统调用（由软件中断实现）将输出交给内核处理，但在裸机上没有内核可交付，可我们仍希望printf之类的函数能够工作，最好是能输出到像通用异步收发传输器（UART）这样的简单 I/O 设备上。这时候，Newlib 就发挥作用了。

Newlib：裸机 C 标准库的构建利器

你或许熟悉 GNU 的glibc、musl等 C 标准库，但如果想在裸机上启用 C 标准库，Newlib 绝对值得关注。从本质上讲，Newlib 并不是一个完整的 C 标准库，而是一个构建定制、精简 C 标准库的工具包。

Newlib 将 C 标准库的实现简化为几个具有清晰接口的基本原语，这些原语可以作为独立函数来实现。像printf和malloc这样更复杂的函数会调用这些原语。例如，我们需要实现_write原语，它的作用是向输出流写入单个字符，Newlib 会在这个基础上构建printf函数，从而实现更复杂的输出功能。

此外，Newlib 还提供了一些预制的实现。在某些配置下，你甚至可以将底层平台指定为 Linux，这时 Newlib 提供的实现会像glibc一样进行系统调用。而在极简配置中，Newlib 会以最小化的形式提供所有原语，这些原语要么返回零，要么抛出错误。开发者可以根据应用程序的实际需求，选择实现自己关心的构建模块，其余部分则依赖默认实现。

交叉编译工具链：连接不同平台的桥梁

在深入了解如何使用 Newlib 之前，我们需要先掌握交叉编译工具链的概念。交叉编译是指在一个平台上编译代码，生成另一个平台可执行的指令。例如，从 x86_64/Linux 平台编译代码，使其能在 ARM64/Mac 上运行。

在 Linux 平台下，情况更为复杂，因为不同的 Linux 发行版可能使用不同的 C 标准库。从使用一种标准库的平台编译到使用另一种标准库的同一架构平台，也属于交叉编译。比如，从 x86_64/Linux/glibc 平台编译到 x86_64/Linux/musl 平台。甚至从一个版本的glibc编译到另一个版本，同样属于交叉编译，像从 x86_64/Linux/glibc_v1.0 编译到 x86_64/Linux/glibc_v1.1。

传统的构建和使用编译器的方式，比如使用 GCC，在处理交叉编译时可能会变得很复杂。不过，我们可以采用一种更便捷的方法来满足需求。我们需要一个满足特定要求的工具链：能从主机平台生成 RISC-V 指令，并且在调用 C 标准库功能时使用 Newlib 库。

在典型的 Linux 发行版中，安装的 GCC 或 clang 默认会为运行它的同一平台进行编译，即宿主平台和目标平台相同，这被称为本地编译。当包含<stdio.h>头文件并调用printf函数时，编译器会从标准位置查找相关文件和实现。例如，在 Debian 系统中，stdio.h位于/usr/include目录，标准 C 库glibc的动态链接版本位于/lib/x86_64-linux-gnu/libc.so（实际指向/lib/x86_64-linux-gnu/libc.so.6 ）。

为了进行交叉编译，我们需要获取能为目标平台生成指令的编译器，为目标平台设置 C 标准库的路径，并确保目标平台的编译器知道如何使用该库。这一系列操作通常较为繁琐，不过我们可以借助一些自动化工具来简化流程。

自动化 RISC-V 工具链构建

为了简化在 RISC-V 平台上使用 Newlib 进行开发的过程，我们可以使用 RISC-V 工具链项目。该项目虽然仍需在主机上从源代码构建所有内容，但会通过脚本自动化处理繁琐的编排工作，包括编译器的搭建。

首先，从 GitHub 克隆相关仓库。需要注意的是，克隆时最好使用--recursive标志，以避免后续问题，尽管官方说明该标志不是必需的，但在某些系统上不使用可能会出现问题。克隆过程可能会花费较长时间，因为要下载大量源代码。

克隆完成后，进行配置。例如：./configure --prefix=/opt/riscv-newlib --enable-multilib --disable-gdb --with-cmodel=medany。这里的prefix指定了新构建的工具链、C 标准库（这里是 Newlib）等的安装路径；enable-multilib用于启用针对不同 RISC-V 配置的构建，但会使构建过程变慢；disable-gdb是因为构建 GDB 时可能会出现问题，所以将其排除在工具链之外；with-cmodel=medany这个参数稍后会详细解释，它对 64 位 RISC-V 构建的正常运行很关键。

配置完成后，通过make命令启动构建过程。这里有个小提示，不要尝试使用-j16等参数进行并行构建，可能会导致构建失败。构建过程会持续较长时间，期间可以做些其他事情。构建完成后，会在指定的prefix路径下生成可执行文件、库文件等。

实现内存和 UART 构建模块

在拥有了可用的 RISC-V + Newlib 交叉工具链后，就可以开始构建 Newlib 的基础模块了。先从 UART 相关的代码入手，创建uart.h文件：

#ifndef UART_H
#define UART_Hvoid uart_putc(char c);
char uart_getc(void);#endif

接着实现这两个函数，在这个示例中，针对 QEMU 的 16550A UART 进行操作：

#include "uart.h"
// QEMU UART寄存器地址
#define UART_BASE 0x10000000
#define UART_THR  (*(volatile char *)(UART_BASE + 0x00))
#define UART_RBR  (*(volatile char *)(UART_BASE + 0x00))
#define UART_LSR  (*(volatile char *)(UART_BASE + 0x05))
#define UART_LSR_TX_IDLE  (1 << 5)
#define UART_LSR_RX_READY (1 << 0)void uart_putc(char c) {// 等待发送器空闲while ((UART_LSR & UART_LSR_TX_IDLE) == 0);UART_THR = c;// 特殊处理换行符，发送CR+LFif (c == '\n') {while ((UART_LSR & UART_LSR_TX_IDLE) == 0);UART_THR = '\r';}
}char uart_getc(void) {// 等待数据while ((UART_LSR & UART_LSR_RX_READY) == 0);return UART_RBR;
}

接下来是syscalls.c文件，实现printf等函数依赖的原语，同时处理输入操作：

// 省略部分代码...void* _sbrk(int incr) {extern char _end;         // 由链接器定义，静态段结束标志extern char _stack_bottom; // 链接器脚本中定义，栈底地址static char *heap_end = &_end;char *prev_heap_end = heap_end;// 计算安全的栈限制，栈从_stack_top向下增长到_stack_bottomchar *stack_limit = &_stack_bottom;// 检查堆是否会增长到太靠近栈的位置if (heap_end + incr > stack_limit) {errno = ENOMEM;return (void*) -1; // 返回错误}heap_end += incr;return (void*) prev_heap_end;
}

应用示例：输入与输出

现在来构建一个裸机应用示例。编写main.c文件：

#include <stdio.h>int main(void) {printf("Hello from RISC-V UART!\n");char buffer[100];printf("Type something: ");scanf("%s", buffer);printf("You typed: %s\n", buffer);while (1) {}return 0;
}

这个应用会通过 UART 输出问候语，提示用户输入内容，读取用户输入并再次输出。由于没有运行在常规的 Shell 环境中，输入时不会回显按键内容。

还需要一个简单的 C 运行时文件startup.S：

.section .text.init
.global _start
_start:la sp, _stack_top# 清空BSS段，使用链接器脚本中定义的符号la t0, _bss_startla t1, _bss_end
clear_bss:bgeu t0, t1, bss_donesb zero, 0(t0)addi t0, t0, 1j clear_bss
bss_done:# 跳转到C代码call main# 如果main函数返回，进入无限循环j .

最后是链接器脚本link.ld：

OUTPUT_FORMAT("elf64-littleriscv")
OUTPUT_ARCH("riscv")
ENTRY(_start)MEMORY {RAM (rwx) : ORIGIN = 0x80000000, LENGTH = 64M
}SECTIONS {/* 代码段 */.text : {*(.text.init)*(.text)} > RAM/* 只读数据段 */.rodata : {*(.rodata)} > RAM/* 已初始化数据段 */.data : {*(.data)} > RAM/* 小的已初始化数据段 */.sdata : {*(.sdata)} > RAM/* BSS段，有明确符号 */.bss : {_bss_start =.;  /* 定义BSS段开始符号 */*(.bss)*(COMMON).= ALIGN(8);_bss_end =.;    /* 定义BSS段结束符号 */} > RAM/* 小BSS段 */.sbss : {_sbss_start =.;*(.sbss)*(.sbss.*).= ALIGN(8);_sbss_end =.;} > RAM/* 堆起始标记 */.= ALIGN(8);_end =.; /* 堆从这里开始向上增长 *//* 栈从RAM末尾向下增长 */_stack_size = 64K;_stack_top = ORIGIN(RAM) + LENGTH(RAM);_stack_bottom = _stack_top - _stack_size;/* 确保堆和栈不重叠 */ASSERT(_end <= _stack_bottom, "Error: Heap collides with stack")
}

链接器脚本负责安排代码和数据在内存中的位置，确保各个段正确放置，并且堆和栈不会冲突。

关键要点与应用运行

在构建工具链时，--with-cmodel=medany这个参数至关重要。由于我们构建的是 64 位 RISC-V 机器代码，应用程序代码需要使用能够处理高地址的内存地址模型。如果没有这个参数，Newlib 库可能会使用无法有效处理高地址的 RISC-V 指令，导致链接错误。

在 GitHub 仓库中提供了Makefile来简化构建和运行过程。运行make debug命令，它会调用交叉编译器编译代码，并使用 QEMU 进行仿真。Makefile中的CFLAGS包含-specs=nosys.specs，这会让工具链使用 Newlib 的nosys版本，该版本所有构建模块默认是存根，返回零或错误。链接器标志-nostartfiles表示我们将提供自己的最小 C 运行时。

运行make debug后，QEMU 启动，输入内容并回车，就能看到应用的输出。同时，debug目标会生成一个qemu_debug.log文件，它记录了 VM 的完整运行轨迹，有助于深入了解printf等函数的工作原理以及 RISC-V 核心的执行过程。

总结

通过这个示例，我们成功地在裸机平台上实现了printf等 C 标准库函数的功能，让裸机编程有了更接近在完整内核上编程的体验。利用 Newlib 定义的构建模块，我们可以进一步扩展功能，实现文件访问、更完善的内存管理等。而且，这为在裸机代码中使用强大的库提供了可能。尽管在极简环境下，最终软件镜像的大小和指令数量需要考虑，但我们构建的ELF文件大小为220K，还算比较合理。希望这篇文章能为你的开发工作提供新的思路和方法，祝大家在裸机编程的世界中探索愉快！

科技脉搏，每日跳动。

与敖行客 Allthinker一起，创造属于开发者的多彩世界。