以前刚刚接触计算机的时候,对于很多计算机的问题很感兴趣,譬如为什么有一个硬件叫“内存”,而且还那么贵;为什么会有一个叫硬盘的设备,和内存又什么区别等等。后来看了很多科普的文章和书籍,得到的大多数是一些“比喻”的说明,虽然有一点概念,但总觉得不是非常彻底。后来也看了网上的公开课,譬如哈弗的《计算机导论》,发现讲的非常有趣,但还是不够“直白”,我希望能可以直接用某些方法,去“搞”一下计算机,而 C 语言,就是这种工具。当你用过 C 语言之后,对于计算机上因为各种 bug 不经意露出来的某些“信息”,你就能大概了解是什么意思。虽然知道这个也不代表能怎么样,但能满足自己的好奇心也是很不错的。
现在很多手机、电脑用户,会发表对于“系统”的看法:譬如 Mac 系统比 Windows 高级;IOS 用起来比安卓舒服……而作为程序员,我对于“操作系统”的看法,往往和使用界面完全无关,那个只是一个叫资源管理器的程序。我真正在意的是——我写的程序,能如何“使用”这个操作系统。
大家多多少少都可能见过的 Hello, World! 程序:
#include <stdio.h>
int main() {
printf("Hello, World!");
}
一般的教程,到这里要么长篇累牍的要求你安装一套 C 语言的开发工具,要么直接不管你死活,直接开始用一个不知道哪里来的程序开始编译了。其实,开发工具这个环节,是一个很有价值的知识点。不过我也不打算说的太详细,因为后面会一点点了解。
因为我用的是 Windows 的笔记本,所以我会安装一套能编译 C 语言的开发工具,我选择的是现在最时髦的编译器是 LLVM;以及我被迫选择,不安装就没法编译的 MicroSoft Visual Studio 2022 社区版(免费):
LLVM 的安装方法:请搜索“llvm windows 安装”,如果装好了,在 cmd 或者 powershell 里面就可以用到命令:clang
一旦装好了上面的东西,就可以把上面的代码保存为 hello.c,然后用命令行(譬如 cmd 或者 powershell)属于这个“神奇”的命令:
clang hello.c
然后你就得到了一个叫 a.exe 的可执行程序。运行这个程序 .\hello.exe ,就能看到打印了那行字 Hello, World!。
如果你很顺利的走到这一步,就会觉得 C 语言也没啥特别嘛,但其实上面那行 clang hello.c,其实包含了非常复杂的步骤。一个文本文件,变成一个可以在 windows 运行的 exe 文件,需要经过四大步骤,而这四个步骤,我们都可以通过编译器 clang 一步步的呈现出来。
如果你仔细看 hello.c 的源码,你会发现这一行代码:
#include <stdio.h>
这里的文字,其实不算 C 语言的内容。这是编译器提供的一个“预处理”功能:把“系统库”的 stdio.h 这个文件,复制到此处。我们可以通过下面这个命令,来得到第一步“预处理”之后的文件。
clang -E hello.c -o hello.i
这个命令的参数 -E 表示的就是只做预处理的意思,-o 参数表示结果文件名为后面的 hello.i,当你运行完这个命令,你就会得到一个 hello.i 文件,打开这个文件,你会发现有大量的文字,而在文件最后,才是你写的 hello world 源码:
这个文件前面 4000 多行,都是 stdio.h 的内容,只有最后三行是你写的源代码。这就是预处理的工作,这个时候你可能会问,为啥需要预处理呢?这个问题很好,我们后面可以慢慢说,特别是 #include 这个预处理功能。当然预处理功能除了包含文件,还有其他很多,但最常见的是这个。
第二步是把预处理之后的文本文件 hello.i,变成机器能理解代码。cmd 窗口输入以下:
clang -S hello.i -o hello.s
这里的 -S 表示进行编译,生成“汇编文件”,同样,-o 命令指定结果文件保存在 hello.s 里。如果我们打开 hello.s,你会看到还是一对文本,但是这些文本都是“汇编语言”的。
“汇编语言”是一种方便人类阅读机器码的格式,这里面每一行文字,都代表了一条真正的机器码指令。由于机器码指令是完全以数字表达的,人很难分辨,所以设计了一些类似英语单词的文本指令来对应。总而言之,这一步的 hello.s 文件,里面已经包含了每个机器代码的信息。这些机器代码将可以输入给计算机的 CPU 来做一些事情。
接下来我们可以把 hello.s 的汇编内容,转换成真正的机器码,也叫二进制格式(实际上我不喜欢“二进制”这个说法,因为计算机里所有文件都是二进制的)。命令如下,-c 表示编译出二进制“目标文件”:
clang -c hello.s -o hello.o
这一步的产物 hello.o 里面,真正的就是全部“二进制”的内容了,一般的文本编辑器是无法打开和显示里面的内容的。
但是如果你锲而不舍的看,还是能看到你要打印的字符的:
但是到了这一步,还没有生成 exe 文件。你可能会怀疑,不是已经生成机器码了吗?为啥还不是可执行的文件呢?这也是之前我的疑问。
我们看看生成的文件大小:4,413 字节,而之前编译的 a.exe 文件大小是:142,848 字节。也就是说还有很多内容没有包含进来,而这些没有包含进来的内容,就是你写的 main() 这个函数之所以可以在 windows 上启动的程序,以及 printf() 这个函数真正的功能所在的程序。
hello.o 实际是 hello.c 所编写的程序,但启动这个程序,并且在屏幕上显示字符这些功能,都是 windows 操作系统提供的功能。只有把你的写的程序和 windows 提供的程序连接起来,这个程序才能真正的被执行。所以我们需要下面这个步骤——链接
clang hello.o -o hello.exe
这里的不再需要什么别的参数,只用 -o 参数指定生成的 exe 文件名就好了。
刚刚我们说了,我们自己写的程序,需要和操作系统 windows 的功能连接起来,那么到底是“链接”了哪一部分呢?我们可以用下面的代码来查看(powershell):
&"C:\Program Files\Microsoft Visual Studio\2022\Community\VC\Tools\MSVC\14.38.33130\bin\Hostx64\x64\dumpbin.exe" /dependents .\hello.exe
这里使用了 Microsoft Visual Studio 2022 社区版所附带的一个工具 dumpbin.exe,它可以告诉我们一个 exe 文件链接了一些什么“库”文件。而这些“库”文件,就有 windows 所提供的。下面是命令执行的结果:
这里的这个 KERNEL32.dll,就是 windows 提供的一个库文件。提供了程序启动、打印文字到屏幕等等很多功能。我们写的 hello.exe 依赖这个库文件来实现功能。这个 dll 文件,就放在 c:\windows\system32\ 目录下,也就是操作系统安装的目录。因此操作系统其实有很多功能,其实是为了提供各种程序运行的,而远不止是我们常用的安装、管理各种软件的图形界面。
如果你没有在 Microsoft Visual Studio 中安装 Windows11 SDK 这个组件的话,你就会得到一个错误信息: LINK : fatal error LNK1104: 无法打开文件“kernel32.lib” ,这个错误信息说明了这个 exe 程序,需要和 kernel32 这个库进行链接。
在这最后一步,我们接触了 dll 文件,也就是“库”文件。C 语言学习和使用中,最让人头秃的问题之一,就包括和“库”相关的各种问题。下一篇,我会仔细说说这个“库”到底是怎么回事。
评论区
共 17 条评论热门最新