虽然说很多数据处理功能,我们都能通过编程语言的数学运算符完成,但那些很常见的,很标准的功能,能有一个标准库还是很不错的。有的语言倾向于提供尽量多的功能,由于人类对于编程的抽象思考在不断进步,总会有更多的新想法被加入软件行业,所以这些库也会越来越大,譬如 Java、C#、Python 都会附带大量各种功能的库。而有的语言则希望提供尽量少的功能,因为这些语言往往是脚本或者虚拟机类型,他们的运行方式,是需要把所有的标准库都一起带上的,所以功能少一点,使用环境部署的环境也会小一点。
大部分语言都会提供数学库,包含指数运算、幂运算、三角函数、自然对数等等。其中对于游戏来说最重要的是随机函数。 Lua 的随机函数是 math.random ([m [, n]]) ,返回从 m 到 n 的一个随机整数。记得要使用 math.randomseed (x) 可以设置随机种子,一般 x 参数使用 os.time(),通过运行时间的随机作为随机种子。这也让我们可以在多个不同机器上,根据统一的随机种子,生成统一的随机数,这在多人游戏中,通过共用随机种子来生成相同的随机数,从而让多个机器上的游戏表现一致。
math.randomseed(10)
print(math.random(0,9)) --> 6
print(math.random(0,9)) --> 5
print(math.random(0,9)) --> 1
上面这段代码不管什么时候运行,都是固定的这个结果,所谓的伪随机就是这个意思了。
很多语言,都希望能“跨操作系统”,提供给开发者一致的开发体验。把一些操作系统能力都有的部分,通过同样的 API 提供出来。譬如 C 语言可以使用 POSIX(Portable Operating System Interface of UNIX) 库统一的操作各种 UNIX。Java 和 C# 也提供了操作系统的一些基础功能通用库,可以运行在 Linux、Windows、MacOS 上。对于脚本语言来说,这个能力基本上依赖于目标操作系统的解析器的能力了。常见的操作系统能力 API 包含:
很多其他语言的数据结构库都非常庞大,譬如 java.util 这个包,里面就有链表、二叉树等等一大批。C++ 的 STL 也可以算一种库(模板),也是有各种数据结构。但是 Lua 只用一个 table,就够用了。
对于一些语言来说,字符串也算一种数据结构。几乎所有语言,都带有异常丰富的字符串处理 API,一般会包含:
查找子字符串位置
按位置切分字符串
连接字符串和格式化字符串
以上这些功能,Lua 都有,基本上所有的字符串处理需求,都可以用上面的功能组合而成。除了这些常见的字符串函数,Lua 还提供了 string.pack() 和 string.unpack() 这两个函数。这两个函数实际上是把 string 这种变量,作为一个二进制缓冲区来操作,定义了大量的按照某种二进制编码写入或读出数据的方法。
s = string.pack("i", 1145258561)
print(s) --> ABCD
上面的的例子中的 1145258561,以整数形式(也就是 "i" 格式)写入字节数组中,那四个字节刚好是:65 66 67 68,所以按 ASCII 打印的话,就是 ABCD 这个字符串了。当然你用 string.unpack("i", "ABCD") 也会得到数字 1145258561。这一对函数,就是为了网络传输、文件存储数据使用的。
最后也要提一下的,就是 Lua 也提供了 UTF8 库。一般的 string 里面,长度是按英文的规定,一个字节就是一个字符。而只有 utf8 库,才能真正的区分清楚非英文字符到底应该怎么分。
s = "中文"
print(#s) --> 6
print(utf8.len(s)) --> 2
在 utf-8 编码中,一个汉字使用三个字节。只有 utf8.len() 才真正的能读懂中文是两个字符。所以,如果要切分包含汉字的字符串,譬如需要截断过长的字符串,怎样才能不把汉字截一半呢?可以看下面的例子:
s="123甲乙丙456天地人"
print(string.sub(s, utf8.offset(s, 4), utf8.offset(s,5) -1)) --> 甲
这里的 utf8.offset(s, 4) 表示返回字符串中第 4 个字符“甲”的“字节位置”,是 4;而 utf8.offset(s, 5) 返回的是“乙”的字节位置,是 7。因此按照字节位置来看,要截取第四个字符“甲”,就应该从第 4 字节截取到第 6 字节。尽管 Lua 的截取字符串函数,还是以字节为单位的,但是通过 utf8 库关于字符位置判读的函数,我们还是可以正确的识别出中文等非单字节字符的。
大多数语言都会带有文件系统的 API。在很多操作系统上,所有的设备都被抽象成文件,因此用这一套 API 就都可以操作。一般操作文件,都需要经过几个过程:
打开一个文件,指定文件的路径和模式,模式包括读取、写入、追加
对文件进行读写
关闭文件
file = io.open("test.txt", "a")
file:write("--test")
file:close()
file = io.open("test.txt", "r")
print(file:read())
file:close()
上面这个代码,每次调用 file:write() 就会写入一行,而调用 file:read() 就会读取一行内容。注意这里用的是冒号 : 的写法,调用 file 变量身上的方法。但是,如果你要读的文件不是文本文件,而是一个图片或者别的什么格式文件呢?每次读一行的话,可能根本就没有分行呢!这种时候可以通过 file:read(1024) 这种用法,一次从文件中读取 1024 个字节的数据出来。 file:read() 返回值虽然依然是 string 字符串,但是你可以通过字符串里面的每个字符,通过 string.byte(str, 1, #str) 来返回一个字节列表。
Lua 也提供了所谓“简易”模式,使用 io.input()/io.read()/io.output()/io.write() 这些 API 来读写文件,这些可以去查手册。
当然,说都文件我们都不会放过 stdin/stdout/stderr 这三个。这些是操作系统为每个启动的进程默认打开的三个文件,stdin 一般是键盘,stdout、stderr 一般都是屏幕。在 Lua 中,这三个已经打开的文件,调用方法非常直接: io.stdout:write("haha\n") ,这样你就在屏幕上打印了 "haha"。 io 这个 table,早已准备好了 io.stdin io.stdout io.stderr 了。
TCP/IP 网络功能,现在已经是各家操作系统必备的功能了,提供的所谓 socket 库也是最常见的功能。不过 Lua 并没有按照带这方面的标准库。也许是 Lua 认为自己应该被嵌入在其他带有网络功能的程序中,而不是自己成为一个网络模块。事实上网络功能确实也比较复杂。以小型化著称的 Lua 带上这个功能确实有点奇怪。不过网络上还是有人开发了第三方的网络库,譬如 luasocket,这是一个用 C 语言写给 Lua 使用的网络库,而且它还提供非阻塞的异步方式操作网络,和 Lua 的协程配合使用非常不错。
现代数据库除了 SQL 操作的关系型数据库以外,还有类似 mongoDB 这种对象数据库。虽然数据库厂商一般会提供自己的操作 API,但是类似 Java 这种语言,也提供了 java.sql 包作为规范,让各家 SQL 数据库都可以用同一种接口使用。
对于 Lua 来说,也是没有带自己的数据库操作库的。不过开源的 LuaSQL 可以在需要的时候下载安装来使用。
对于任何语言来说,如果某个功能不具备,最后的手段一定是:“调用一个C语言的库”。因为大多数功能,都会有 C 的库。Lua 的解析器本身就是 C 语言写的,所以 Lua 要调用 C 的库,也是一定支持的。如果要让 Lua 调用一个 C 的函数,最简单的做法,就是用 C 写一个动态链接库。然后运行 LUA 解析器的时候,让解析器可以找到这个动态链接库,譬如放在 lua 启动脚本的同一目录,或者任何合法的操作系统动态链接库的加载目录。
当然这个动态链接库里面的 C 代码,是有一定规矩的,才能被 lua 调用:
#include <stdio.h>
#include <math.h>
#include <stdarg.h>
#include <stdlib.h>
#include <lua.h>
#include <lauxlib.h>
#include <lualib.h>
/* 所有注册给Lua的C函数具有
* "typedef int (*lua_CFunction) (lua_State *L);"的原型。
*/
static int l_sin(lua_State *L)
{
// 如果给定虚拟栈中索引处的元素可以转换为数字,则返回转换后的数字,否则报错。
double d = luaL_checknumber(L, 1);
lua_pushnumber(L, sin(d)); /* push result */
/* 这里可以看出,C可以返回给Lua多个结果,
* 通过多次调用lua_push*(),之后return返回结果的数量。
*/
return 1; /* number of results */
}
/* 需要一个"luaL_Reg"类型的结构体,其中每一个元素对应一个提供给Lua的函数。
* 每一个元素中包含此函数在Lua中的名字,以及该函数在C库中的函数指针。
* 最后一个元素为“哨兵元素”(两个"NULL"),用于告诉Lua没有其他的函数需要注册。
*/
static const struct luaL_Reg mylib[] = {
{"mysin", l_sin},
{NULL, NULL}
};
/* 此函数为C库中的“特殊函数”。
* 通过调用它注册所有C库中的函数,并将它们存储在适当的位置。
* 此函数的命名规则应遵循:
* 1、使用"luaopen_"作为前缀。
* 2、前缀之后的名字将作为"require"的参数。
*/
extern int luaopen_mylib(lua_State* L)
{
/* void luaL_newlib (lua_State *L, const luaL_Reg l[]);
* 创建一个新的"table",并将"l"中所列出的函数注册为"table"的域。
*/
luaL_newlib(L, mylib);
return 1;
}
在 lua 里面,我们用下面代码就可以引入这个库了:
--[[ 这里"require"的参数对应C库中"luaopen_mylib()"中的"mylib"。
C库就放在"a.lua"的同级目录,"require"可以找到。]]
local mylib = require "mylib"
-- 结果与上面的例子中相同,但是这里是通过调用C库中的函数实现。
print(mylib.mysin(3.14 / 2)) --> 0.99999968293183
事实上,好像 LuaSocket 和 LuaSQL 这种第三方库,都是用上面这种方法来实现的。我们安装这些第三方库,实际上也是把这些用 C 写的动态链接库编译好,然后放好而已。
如果你想要自己动手写一些 C 的 LUA 扩展库,还是需要搞明白 lua_State 这个类型具体要怎么操作才行。这里有一整套和 Lua 交互的规则和概念。但是如果你不想去手工的操作 lua_State ,还有另外一个选择,就是 SWIG ,这是一个专门设计用来给各种脚本语言,编写 C/C++ 扩展的一套开源框架。你几乎可以随便写一个 C/C++ 的类库,然后通过配置一些到 lua 的配置文件,就可以用 swig 命令自动生成 C 语言源码,并且编译成 Lua 所需要的动态链接库。
我的微信公众号“韩大”里翻译了 SWIG 官方手册和 Lua 有关的大部分章节,可自行查阅。
有很多语言,把 HTTP 协议、安全加密功能等方面,都纳入了标准库之中。其实标准库的学习,最重要的是要知道都包含了什么功能,而不是具体怎么使用。因为这些库可能在不停的增加,甚至类似的功能可能有好几个不同的抽象概念的版本。
对于 Lua 来说,也许现在的标准库就是最好的情况,再多的话解析器可能太大了。作为和 C 语言合作的好搭档,大部分复杂的功能完全可以靠 C 的库来封装,加上 SWIG 这类工具,自己动手扩展 Lua 的库也不是难事。
学习 Lua 之旅到此结束。作为脚本语言,需要学习的内容确实比另外一些需要编译的语言要少一点点。不过大部分的功能,Lua 都是具备的,甚至有些还更加简洁精妙。我们不能期望一门语言解决所有的问题,就算这门语言功能很多,但也会带来高昂的学习和使用成本。甚至对于一些复杂的语言来说,并不是所有的语言特性都需要一下子全部掌握,才能干好开发的工作。毕竟编程语言都是工具,了解工具的设计目的,是使用好工具最重要的认识。对于 Lua 来说,这门语言就是用来快速开发,嵌入其他程序使用的,所以灵活的数据结构,可以自己解析自己的反射能力,简洁的语法,就是最重要的部分。
评论区
共 条评论热门最新