首页 > 代码库 > LUA string库

LUA string库

      Lua解释器对字符串的支持很有限。一个程序可以创建字符串并连接字符串,但不能截取子串,检查字符串的大小,检测字符串的内容。在Lua中操纵字符串的功能基本来自于string库。

一、String库的常用函数:

--返回字符串s的长度
local s = "HelloWorld"
print(string.len(s))  -->10


--重复n次字符串s的串
print(string.rep(s,2))  -->HelloWorldHelloWorld


--大写字母转换成小写
print(string.lower(s))  -->helloworld

--小写转换成大写
print(string.upper(s))  -->HELLOWORLD

--截取字符串
local s = "[in brackets]"
print(string.sub(s,2,-1))  -->in brackets]

--将每一个数字转换成字符
print(string.char(97))  -->a

--将每一个字符转换成数字
print(string.byte("abc"))
print(string.byte("abc", 2)) --> 98
print(string.byte("abc", -1)) --> 99

--注:使用负数索引访问字符串的最后一个字符

--对字符串进行格式化输出
PI = 3.14165120
print(string.format("pi = %.4f", PI))  -->pi = 3.1417
--注释:使用和C语言的printf函数几乎一模一样,你完全可以照C语言的printf来使用这个函数.

注:

      string库中所有的字符索引从前往后是1,2,...;从后往前是-1,-2,...

      string库中所有的function都不会直接操作字符串,而是返回一个结果。


二、String库的模式匹配函数


      在string库中功能最强大的函数是:string.find(字符串查找),string.gsub(全局字符串替换),and string.gfind(全局字符串查找)。这些函数都是基于模式匹配的。

1.string.find  

      说明:用来在目标串(subject string)内搜索匹配指定的模式的串。函数如果找到匹配的串返回他的位置,否则返回nil.最简单的模式就是一个单词,仅仅匹配单词本身。比如,模式‘hello‘仅仅匹配目标串中的"hello"。当查找到模式的时候,函数返回两个值:匹配串开始索引和结束索引。

local s = "hello world"
i,j = string.find(s,"hello")
print(i,"   ",j)  -->1	   	5

print(string.find(s, "kity"))  -->nil
      string.find函数第三个参数是可选的:标示目标串中搜索的起始位置。当我们想查找目标串中所有匹配的子串的时候,这个选项非常有用。

local s = "\nare you ok!\n OK\n"
local t = {}
local i = 0
while true do
	i = string.find(s,"\n",i+1)
	if i == nil then break end
	table.insert(t,i)	
end

for k,v in pairs(t) do
	print(k,"->",v)  
end
      运行结果:



2.string.gsub

      说明:函数有三个参数:目标串,模式串,替换串。他基本作用是用来查找匹配模式的串,并将使用替换串其替换掉:

s = string.gsub("Lua is cute", "cute", "great")
print(s)  -->Lua is great

--第四个参数是可选的,用来限制替换的范围
s = string.gsub("all lii", "l", "x", 1)
print(s)  -->axl lii

_, count = string.gsub("all lii", "l", "x", 2)
print(count)  -->2

注:_ 只是一个哑元变量


3.string.gfind 

      说明:遍历一个字符串内所有匹配模式的子串。如:

--收集一个字符串中所有的单词,然后插入到一个表中:
local s = "hello hi, again"
words = {}
for w in string.gfind(s, "(%a)") do
table.insert(words, w)
end

for k, v in pairs(words) do
	print(k,v)
end
运行效果:

            


三、模式


      字符类指可以匹配一个特定字符集合内任何字符的模式项。比如,字符类%d匹配任意数字。

s = "Deadline is 30/05/1999, firm"
date = "%d%d/%d%d/%d%d%d%d"
print(string.sub(s, string.find(s, date))) --> 30/05/1999

      下面的表列出了Lua支持的所有字符类:



在模式匹配中有一些特殊字符,他们有特殊的意义,Lua中的特殊字符如下:




例子:

print(string.gsub("hello, A up-down!", "%A", ".")) 	-->hello..A.up.down.	5
--参数4不是字符串结果的一部分,他是gsub返回的第二个结果,代表发生替换的次数

--[]方括号将字符类或者字符括起来创建自己的字符类
print(string.gsub("text", "[AEIOUaeiou]", ""))  		-->txt	  1

print(string.len("one, and two; and three"))  			-->23

print(string.gsub("one123, and two", "%d+", "XXX")) 	-->oneXXX, and two	1


四、捕获


      Capture3是这样一种机制:可以使用模式串的一部分匹配目标串的一部分。将你想捕获的模式用圆括号括起来,就指定了一个capture。
在string.find使用captures的时候,函数会返回捕获的值作为额外的结果。这常被用来将一个目标串拆分成多个:

pair = "name = Anna"
a, b, key, value = http://www.mamicode.com/string.find(pair, "(%a+)%s*=%s*(%a+)")>
      ‘%a+‘ 表示非空的字母序列;‘%s*‘ 表示0个或多个空白。在上面的例子中,整个模式代表:一个字母序列,后面是任意多个空白,然后是 ‘=‘ 再后面是任意多个空白,然后是一个字母序列。两个字母序列都是使用圆括号括起来的子模式,当他们被匹配的时候,他们就会被捕获。当匹配发生的时候,find函数总是先返回匹配串的索引下标,然后返回子模式匹配的捕获部分。

      我们常常需要使用string.gsub遍历字符串,而对返回结果不感兴趣。比如,我们收集一个字符串中所有的单词,然后插入到一个表中:

--收集一个字符串中所有的单词,然后插入到一个表中:
local s = "hello hi, again"
words = {}
for w in string.gfind(s, "(%a)") do
table.insert(words, w)
end

for k, v in pairs(words) do
	print(k,"->",v)
end

运行结果: