【学习笔记】编译原理-有限自动机

首页 > 代码库 > 【学习笔记】编译原理-有限自动机

【学习笔记】编译原理-有限自动机

2024-07-09 08:06:52 224人阅读

一、定义：

不确定的有限自动机(NFA): 一种数学模型
(1) 一个有限的状态集合S
(2) 一个输入符号集合∑（不包含ε）
(3) 一个转换函数move： S X (∑ U {ε}) -> P(S)
(4) 状态s0是唯一的开始状态
(5) 状态集合F是接受状态集合，S包含F
确定的有限自动机(DFA): 是NFA的特殊情况
(1) 任何状态都没有ε转换
(2) 对于任何状态s和任何输入符号a，最多只有一条标记为a的边离开，即转换函数move： S X ∑-> S可以是一个部分函数。

二、表示：

1.NFA：

NFA可以用带标记的有向图表示，节点表示状态，有标记的边代表转换函数。

(a|b)*ab的NFA

(图1)

状态转换表

状态\输入字符	a	b
0	{0,1}	{0}
1	?	{2}
2	?	?

2.DFA：

(a|b)*ab的DFA

(图2)

三、NFA到DFA：子集构造法

步骤

假设有(a|b)*ab的NFA图中

(图3)

第一步：由起始位置配ε可以到达的所有状态集合{0,1,2,4,7}作为DFA的起始状态A；
第二步：确定字母表{a，b}
第三步：可以画出DFA的转换表Dtran的模型，(*表示未确定)

状态\输入字符	a	b
A {0,1,2,4,7}	*	*

第四步：寻找表中未确定项,例如[A,a],为该空确定转移状态,从图(1)可知集合A中的状态匹配输入字符a，可以转移到的状态集合为{1,2,3,4,6,7,8}，该集合没有出现过，所以要在DFA的转换表Dtran的模型中加入该状态集。

状态\输入字符	a	b
A {0,1,2,4,7}	B	*
B {1,2,3,4,6,7,8}	*	*

第五步：重复第四步，知道确定DFA的转换表Dtran

状态\输入字符	a	b
A {0,1,2,4,7}	B	C
B {1,2,3,4,6,7,8}	B	D
C {1,2,4,5,6,7}	B	C
D {1,2,4,5,6,7,9}	B	C

第六步：根据DFA转换表就可以画出DFA的状态图。

伪代码

Q    为处理的集合队列
s    起始状态集合
G    为转换表

S = getSet(s, ε); //获得起始状态集S

为S分配一个唯一的标识码，例如(0),对应到G;

将S加入队列Q;

while(Q不为空) {
    U = Q.front(), Q.pop(); // 取队列中的首项处理

    for (对于字母表中的每个字母) {
        New = getSet(U, a); // a为当前考虑的字符,New为集合变量，接受处理得到的新集合

        if (New == ?)
            continue;

        获得New集合的标识码，如果未出现，则在Q中加入New，并为New分配一个标识码。
        G[U,New] = a;
    }
}


对于getSet函数来说，给定一个集合U和匹配字符a，获得一个转移集合V，该函数需要注意边为ε的时候，因为NFA的边可以为ε。

声明：以上内容来自用户投稿及互联网公开渠道收集整理发布，本网站不拥有所有权，未作人工编辑处理，也不承担相关法律责任，若内容有误或涉及侵权可进行投诉：投诉/举报工作人员会在5个工作日内联系你，一经查实，本站将立刻删除涉嫌侵权内容。

联系
我们

首页 > 代码库 > 【学习笔记】编译原理-有限自动机

【学习笔记】编译原理-有限自动机

一、定义：

二、表示：

1.NFA：

2.DFA：

三、NFA到DFA：子集构造法

步骤

伪代码

看完仍有疑问？有类似问题直接问程序猿