C++正则文法定义-正则表达式-NFA-DFA-最小化DFA-字符串匹配DFA_正则表达式-NFA-DFA-min(DFA)-词法分析程序C++资源-CSDN文库

共63个文件

cpp：13个

h：13个

obj：13个

编译原理

词法分析

需积分: 48 143 浏览量 2018-10-06 21:30:22 上传评论 20 收藏 17.1MB ZIP 举报

资源推荐

资源详情

资源评论

收起资源包目录

词法分析程序.zip （63个子文件）

词法分析程序.docx 23KB

UML静态类图.vsdx 78KB

源码

Lexical_Analysis

NFA.h 748B

ProgramManager.h 259B

DFA.cpp 10KB

Lexical_Analysis.vcxproj.filters 3KB

Debug

AdjoinNode.obj 6KB

AssistStackNode.obj 5KB

vc141.pdb 988KB

NFA.obj 496KB

ProgramManager.obj 340KB

ModuleStackNode.obj 5KB

RegularRule.obj 274KB

Node.obj 7KB

ModuleStack.obj 6KB

DFA.obj 1.68MB

Lexical_Analysis.obj 321KB

vc141.idb 299KB

Lexical_Analysis.tlog

Lexical_Analysis.lastbuildstate 211B

CL.read.1.tlog 18KB

link.read.1.tlog 6KB

link.write.1.tlog 2KB

CL.write.1.tlog 23KB

link.command.1.tlog 3KB

CL.command.1.tlog 11KB

DFANode.obj 176KB

AssistStack.obj 6KB

Lexical_Analysis.log 168B

stdafx.obj 72KB

Lexical_Analysis.pch 24.5MB

Lexical_Analysis.vcxproj.user 165B

NFA.cpp 5KB

Node.cpp 359B

Node.h 335B

ProgramManager.cpp 388B

AssistStackNode.cpp 159B

ModuleStack.cpp 320B

Lexical_Analysis.cpp 1KB

stdafx.h 988B

RegularRule.h 593B

ModuleStackNode.cpp 183B

DFANode.h 218B

RegularRule.cpp 1KB

ModuleStack.h 228B

stdafx.cpp 334B

AdjoinNode.cpp 273B

DFA.h 667B

AssistStack.h 210B

AdjoinNode.h 276B

AssistStackNode.h 179B

DFANode.cpp 241B

AssistStack.cpp 286B

ModuleStackNode.h 216B

targetver.h 370B

Lexical_Analysis.vcxproj 9KB

Debug

Lexical_Analysis.ilk 2.05MB

Lexical_Analysis.pdb 2.23MB

Lexical_Analysis.exe 416KB

.vs

Lexical_Analysis

v15

ipch

12e9b995b0192996.ipch 32.25MB

.suo 91KB

Browse.VC.db 6.33MB

Lexical_Analysis.sln 1KB

UML静态类图.jpg 106KB

词法分析程序思路

（一）正则规则和正则表达式

1] 数据结构：正则规则使用 RegularRule 类来存储，正则表达式为一个 string。

2] RegularRule：

i. alphabet:map<char, set<char>>，存储主字符表，key 为某类字符的代表符号，

value 是这个代表符号代表的所有字符的集合。这个属性提供给用户自定义的

方法，用户可以随意更改正则规则。

ii. assistAlpha:set<char>，存储辅助字符，实际上只有‘*’，‘|’，‘（’，‘）’四个符

号。这个属性用户无法修改，因为所有的正则文法都可以用这四个辅助字符

来表示。

3] bool check(string )：用于检查一个字符串是否是符合这种正则文法的正则表达式。

大体算法如下：首先判断表达式中的各个辅助符号是否符合限制要求，然后遍历

各字符是否是设定好的集合中的字符，一条不满足就返回 false，全部满足返回

true。

（二）NFA 的存储结构设计

1] 原则：使用节点序号来唯一标识一个节点，使用类似邻接表但做了一定修改的形

式来存储。（详见 UML 静态类图）

2] Node 类：在主表中存储 NFA 的各个节点，包含节点序号和邻接表地址两个属性。

3] AdjoinNode 类：邻接表节点类，含有该节点的序号，由主节点转换为该节点的条

件，以及下一个邻接节点的地址三个属性组成。

4] nodeMap:map<int,Node*>，NFA 节点主表，使用哈希表来无序存储各个节点，key

为节点序号，value 为该节点对应的 Node 对象。

5] sIndex:int，存储初态节点序号，初始化为 0。

6] zIndex:int，存储终态节点序号，初始化为 1。

7] regularRule:RegularRule，存储该 NFA 遵守的自定义的正则规则。

8] regularExpr:string，存储该 NFA 对应的正则表达式。

（三）正规式转化 NFA

1] 核心：把正则表达式分成一个一个的子模块，然后依据各个辅助符号进行模块间

的连接，最终形成一个完整的 NFA。

2] 数据结构：moduleStack：这是一个栈，每一个节点有两个属性，为该模块的初态

节点和终态节点。assistStack：这是储存辅助符号的栈，但只负责存储’(’，’|’，’.’

三个符号，‘*’会单独处理，‘)’是出栈的信号。

3] 具体流程：

i. 检验正则表达式是否符合正则规则，否则返回 false。

ii. 把 0 和 1 的初始初态终态压入 moduleStack。

iii. 在已知正则表达式的首尾添加一对括号。

iv. 把已知正则表达式中省略的连接符号添加上。

v. 开始进行输入：

vi. If 检测到输入为(‘(’ || ‘|’ || ‘.’)，就把这些符号压入 assistStack。

vii. If 检测到输入为主字符，就给这个字符构造初态终态，把新添加的节点和跃

迁关系添加进 nodeMap，并把这个字符的初态终态作为一个子模块压入

moduleStack。

viii. If 检测到‘*’，就把 moduleStack 的栈顶的子模块添加两个节点，进行闭包操作，

把新添加的节点和关系存储进 nodeMap。之后把原栈顶的模块替换成新生成

的模块。

ix. If 检测到‘）’，就在 assistStack 中进行出栈操作。如果出栈元素为‘|’，就把

module 栈中的栈顶的两个模块取出来，按照‘|’的结合方式合成一个新的子模

块，把添加的节点和关系加入 nodeMap ，并把这个新的子模块再存入

moduleStack 中，然后继续出栈；出栈元素是‘.’，那么操作和‘|’类似，只不过

更改了两个模块的结合方式；如果出栈元素是‘（’，就停止出栈。

x. 一直到输入结束，moduleStack 中只有一个模块了，那么它存储的就是最终

NFA 的初态和终态序号，把最终的终态序号存入 zIndex 中，NFA 构造完毕。

（四）DFA 的存储结构设计

与 NFA 大体相同，但是它的结点表使用的结点类为 DFANode，这个类继承了 Node 类，

并比 Node 类多了一个 set<int>类型的参数，用于存储 DFA 的每一个状态结点所代表的 NFA

的子集。

具体的函数设计详见 UML 静态类图。

（五）NFA 转化为 DFA

1. 子集构造法的具体实现流程

1] 定义一个可变数组 onOrder，用于存储已经被检测到，但尚未被扫描的子集。

2] 定义两个函数 move()和 closure()，用于执行 move 和闭包运算，具体函数实现详见

评论收藏

内容反馈

StrongPanda

粉丝: 13
资源: 1

C++ 正则文法定义-正则表达式-NFA-DFA-最小化DFA-字符串匹配DFA

最新资源

C++ 正则文法定义-正则表达式-NFA-DFA-最小化DFA-字符串匹配DFA

编译原理正则表达式转NFA转DFA DFA最小化 Cpp代码

正则表达式最小化DFA

正则表达式—>NFA—>DFA—>DFA最小化

正则表达式转化为最小化DFA

正则表达式NFA和DFA

正则表达式-NFA-DFA-min(DFA)-词法分析程序

编译原理——模拟实现DFA/NFA

DFA的最小化 （完整可运行代码）

编译原理实验 DFA的最小化 c++代码

c++实现NFA与DFA转换

已知一个正则表达式,把它转化为nfa,nfa转化为dfa,dfa最小化

NFA转换DFA的C++程序

正则表达式转换为ＮＦＡ，dfa,确定化

正则表达式 到 nfa dfa

输入一个正则表达式，匹配字符

正则表达式转DFA

NFA->DFA词法分析

DFA,NFA实现

NFA转DFA，并将DFA最小化

编译原理—DFA的最小化

DFA运用c语言的一种实现

正则式转成最小DFA C++编写 设计含文档

最小的C++正则表达式库

NFA转DFA&DFA最小化&NFA与DFA语言子集NFA转DFA&DFA最小化&NFA与DFA语言子集

编译原理——NFA转换为DFA（C++程序）

NFA到DFA的转化程序

编译原理程序小集（正则表达式 NFA DFA MFA 词法分析 语义分析）

正则式转NFA,DFA,MFA.zip

正则表达式的词法分析程序

最新资源

DFA的最小化（完整可运行代码）

正则表达式到 nfa dfa

正则式转成最小DFA C++编写设计含文档

编译原理程序小集（正则表达式 NFA DFA MFA 词法分析语义分析）