C++编译原理之求解First集合

Bea ·

更新时间:2024-11-13

· 173 次阅读

1、上机要求

2、原理

3、一点思路及优化

4、代码

4.1 lan.txt文件内容

4.2 lan.txt文件内容

1、上机要求

目的：熟练掌握自上而下的语法分析方法，并能用程序实现。

要求：

例如，使用的文法如下：
编写First函数，实现其求解过程。

E -> TE'
E' -> +TE' | #
T -> FT'
T' -> *FT' | #
F -> (E) | id
end

提示：

非终结符为大写字母；或后面带'的大写字母

终结符为小写字母和符号（+、*）

推导符号→为或->

用end结束文法。

不针对特定文法，编写求first函数。

2、原理

A -> a，则将 a 加入 First(A)中
A -> Y1Y2···Yn

将 First(Y1) 除空串外的字符加入到First(A)中，若 1 =< i < n - 1，Y1，Y2， Yi中均含有空串，则将First(Yi + 1)加入到First(A)中，若Y1，Y2，···，Yn都有空串，则将空串加入到First(A)中

First(a) = {a}

3、一点思路及优化

将输入格式化（扫描输入）
将产生式转换为哈希map：

对任一产生式： A -> body_1 | body_2 | ··· | body_n，

将 A 作为map的 key，

map的value为一个string类的向量(vector<string> )，

将 body_1，body_2，···，body_n 都加入value中。

求解First(str)

特殊情况处理，str为空或str不在产生式的key中，返回空；str的首个字符是终结符，返回首个字符构成的集合。

一般情况，获取str推导产生的产生体集bodys(其中的每个产生体为body)，遍历产生体集合求解First集

针对空串，我们加入标记hasBlank = true，往下遍历body的字符

body的首个字符为终结符，直接将该字符加入first集，记hasBlank = false以便遍历下一body（如果有的话）。

body的首个字符为非终结符，递归求解该非终结符first集，记为temp，同时将空串标记记为false，将temp的中除空串外的字符加入first集；若temp中有空串，记空串标记为true，继续遍历当前body的字符，理解上可以将body后面的字符串视为一个新的body继续进行求解步骤。

body的字符遍历结束后若空串标记hasBlank仍然为true，则将空串加入first集。

优化：递归求解的中间结果可以放在全局哈希First（或者换个名字避免冲突）中，避免重复的迭代（本代码没实现，下次一定）。

4、代码


/**
 * @brief Function for generating set of First(a)
 * @author 立秋小猪
 * @time: 2021/10/13
 * @notice: 要求产生体句型不得有空格
 *          左递归的产生体中必须有空串（必须能够终结）
 *          char '#' act as varepsilon 
 * **/
#include <iostream>
#include <unordered_map>
#include <vector>
#include <string>
#include <fstream>
#include <unordered_set>
using namespace std;
unordered_map<string, vector<string>> P; //产生式P的集合
void scan(){
    //scan函数实现从文件扫描文法，将对应的产生式加入到映射P中
    fstream fs;
    string input;
    fs.open("lan.txt");
    if(!fs.is_open()){ // 文件打开失败
        cout << "Error: Could not open the file" << endl;
        exit(-1);
    }
    fs >> input;
    while(input != "end"){
        string VN = input; // 产生式的非终结符
        fs >> input; //跳过推导符号
        if (input != "->" && input != "→"){
            cout << "Error: undefined symbol [" << input << "]" << endl;
            exit(-2);
        }
        fs >> input; //产生体拆开后加入到set集合中，默认推导符号后必有一个产生体
        P[VN].emplace_back(input);
        while( fs >> input && input == "|"){
                fs >> input;
                P[VN].emplace_back(input);
        }
    }
}
// void generate(){
// }
unordered_set<char> First(const string& str){
    // 终结符以及空串情况下, whether has the VN or not
    if(str == "" || str == "#" || P.find(str) == P.end())
        return {};
    if(!(str[0] >= 'A' && str[0] <= 'Z'))
        return {str[0]};
    vector<string> bodys = P[str]; // str -> bodys
    unordered_set<char> res = {};
    for(auto &s: bodys){
        bool hasBlank = true;//是否含有空串，是否继续读产生体
        for (int i = 0; i < s.size() && hasBlank; ++i){
            if(s[i] >= 'A' && s[i] <= 'Z'){//是否为终结符
                unordered_set<char> temp = {};//递归的临时集
                string next;
                if(i < s.size() - 1 && s[i + 1] == '\''){ // 大写字母 + ' 的非终结符
                    next = s.substr(i, 2);
                    ++i;
                }else{ //仅仅是大写字母的终结符
                    next = s[i];
                }
                if(next != str){ //避免无限递归，默认自身是含有空串（hasBlank为True）
                    temp = First(next); //递归求解
                    hasBlank = false; //先默认temp中没有空串
                    for(auto &c : temp)
                        if(c == '#')
                            hasBlank = true;//temp中发现了空串
                        else
                            res.emplace(c);
                }
            }else{
                res.emplace(s[i]);
                hasBlank = false;//默认连接的终结符不为空，故此终结符后不会再有新元素加入First集
            }
        }
        if(hasBlank) //产生体中所有非终结符都包含空串，则将空串加入first集中
            res.emplace('#');
    }
    return res;
}
int main(){
    // unordered_map<string, vector<char>> First; //First集合
    scan();
    cout << "输入的产生式如下：\n"
         << "********************************\n";
    for(auto &[vn, bodys]: P){
        cout << vn << " -> " << bodys[0];
        for (int i = 1; i < bodys.size(); ++i)
            cout << " | " << bodys[i];
        cout << endl;
    }
    cout << "********************************\n";
    for(auto &[vn,_]: P){
        unordered_set<char> f = First(vn);
        cout << "First(" << vn << ") : ";
        auto iter = f.begin();
        if(iter != f.end()){
            cout << *iter;
            while(++iter != f.end()){
                cout << " , " << *iter;
            }
        }
        cout << endl;
    }
    return 0;
}

4.1 lan.txt文件内容


E -> TE'
E' -> +TE' | #
T -> FT'
T' -> *FT' | #
F -> (E) | id
end

运行结果

4.2 lan.txt文件内容


S -> SaRb | #
R -> RSQ | #
Q -> e
end

运行结果

到此这篇关于C++/编译原理之求解First集合的文章就介绍到这了,更多相关C++ 求解First集合内容请搜索软件开发网以前的文章或继续浏览下面的相关文章希望大家以后多多支持软件开发网！

c+ 编译原理 C++

1024 个赞

需要登录后方可回复, 如果你还没有账号请注册新账号

XSL-FO 区域

Uma 2020-10-21

610

一张图片能隐含千言万语之隐藏你的程序代码

Maha 2021-06-11

689

python3爬虫之入门基础和正则表达式

Dreama 2020-06-22

633

一文详解C++关键字nullptr及与NULL的区别

Xanthe 2023-07-21

1846

C++ std::chrono库使用示例(实现C++ 获取日期,时间戳,计时等功能)

Faith 2023-07-21

367

C++面经之什么是RAII面试问题解析

Laila 2023-07-21

548

C++使用expected实现优雅的错误处理

Tia 2023-07-21

1849

c与c++之间的相互调用及函数区别示例详解

Chipo 2023-07-21

513

C++存储持续性生命周期原理解析

Rhea 2023-07-28

1265

C++存储链接性原理详解

Kathy 2023-07-28

743

C++ 类模板与成员函数模板示例解析

Nora 2023-07-28

276

C++开发protobuf动态解析工具

Pandora 2023-07-28

1666

利用C++开发一个protobuf动态解析工具

Tani 2023-07-28

1384

我要提问

致谢

帮助他人，成就自己。

人生最大成功就是伸出热情而温暖的双手，尽自己所能去帮助身边的每一个人，只要无私的奉献，就会收获到美好的生活。

1024问感谢每一位朋友的帮助和支持。

软件开发网提供编程的基础软件技术培训教程,软件开发编程实例讲解Go,Node,HTML,CSS,Javascript,Python,Java,Ruby,C,PHP,MySQL等软件开发编程语言以及数据开发的基础知识，也提供大量的软件开发在线实例、从入门到精通就在1024问。

育儿网微养生全球行美食街育儿菜谱大全海南旅游女性养狗百科星座