[LeetCode 周赛184] 3. HTML 实体解析器(字符串替换、坑点注意、常规解法)

Halima ·
更新时间:2024-09-20
· 717 次阅读

文章目录1. 题目来源2. 题目说明3. 题目解析方法一:字符串替换+坑点注意+常规解法 1. 题目来源

链接:1410. HTML 实体解析器

2. 题目说明

在这里插入图片描述
在这里插入图片描述

3. 题目解析 方法一:字符串替换+坑点注意+常规解法

这题本来对于 javapy 选手来讲,直接库函数 replace 一行搞定了…对于 C++ 选手就老老实实的进行字符串匹配、替换吧。简单说下思路:

首先利用 mapHTML 字符实体与对应字符进行一个匹配存储 双重循环,首先遍历 map 中所有的字符实体,再遍历字符串 text 进行匹配查找 这里匹配查找使用 string 对象的 substr 方法进行快速定位查找,匹配成功则直接用 replace 方法进行替换即可

思路很明确,几个 API 的熟练应用也是需要掌握的

但是:这个题暴露出的注意点很多很多…

首先,text.size() - s + 1 字符串对象的 size() 方法返回值类型是 unsigned int 这就直接导致了运算结果为负数时判断条件的失效,是一个很易错的知识点 下面的写法会导致 ">" 由于 & 的替代嵌套到下一层,导致继续替代,导致结果为 >。这显然是错误的输出,一开始竞赛时好像这个测试用例是存在的。后来经过修正了。这个需要注意,而我在这采用的方法就是给 {"&","&\t"} 增加后续的标志位,再对结果进行删除即可。但是这个方法需要标志位不能与原有效数字起冲突,这个需要注意。这是一个简单的处理方法,也正是因为它的简单,导致了其并不安全。例如:采用一般的后缀标志位如:@、# 均是无法通过测试样例的。

参见代码如下:

// 执行用时 :1992 ms, 在所有 C++ 提交中击败了100.00%的用户 // 内存消耗 :16.6 MB, 在所有 C++ 提交中击败了100.00%的用户 class Solution { public: map m={{""","\""}, {"'","'"}, {">",">"}, {"<"," n) continue; // 每次替换size会变化,不能使用 n // text.size() - s + 1时无符号整数,负数会很大,使得判断失效 for (int i = 0; i < (int)(text.size() - s + 1); ++i) { if (c == text.substr(i, s)) { text = text.replace(i, s, e.second); } } } text.erase(remove(text.begin(), text.end(), '\t'), text.end()); return text; } };
作者:Y_puyu



解析器 leetcode HTML 替换 实体 字符串 字符

需要 登录 后方可回复, 如果你还没有账号请 注册新账号