2024年网站建设敏感词过滤 篇1
这还真不是很简单的事情,首先你要有敏感词汇表,如果你的词不多的情况下可以正则匹配用户输入的话,但是一般这个敏感词会很多,这个时候需要高性能的字符匹配算法,比如kmp,或者借助字典树结构。
还有一些情况用户会在敏感词中间夹杂无效字符来蒙混过关,这个时候你有需要无效字符表。
综上,其实最难的部分就是敏感词汇表和无效字符表,如果人为的维护工作量是在太大了,可以使用机器学习,让其帮助完善两个词汇表。
这还真不是很简单的事情,首先你要有敏感词汇表,如果你的词不多的情况下可以正则匹配用户输入的话,但是一般这个敏感词会很多,这个时候需要高性能的字符匹配算法,比如kmp,或者借助字典树结构。
还有一些情况用户会在敏感词中间夹杂无效字符来蒙混过关,这个时候你有需要无效字符表。
综上,其实最难的部分就是敏感词汇表和无效字符表,如果人为的维护工作量是在太大了,可以使用机器学习,让其帮助完善两个词汇表。
下一篇:天水关键词seo(汇总)6篇