字体混淆
今天浏览「全国组织机构统一社会信用代码数据服务中心」(
ss.cods.org.cn)时,发现复制的企业名变成了乱码,拷问 GPT 后找到了原因——采用了字体混淆的方法来避免爬虫和复制。
一句话解释:文字是乱码,但是通过自定义的字体映射成了正常的文字,相当于写了一本与暗号一一对应的解码书。
具体方法:
1. 自定义字体创建:设计一个包含替换字形的自定义字体(例:"sfont")。
2. 字体映射:在自定义字体中,原始字符映射到不同的符号,使得文本在视觉上被“混淆”。
CSS调用:利用CSS .secretfont { font-family: "sfont",'Noto Sans SC'!important; font-size: 20px; } 应用这种字体,造成文本在屏幕上与复制时的差异。
3. 表现与复制差异:屏幕显示为正常文本(如“华为技术有限公司”),但复制粘贴时则变为混淆后的字符(如“㖄㐠㢯㧚㧎限㓯㗌”)。
注意:此技术虽能防抓取,可能影响SEO及网站可访问性。