PDF 和 Office 文档为什么会有可能是危险的?
因为在打开它们的时候,会自动从远程服务器加载图像,这里有可能包含 JS 或宏的恶意代码,从而利用打开文档程序的漏洞进行攻击。
今天 HelloGitHub 带来的是一个将不可信文档转化为安全 PDF 的工具:Dangerzone
这是一个确保文档安全的开源项目,它可以将存在潜在危险(来路不明、电子邮件附件)的 PDF 文件、办公文档或图片,在隔离的沙盒环境中进行转换,生成安全的 PDF 文件。
项目详情:
hellogithub.com工作原理:Dangerzone 使用两个隔离沙盒里(禁网的 Docker 容器)处理文件,第一个容器使用 LibreOffice 或 GraphicsMagick 将原始文档转化成 PDF,然后将 PDF 拆分成单独的页面,并转换成 PNG,然后将 PNG 转换成 RGB 像素数据。接着关闭第一个容器,进入第二个容器。通过 GraphicsMagick 或 Tesseract,将 RGB 像素数据或 PNG 转换成 PDF,数据通过数据 volume 传递。如此一来,打开文件的工作是在容器里完成,图片通过像素数据生成。所以,输出的 PDF 文件就是安全文件了,唯一的安全隐患就是无法防范利用 LibreOffice 或 Docker 漏洞的恶意文件。