即刻App年轻人的同好社区
下载
App内打开
西里森森
3月前
你有没有遇到过这种情况?

老板发来一张发票照片让你录入报销系统,你只能对着屏幕一个字一个字地敲;收到一份扫描版的合同PDF,想复制里面的文字却发现根本选不中。

这些看似琐碎的小事,其实都指向同一个问题:如何把图片里的文字变成可以编辑的电子文档?

PaddleOCR就是专门解决这个问题的。

你给它任何包含文字的图片、PDF、甚至手写笔记的照片,它都能在几秒钟内把所有文字提取出来,变成你可以直接复制粘贴的文本。

GitHub🔗:github.com

它认识80多种语言的文字。
不管是中文、英文、日文,还是繁体字、手写体,甚至是那种歪歪扭扭的医生处方,它都能认出来。

准确率也非常高,基本上人眼能看清的文字,它都不会认错。

而且,它不只是把文字提取出来这么简单。

比如你给它一份包含表格的文档,它会保留表格的结构;给它一份带标题、段落的报告,它会维持原有的排版格式。

这意味着你拿到的不是一堆乱七八糟的文字,而是可以直接使用的规范文档。

即使你不是程序员,PaddleOCR也能帮到你。

市面上很多OCR软件都是基于它开发的,比如Umi-OCR这样的桌面工具。你可以用它来:
● 把纸质书籍转成电子书
● 整理家庭档案和老照片上的文字
● 快速提取网页截图里的内容
● 把手写笔记转成Word文档

最重要的是,它完全免费开源!
这意味着你不用花几百块买OCR软件,也不用担心隐私泄露(因为可以完全在自己电脑上运行)。

如果你经常需要处理文档,或者想让工作更高效,PaddleOCR绝对值得了解。

它把"从图片提取文字"这件事,从一个技术难题变成了一个简单操作,这就是技术改变生活的最好例子。
1748

来自圈子

圈子图片

JitHub程序员

389164人已经加入