分享一下如何在 Mac 上快速使用 OCR 提取屏幕文字内容。
总体思路:利用白描 Mac 端 App 的离线模式 - 服务器模式,通过快捷指令请求白描 API 进行 OCR。
设置过程:
1. 首先安装白描 Mac 端 App,进入设置,开启离线模式,开启服务器模式,注意 IP 地址和监听端口的设置,这个需要配置在快捷指令中,如果如图 2 设置为 127.0.0.1 和 8888 则可以不做修改直接使用我的快捷指令
2. 将我制作的这个快捷指令(
www.icloud.com)添加到你的快捷指令中即可开始使用
使用方式:首先对要识别的屏幕内容进行截图,复制截图,然后运行该快捷指令即可,使用 Raycast 这类快捷启动工具还可以快速运行快捷指令,效果如图 1。
这个快捷指令的逻辑:
1. 获取剪贴板,判断剪贴板内容是否为图片,不是图片就提示「无图像」并结束
2. 如果剪贴板是图片就带上图片请求白描 API 进行 OCR,然后解析白描返回的结果
3. 最后判断结果中是否识别到文字内容,识别到了将结果拷贝到剪贴板并提示识别成功,否则提示「未发现字符」
Tips:使用该快捷指令时其实不用太关心运行提示通知,因为不管结果是识别到了内容还是没有识别到,提示通知的内容都会拷贝到剪贴板,直接粘贴就能看到。