一款免费的 扫描识字 Web App, 可离线使用,也许是一种 新的App物种

将图片中的文字识别出来(OCR)的软件有很多, 我们之前介绍过一些。不少是App初级使用免费,但大量使用需要收费的。

不少大公司也提供了 文字OCR 的云服务, 按照接口调用收费,例如:每万次多少钱。

再进一步,我们可以理解成,一些 OCR App 其实是 云服务的 批发零售商, App 作者向大公司的 OCR 云服务付费,然后拆分后卖给App用户。

但今天要介绍的这款 OCR App 不太一样,它是一款 WebApp,浏览器打开可使用。但是,代码却在用户本地运行,它自称不上传用户图片数据,也不依赖大公司 OCR 云服务。

这款 App 构造了一种新的 App物种, Web的分发形式,本地软件的实质,的确比较少见。

这款 App 名为,PearOCR,我们先看看功能如何。

PearOCR 登场

打开 PearOCR Web App(网站)后立刻可以看到 「图片区」 和「结果区」 两个部分。

我们无需注册账号,就可以立刻开始加入图片进行扫描识别。

加入图片时,可以通过 选择本地图片文件 或者 读取剪贴板图片 两种方式。我们 逐张加入的图片会形成一个序列,供以后选择反复逐张查看。

加入图片后,App 会自动进行识别,识别的结果会按照三种形式呈现

  • 纯文本
  • 文本和图片分布
  • 文本和置信度表格

纯文本就不多介绍了,直接可复制编辑使用。

文本和图片分布,是告诉我们识别出的文本在图片中出现的位置,便于比对。这点还是比较实用的

而「置信度表格」,则比较专业,是告诉专业用户,文字识别的精确程度(概率上),其实我也觉得除了学术研究AI以外,大家不太关心置信度 ,毕竟 文字要是正确,直接拿去使用,不正确的话自己会手工编辑校对。

我们在识别前可以进行「预设置」。例如:预设语种,目前只有常见的,简中、繁中、英语几种;不过即使选择中文,也是可以较好识别 中英文混排的。 又如:可以对预设的 「置信度阈值」进行调节,但可能这点比较专业,更像是调试开关。

关于识别的准确度, 火箭君觉得就一个本地运行的 App 来说,还是挺高的。 对于印刷体和大段文本的效果总体令人满意,但图文混排的时候会有些偏差,会将部分图标识别为文字,但这也是多数OCR软件都会遇到的问题。 一般OCR完成90%的工作,多少都需要人工干预进行校对。

最后

火箭君和App作者联系过,他表示目前并无收费的商业计划,由于是本地运行,短期也没有太大的网站服务负担,作者还是希望先将App做好。

我个人挺欣赏这类「小而美」的App,尤其是 PWA 离线运行这点, 比起动辄要求大家注册后连接云服务的软件,PearOCR 要良心很多。 有需要的小伙伴们,欢迎前去一试。(注:保险起见,个人隐私或敏感的资料,还是暂时建议不要尝试)

PearOCR 官网地址

https://pearocr.com/