Hello 大家好,我是俊哥。一个专注分享的小博主,
每天给大家分享各种工具,超好用的资源、偶尔还会有福利频道,免费分享,大家的关注就是对我最大的支持!
朋友们!有没有觉得文字识别超有用的?我最近发现了一个超厉害的 OCR 工具——Umi-OCR,真的是太棒了!而且它还能离线用,完全不用担心网络问题。
简介
下面是项目在Github上的官方介绍。
它其实是基于 PaddleOCR 开发的,功能特别丰富,比如截图识别、批量导入识别,还有个性化识别,简直不要太方便!整个项目都是用 Python 写的,不过有个小提醒,用 Win7 的小伙伴可能没办法用,建议用 Win10 x64 及以上版本,这样体验更好。
体验
直接在 releases 里找到合适的版本,下载解压就行。界面也很简洁,上手超快。
下面就是工具的界面。
接下来给大家看看它的几个亮点功能。
截图识别
首先是截图识别,这个功能特别适合用在那些文字不能复制的网页上。速度超快,准确率也很高。你可以一次性截取所有图片,然后直接从记录板里复制所有文字,不用一张张截取和复制,简直太省事儿了!
批量识别
要是你手头有一堆图片需要识别,这个功能就能派上大用场。把图片全导入进去,点一下“开始任务”,就能批量搞定。识别完的内容会保存在 txt 文档里。
不过,如果你想要 md 或 jsonl 格式,它也能轻松搞定,完全没问题。
最让我觉得厉害的是自定义识别内容。这是 Umi-OCR 的一个超大亮点,你可以指定要识别的区域,或者把不需要识别的地方屏蔽掉。比如我有几张发票图片,只想提取发票号码,
那我就在设置里打开“忽略区域编辑器”,把不需要的内容框起来,
然后开始任务就行啦。
好了,今天就分享到这里就了,如果喜欢就点赞收藏起来吧!说不定哪天就能用得上!