网站推广.NET

网站推广.NET

天若ocr怎么用?分享ocr自动识别技巧

来源:互联网

现在网上很多信息都是通过图片或者PDF文件的格式进行发布的,这样要想获取文件中的文字信息只能使用 OCR 技术才行。但是常见的 OCR 软件都需要联网才可以使用,这样在不方便联网或者根本没有网络的环境下使用就很困难。而现在利用“天若 OCR 开源版本的本地版”这款工具,就可以非常方便的解决这个问题。

我们首先通过浏览器打开“天若 OCR 开源版本的本地版”的主页(
https://gitee.com/wanglifree/tianruoocr-cl),点击主页下方“下载地址”中的链接,就可以下载到该工具的最新压缩包。下载完成后对压缩包进行解压,然后运行文件夹中的“天若 OCR 文字识别.exe”文件进行启动。当工具启动成功以后,会自动隐藏到系统托盘当中。

由于这一款工具是专门针对中国用户开发的,因此不需要进行相关的设置就可以操作。现在按下键盘中的 F4 键,或者利用鼠标直接在系统托盘中的工具图标上进行双击,这时鼠标指针就会由箭头变成一个手掌的形状。接下来利用鼠标拖拽的方式框选要进行识别的区域,框选完成以后它就会自动对所选区域进行识别,识别成功的信息就会自动显示到工具窗口里面。“天若 OCR 文字识别工具”除了可以进行文字识别以外,识别出的文字信息还可以快速进行编辑、拆分、合并、翻译等常见文字的编辑操作。

“天若 OCR 开源版本的本地版”这款工具,默认使用的是 Chinese-lite 和 paddle-ocr 进行识别,这样不需要联网就可以使用。但是该工具也集成了百度识别和百度翻译的 API 接口,不过要想使用的话首先需要在系统托盘的工具图标上点击鼠标右键,接着在弹出的菜单中选择“设置”命令。然后在弹出的设置窗口中选择“密钥”标签,再根据提示分别输入百度识别接口的帐号和密码信息。设置完成后在工具窗口中点击鼠标右键,在弹出的菜单中选择“接口”中的“百度” ,再选择其中的“中英”选项,这样就可以利用百度的识别接口进行识别操作。