javaCV文字识别之1:基于google的tesserac ocr识别图片中的文字,跨平台支持英文中文简体繁体等各种字符识别

Erin ·
更新时间:2024-11-13
· 628 次阅读

前言

本篇文章属于javacv系列的扩展篇。

在此之前我们已经通过javacv实现了流媒体这块的音视频编解码等等操作,当然还有图像处理。虽然使用opencv也可以实现文字识别,但是识别率不高,所以来试试google开源的tesserac ocr看看效果。

我们分为三步就可以做到实现:

首先,我们要添加依赖;次之,准备资源(需要训练好的语言包以及需要进行识别的图片,这里会提供最新的英文版下载以及中文简繁体下载地址);最后就开始编写代码。

废话少说,立刻开始吧。

1、添加依赖

(1)gradle方式

dependencies {

compile group: 'org.bytedeco', name: 'tesseract-platform', version: '4.1.1-1.5.3'

}

(2)maven方式


            org.bytedeco
            tesseract-platform
            4.1.1-1.5.3

(3)jar包方式

javacv的包太大,这个不用讲了,建议用上面那两个。

2、下载语言包

英文和简体中文放在同一个压缩包中,免费下载,不要积分。

(1)英文版:https://download.csdn.net/do

了解本专栏 订阅专栏 解锁全文
作者:-eguid-



google 图片 ocr 跨平台 字符

需要 登录 后方可回复, 如果你还没有账号请 注册新账号
相关文章