实现手写字体识别(90%的识别率)

Penelope ·
更新时间:2024-09-21
· 729 次阅读

步骤流程1、环境配置获取百度SDK2、具体实现步骤①获取access_token②手写字体识别③成果展示 1、环境配置

程序整体是由python实现的,环境所包含的第三方库有requests、json、base64、pyinstaller。没有这些库的同学可以win+R输入cmd进入命令行终端pip install 库名。

获取百度SDK

浏览器搜索百度云,如未注册请先注册,然后登录点击管理控制台。点击左侧产品服务→人工智能→文字识别。点击创建应用,输入应用名称如“Baidu_OCR”,选择用途如“学习办公”,最后进行简单应用描述,即可点击“立即创建”。会出现应用列表,包括AppID、API Key、Secret Key等信息,这些稍后会用到。在这里插入图片描述
在这里插入图片描述

2、具体实现步骤 ①获取access_token

这里我们用requests获取并返回access_token.方法如下:

grant_type: 必须参数,固定为client_credentials; client_id: 必须参数,应用的API Key; client_secret: 必须参数,应用的Secret Key; def get_access(): host = 'https://aip.baidubce.com/oauth/2.0/token?grant_type=client_credentials&client_id=【官网获取的AK】&client_secret=【官网获取的SK】' response = requests.get(host) if response: #dict = json.loads() dict = response.json(); #print(dict['access_token']) return dict['access_token']

``

②手写字体识别

下面我们定义了一个函数,参数为所要识别图片的绝对目录。注意:图片方向必须是正向,否则识别不出来。

def write_font(filename): ''' 手写文字识别 ''' request_url = "https://aip.baidubce.com/rest/2.0/ocr/v1/handwriting" f = open(filename, 'rb') img = base64.b64encode(f.read()) print('正在识别...') params = {"image":img} access_token = get_access() request_url = request_url + "?access_token=" + access_token headers = {'content-type': 'application/x-www-form-urlencoded'} response = requests.post(request_url, data=params, headers=headers) if response: text = response.json() content = text['words_result'] for item in content: print(item['words']) ③成果展示

这是手写体(字体马马虎虎)
在这里插入图片描述
识别效果:
在这里插入图片描述

最后附上源码:

import requests import json import base64 # client_id 为官网获取的AK, client_secret 为官网获取的SK def get_access(): host = 'https://aip.baidubce.com/oauth/2.0/token?grant_type=client_credentials&client_id=【官网获取的AK】&client_secret=【官网获取的SK】' response = requests.get(host) if response: #dict = json.loads() dict = response.json(); #print(dict['access_token']) #返回access_token return dict['access_token'] def write_font(filename): ''' 手写文字识别 ''' request_url = "https://aip.baidubce.com/rest/2.0/ocr/v1/handwriting" f = open(filename, 'rb') img = base64.b64encode(f.read()) print('正在识别...') params = {"image":img} #调用get_access函数,获取tokne access_token = get_access() request_url = request_url + "?access_token=" + access_token headers = {'content-type': 'application/x-www-form-urlencoded'} response = requests.post(request_url, data=params, headers=headers) if response: text = response.json() content = text['words_result'] for item in content: print(item['words']) if __name__ == '__main__': while True: filename= input('请输入您的图片位置(按Q退出):') if(filename == 'q' or filename == 'Q'): break write_font(filename) print('识别完成!!!') print('按Q退出!')
作者:A三三



手写字体 字体

需要 登录 后方可回复, 如果你还没有账号请 注册新账号