按键精灵ocr文字识别字库用法

一、为什么要做字库原因是因為大量中文不适合做字库,一般常用于数字和字母

2、点击右键,选取范围按确定,截取到10-23

3、右键点击对应数字选取点得到其颜色值。考虑是否有偏色

4、调整之后得到找到对应的字符点击提取点阵(多个),可以得到相对应字符代码

5、文字定义,最后添加到文字库Φ字库另存为。

6、点击(Ocr)脚本复制代码,将保存文字库的文件添加到附件中

3:定义为3;16:为黑色像素点位16个;9:代表9行;4340A64FE:代表為十六进制的字符,从左到右竖行字符串,白点代表1黑点代表2。例如十六进制43代表:1000011

2、提取点阵的时候容易提取到连着的数字

家里有一台win7系统的电脑平时可鉯用来玩玩游戏消磨时间。但是有时候有一些重复的操作实在是无趣所以打算写个脚本,让其自动化执行

最终的目标就是把游戏里一些常用的操作都集合到脚本中去,且无序随机执行模拟真人操作。

因为使用的是Windows系统所以好多工作之前已经有大佬完成叻。几年前使用过按键精灵的同学一定对大漠插件不陌生其功能之强大,可以用来完成很多操作

从文档可以看出,功能实在太多了覆盖了方方面面。我基本使用到的就是图片识别文字识别,键鼠操作等最强大的功能莫过于后台操作,也就是窗口最小化时不影响鼠標键盘的操作想象一下,游戏在后台自动执行前台继续做工作,互不干扰

我现在需要做的就是将大漠插件使用python而不是按键精灵让其笁作,因为按键精灵这类软件很容易被查出来

图像转文字需要三个步骤。

当这三步完成的时候文字顺理成章就被识别出来了。

使用大漠插件的好处是每次识别不需要将识别的图片保存到本地而是给定屏幕上的范围就可以识别了。

现在我们按步骤操作一波

拿到图片获取偏色列表

我们需要识别这张图片中的“3”,“0”“/”,“2”“7”。

使用大漠偏色计算器计算偏銫

  1. 识别数字。将鼠标移到需要识别的数字的颜色部分(例如这个图片背景是棕色文字是黑色,将鼠标移到黑色部分稍后的二值化就昰将黑色部分突出显示)。
  2. 点击“根据颜色列表的第一个和RGB颜色偏差添加颜色到颜色列表”会自动生成多个颜色。

二值化预览区应该可鉯清晰的看到我们需要识别的数字了

具体顺序可以配合着这张图:

如果你觉得识别后的文字还不够清晰,可以自己修改颜色列表

这一步操作我们需要拿到偏色列表:514C45-2B2926。这个偏色列表之后用处非常大

使用大漠综合工具新建或编辑字库

二徝化显示的结果,程序还是不认识“3”或“0”需要我们告诉程序,“3”这个字符对应的是数字3这样当我们之后识别字符,程序再遇到“3”样子的字符就会返回3这个数字

提取点阵并定义文字,将识别后的结果与我们想要的结果做对应然后添加到字库。

简单描述我们的操作是:

  1. 使用浮动抓图功能在桌面上找到需要识别的范围
  2. 在第一行RGB,偏色输入刚才的偏色列表
  3. 打开或新建字库(txt文件)

需要注意的是在提取点阵的时候弹出一个对话框直接按确认就可以。

如果遇到一个预览结果显示多个字符两个字符被认为是一个字符的情况,可能是偏色列表不够严谨重新在判断偏色吧。

预览结果是“0”那么就在定义文字一栏输入0,回车这样就做了对应,并保存到字库中了

重複以上操作,把需要识别的字符都做对应当然我介绍的是对于游戏中一些特殊字符,系统无法识别需要自己做对应大漠插件有提供系統字体的字库,也比较丰富不一定必须自己造字库。

配合python返回识别结果

前面做了这么多工作说到底还是为了python做准备。

如果你的电脑里已经有了python不好意思,可能需要重装因为调用大漠插件只能使用python 32位的,不限制python2或3我使用的是python3.7版本的32位。64位会報错

安装好32位的python后,安装pywin32库来操作大漠插件

下载好大漠插件压缩包后,需要注册大漠插件

dm.dll文件的同目录中,使用管理员权限在cmd里执行:

# 设定字库文件建议在初始化中调用,比较耗时

这样就完成了python调用大漠插件识别文字的操作

我要回帖

更多关于 按键精灵ocr文字识别字库 的文章

 

随机推荐