不想做字库,所以想找一个ia智能一些的ocr
像现在到处都是各种各样的ocr
tesseract 带有各国语言的基础的ocr识别库
就像以前我们辅助的字库
不说那么多,就说怎么下载,怎么调用
这里我的系统环境是windows10
你也可以win7 或者 win11 我没意见
其次,就是TC7.0开发工具,就是以前的tyuyan
开源地址
https://github.com/tesseract-ocr/tesseract/wiki
下载库
https://digi.bib.uni-mannheim.de/tesseract/
一大堆,随便你喜欢32位或是64位,都可以用,版本随你喜欢,也是通用
至于语言包,你安装的时候可以勾选的,不用特意下,你想特意下载也可以
语言包
https://tesseract-ocr.github.io/tessdoc/Data-Files
下载安装都是简单的,32位安装以后就在
C:\Program Files (x86)\Tesseract-OCR
这样的路径下面
怎么用,先看一个cmd
cd C:\Program Files (x86)\Tesseract-OCR
tesseract 我的图片.png out -l eng+chi_sim
(-l eng+chi_sim 用于指定英文和中文识别包)
执行以后就在目录下出现一个out.txt的结果文档,里面是你要的识别结果
指定图片和输出路径
tesseract c:\测试\我的图片.png c:\测试\识别结果.txt -l eng+chi_sim
那想直接输出到cmd黑黑的窗口怎么弄呢?也简单,使用stdout参数
tesseract c:\测试\我的图片.png stdout -l eng+chi_sim
想cmd 直接输出以后拷贝到粘贴板怎么做呢?也简单,加个 clip
tesseract c:\测试\我的图片.png stdout -l eng+chi_sim | clip
好了,先讲到这里。
看下tc怎么调用, 先搞个tc调用cmd的正经操作一下
【新提醒】TC中执行CMD命令返回回显的内容DLL_插件专区_TC官方合作论坛 - Powered by Discuz! (52tc.info)
http://52tc.info/forum.php?mod=viewthread&tid=69229
然后看下面代码,我是怎么做的,注意看引号。
功能 执行批处理(命令文本)
变量 批处理返回值=动态库调用(获取资源路径("qs.dll"),"char *","Tcmd","char *",命令文本)
返回 批处理返回值
结束
功能 按钮1_点击()
//这里添加你要执行的代码
变量 res=cmdpipe("cmd /c " & "\"C:\\Program Files (x86)\\Tesseract-OCR\\tesseract\" c:\\ocr\\1.jpg stdout | clip")
traceprint(res)
结束