tesseract ocr用于图片识别文字安装和简单使用

不想做字库,所以想找一个ia智能一些的ocr

像现在到处都是各种各样的ocr

tesseract 带有各国语言的基础的ocr识别库

就像以前我们辅助的字库

不说那么多,就说怎么下载,怎么调用

这里我的系统环境是windows10

你也可以win7 或者 win11 我没意见

其次,就是TC7.0开发工具,就是以前的tyuyan

开源地址

https://github.com/tesseract-ocr/tesseract/wiki

下载库

https://digi.bib.uni-mannheim.de/tesseract/

一大堆,随便你喜欢32位或是64位,都可以用,版本随你喜欢,也是通用

至于语言包,你安装的时候可以勾选的,不用特意下,你想特意下载也可以

语言包

https://tesseract-ocr.github.io/tessdoc/Data-Files

下载安装都是简单的,32位安装以后就在

C:\Program Files (x86)\Tesseract-OCR

这样的路径下面

怎么用,先看一个cmd

cd C:\Program Files (x86)\Tesseract-OCR

tesseract 我的图片.png out -l eng+chi_sim

(-l eng+chi_sim 用于指定英文和中文识别包)

执行以后就在目录下出现一个out.txt的结果文档,里面是你要的识别结果

指定图片和输出路径

tesseract c:\测试\我的图片.png c:\测试\识别结果.txt -l eng+chi_sim

那想直接输出到cmd黑黑的窗口怎么弄呢?也简单,使用stdout参数

tesseract c:\测试\我的图片.png stdout -l eng+chi_sim

想cmd 直接输出以后拷贝到粘贴板怎么做呢?也简单,加个 clip

tesseract c:\测试\我的图片.png stdout -l eng+chi_sim | clip

好了,先讲到这里。

看下tc怎么调用, 先搞个tc调用cmd的正经操作一下

【新提醒】TC中执行CMD命令返回回显的内容DLL_插件专区_TC官方合作论坛 - Powered by Discuz! (52tc.info)

http://52tc.info/forum.php?mod=viewthread&tid=69229

然后看下面代码,我是怎么做的,注意看引号。

功能 执行批处理(命令文本)
    变量 批处理返回值=动态库调用(获取资源路径("qs.dll"),"char *","Tcmd","char *",命令文本)
    返回 批处理返回值
结束
功能 按钮1_点击()
//这里添加你要执行的代码

变量 res=cmdpipe("cmd /c " & "\"C:\\Program Files (x86)\\Tesseract-OCR\\tesseract\" c:\\ocr\\1.jpg stdout | clip")
traceprint(res)
结束
点赞

发表评论

电子邮件地址不会被公开。必填项已用 * 标注