tesseract ocr用于图片识别文字安装和简单使用

2021年11月15日 0条评论 8次阅读 0人点赞 venski

不想做字库，所以想找一个ia智能一些的ocr

像现在到处都是各种各样的ocr

tesseract 带有各国语言的基础的ocr识别库

就像以前我们辅助的字库

不说那么多，就说怎么下载，怎么调用

这里我的系统环境是windows10

你也可以win7 或者 win11 我没意见

其次，就是TC7.0开发工具，就是以前的tyuyan

开源地址

https://github.com/tesseract-ocr/tesseract/wiki

下载库

https://digi.bib.uni-mannheim.de/tesseract/

一大堆，随便你喜欢32位或是64位，都可以用，版本随你喜欢，也是通用

至于语言包，你安装的时候可以勾选的，不用特意下，你想特意下载也可以

语言包

https://tesseract-ocr.github.io/tessdoc/Data-Files

下载安装都是简单的，32位安装以后就在

C:\Program Files (x86)\Tesseract-OCR

这样的路径下面

怎么用，先看一个cmd

cd C:\Program Files (x86)\Tesseract-OCR

tesseract 我的图片.png out -l eng+chi_sim

（-l eng+chi_sim 用于指定英文和中文识别包）

执行以后就在目录下出现一个out.txt的结果文档，里面是你要的识别结果

指定图片和输出路径

tesseract c:\测试\我的图片.png c:\测试\识别结果.txt -l eng+chi_sim

那想直接输出到cmd黑黑的窗口怎么弄呢？也简单,使用stdout参数

tesseract c:\测试\我的图片.png stdout -l eng+chi_sim

想cmd 直接输出以后拷贝到粘贴板怎么做呢？也简单，加个 clip

tesseract c:\测试\我的图片.png stdout -l eng+chi_sim | clip

好了，先讲到这里。

看下tc怎么调用, 先搞个tc调用cmd的正经操作一下

【新提醒】TC中执行CMD命令返回回显的内容DLL_插件专区_TC官方合作论坛 - Powered by Discuz! (52tc.info)

http://52tc.info/forum.php?mod=viewthread&tid=69229

然后看下面代码，我是怎么做的，注意看引号。

功能 执行批处理(命令文本)
    变量 批处理返回值=动态库调用(获取资源路径("qs.dll"),"char *","Tcmd","char *",命令文本)
    返回 批处理返回值
结束
功能 按钮1_点击()
//这里添加你要执行的代码

变量 res=cmdpipe("cmd /c " & "\"C:\\Program Files (x86)\\Tesseract-OCR\\tesseract\" c:\\ocr\\1.jpg stdout | clip")
traceprint(res)
结束

纯技术笔记

tesseract ocr用于图片识别文字安装和简单使用

发表评论取消回复

纯技术笔记

发表评论 取消回复

发表评论取消回复