TextRecognize

TextRecognize[image]

识别 image 中的文字并以字符串形式返回.

TextRecognize[image,level]

返回指定结构层的字符串列表.

TextRecognize[image,level,prop]

返回给定层的文本的 prop.

TextRecognize[video,…]

识别 video 各帧中的文字.

更多信息和选项

文字识别，也称为 OCR，是检测图像中的文字并将其转换为文本的过程. 它通常用于从扫描的书籍、文档图片等中提取文字.
TextRecognize 可用于任意灰度和多通道的图像，根据每个像素的强度值进行运算.
TextRecognize[{image₁,image₂,…}] 返回对所有 image_i 的识别.
默认情况下，对于整幅图像，识别文本以单个字符串形式返回. 识别的文本可以分成不同的层次.
在 level 中指定的结构元素包括：

	Automatic	以单个字符串的形式表示在整幅图像中找到的文本（默认）
	"Block"	每区文本的结果列表
	"Line"	每行的结果列表
	"Word"	每个单词的结果列表
	"Character"	每个字符的结果列表

TextRecognize[image,level,prop] 计算给定 level 的 prop 并以列表 {val₁,val₂,…} 的形式返回结果.
prop 的可能设置包括：

	"BoundingBox"	以 Rectangle 形式表示的文本周围的绑定框
	"Confidence"	识别出的文本的强度
	"Image"	包含识别文本的剪裁图像
	"Text"	识别的文本（默认）
	{prop₁,prop₂,…}	属性列表

可以指定以下选项：

Language	$Language	识别的语言
Masking	All	包含文本的感兴趣区域
Method	Automatic	使用的方法
RecognitionPrior	Automatic	每个标记区域内关于文本的假设

TextRecognize 接受一个 Language 选项. 默认情况下，使用 Language:>$Language. Language->{lang₁,lang₂,…} 可用于执行多种语言识别.
可以使用下列 Language 设置：
默认情况下，返回在图像中找到的文本. 使用 Masking 指定感兴趣的区域. 可能的设置包括：
All 所有图像

mask 单个感兴趣的区域

{mask₁,mask₂,…} 多个感兴趣的区域
Method 可取的设置（指定文档的类型）包括：
Automatic 自动选择方法

"Document" 适宜于扫描文档中的检测

"NaturalScene" 适宜于自然场景图像中的检测
Method 可取的设置（指定 engine）包括：

	Automatic	自动选择方法
	"EasyOCR"	适宜于扫描的文档
	"OperatingSystem"	使用操作系统（仅限于 macOS）
	"Tesseract"	适宜于扫描的文档

RecognitionPrior 假设呈现在整幅图像或每个标记区域中的文本. 可能设置包括：

	Automatic	自动结构识别（默认）
	"Column"	文本的单列
	"Line"	文本的单行
	"Word"	单个单词
	"Character"	单个字符
	"SparseText"	无特殊结构中的文本

TextRecognize 使用机器学习. 其包含的方法、训练集和偏差会在不同的 Wolfram 语言中改变并并产生不同的结果.
TextRecognize 可能下载存储在 $LocalBase 本地对象存储库，可以使用 LocalObjects[] 列出，使用 ResourceRemove 去除.

范例

打开所有单元关闭所有单元

基本范例 (2)

识别图像中的文字：

识别文本行以及对应的绑定框：

突出显示每个识别行的绑定框：

范围 (14)

基本用途 (5)

识别明亮背景上的深色文字：

黑色背景中的亮色文字：

彩色图像：

识别排成两列的文字：

图像列表的 OCR：

层次 (5)

默认识别的是整幅图像：

识别每块上图像的文本：

按行识别图像中的文本：

按英文单词识别图像中的文本：

按字符识别图像中的文本：

属性 (4)

默认情况下，以字符串形式返回识别的文本：

含有识别文本的绑定框：

识别的强度：

含有识别文本的图像：

含有每个英文单词的子图像：

获取识别出的文本和每个单词的强度：

获取每行识别文本的图像：

根据每个英文单词的识别文本的多个属性构建数据集：

选项 (11)

Language (4)

默认的识别语言是 $Language：

指定要识别的文本语言：

用实体指定语言：

识别含有多种语言的文本：

Masking (1)

默认情况下，使用 Masking->All，会识别整幅图像中的文本：

指定感兴趣区域：

使用一幅图像来指定掩模：

使用掩模指定多个感兴趣区域：

为每个感兴趣区域使用分离的掩模：

Method (3)

默认情况下，使用最合适的方法：

指定文档的类型：

指定使用的 engine：

RecognitionPrior (3)

指名图像包含单个字符：

没有 RecognitionPrior，可能返回多个字符：

没有正确的 RecognitionPrior，可能无法识别文本：

指定 RecognitionPrior：

识别排成两列的文字：

将双换行符替换为一个换行符：

应用 (7)

对识别出的文字进行频次分析：

可视化结果，突出显示出现频次较低的单词：

用 LanguageIdentify 鉴定识别出的文字的语种：

使用识别的语言，改善 OCR 的结果：

格式化识别出的文字，交互式地显示每个单词的定义：

拆分文本以将所有单词分开：

保留文本内容结构，包括空格和标点符号，以便日后重建：

编写在字典中查找单词的定义的函数：

对提取出的文本中的单词运用函数：

把文字放在一个单元里：

识别几何图中的字符：

指明包含文本的区域：

提取某些属性并在图像中突出显示：

用识别出的文字和强度突出显示每个字符：

识别文本行和其对应的绑定框：

突出显示带有文本提示的识别行的绑定框：

识别、分组并突出显示图像中所有单个单词：

合成与图像中文本相对应的音频：

读取书的封面：

属性和关系 (2)

识别扭曲的文字：

默认情况下，整幅图像被认为是感兴趣区域：

去除所有空行：

用单个换行替代多余的空行：

可能存在的问题 (8)

可能无法正确识别旋转的文本：

可能无法识别不同的颜色：

通过图像处理可能改善识别文本的质量：

无法识别小于某个尺寸的字体:

通过放大图像，可以提高识别出的文本的准确率：

在识别格式化的数字时，空格可能会导致光学字符识别 (OCR) 错误：

可能无法完全识别不同颜色的文字:

调整颜色和上采样可能有助于改善识别结果：

无法准确识别以轮廓线形式给出的文字：

对背景进行填充以改进结果：

无法准确识别被非文本内容包围的文字：

指定内容的类型可能会改善识别结果：

有些时候无法识别大图像中的小文本：

指定包含文本的区域来改善识别：

顶部

更多学习资源

技术支持

Wolfram 解决方案

Wolfram 的教育解决方案

开始

提高你的技能

与我们合作

成人教育计划

青少年教育计划

欢迎阅读

TextRecognize

更多信息和选项

范例

基本范例 (2)

范围 (14)

基本用途 (5)

层次 (5)

属性 (4)

选项 (11)

Language (4)

Masking (1)

Method (3)

RecognitionPrior (3)

应用 (7)

属性和关系 (2)

可能存在的问题 (8)

文本

CMS

APA

BibTeX

BibLaTeX

	All	所有图像
	mask	单个感兴趣的区域
	{mask₁,mask₂,…}	多个感兴趣的区域

	Automatic	自动选择方法
	"Document"	适宜于扫描文档中的检测
	"NaturalScene"	适宜于自然场景图像中的检测

TextRecognize

更多信息和选项

范例

基本范例 (2)

范围 (14)

基本用途 (5)

层次 (5)

属性 (4)

选项 (11)

Language (4)

Masking (1)

Method (3)

RecognitionPrior (3)

应用 (7)

属性和关系 (2)

可能存在的问题 (8)

参见

相关指南

相关链接

历史

文本

CMS

APA

BibTeX

BibLaTeX