TextRecognize

TextRecognize[image]

识别 image 中的文字并以字符串形式返回.

TextRecognize[image,level]

返回指定结构层的字符串列表.

TextRecognize[image,level,prop]

返回给定层的文本的 prop.

更多信息和选项

  • 文字识别,也称为 OCR,是检测图像中的文字并将其转换为文本的过程. 它通常用于从扫描的书籍、文档图片等中提取文字.
  • TextRecognize 可用于任意灰度和多通道的图像,根据每个像素的强度值进行运算.
  • TextRecognize[{image1,image2,}] 返回对所有 imagei 的识别.
  • 默认情况下,对于整幅图像,识别文本以单个字符串形式返回. 识别的文本可以分成不同的层次.
  • level 中指定的结构元素包括:
  • Automatic 以单个字符串的形式表示在整幅图像中找到的文本(默认)
    "Block"每区文本的结果列表
    "Line"每行的结果列表
    "Word"每个单词的结果列表
    "Character"每个字符的结果列表
  • TextRecognize[image,level,prop] 计算给定 levelprop 并以列表 {val1,val2,} 的形式返回结果.
  • prop 的可能设置包括:
  • "BoundingBox"Rectangle 形式表示的文本周围的绑定框
    "Confidence"识别出的文本的强度
    "Image"包含识别文本的剪裁图像
    "Text"识别的文本(默认)
    {prop1,prop2,}属性列表
  • 可以指定以下选项:
  • Language $Language识别的语言
    Masking All包含文本的感兴趣区域
    Method Automatic使用的方法
    RecognitionPrior Automatic每个标记区域内关于文本的假设
  • TextRecognize 接受一个 Language 选项. 默认情况下,使用 Language:>$Language. Language->{lang1,lang2,} 可用于执行多种语言识别.
  • 可以使用下列 Language 设置:
  • 默认情况下,返回在图像中找到的文本. 使用 Masking 指定感兴趣的区域. 可能的设置包括:
  • All所有图像
    mask单个感兴趣的区域
    {mask1,mask2,}多个感兴趣的区域
  • Method 的可用设置包括:
  • Automatic自动选择方法
    "Document"针对扫描文档中的检测进行了优化
    "NaturalScene"针对自然场景图像中的检测进行了优化
  • Method 可取的设置(指定文档的类型)包括:
  • Automatic自动选择方法
    "Document"适宜于扫描文档中的检测
    "NaturalScene"适宜于自然场景图像中的检测
  • Method 可取的设置(指定 engine)包括:
  • Automatic自动选择方法
    "EasyOCR"适宜于扫描的文档
    "NeuralNetwork"Wolfram 网络,适宜于自然场景中的文字
    "Tesseract"适宜于扫描的文档
  • RecognitionPrior 假设呈现在整幅图像或每个标记区域中的文本. 可能设置包括:
  • Automatic自动结构识别(默认)
    "Column"文本的单列
    "Line"文本的单行
    "Word"单个单词
    "Character"单个字符
    "SparseText"无特殊结构中的文本
  • TextRecognize 使用机器学习. 其包含的方法、训练集和偏差会在不同的 Wolfram 语言中改变并并产生不同的结果.
  • TextRecognize 可能下载存储在 $LocalBase 本地对象存储库,可以使用 LocalObjects[] 列出,使用 ResourceRemove 去除.

范例

打开所有单元关闭所有单元

基本范例  (2)

识别图像中的文字:

识别文本行以及对应的绑定框:

突出显示每个识别行的绑定框:

范围  (14)

基本用途  (5)

识别明亮背景上的深色文字:

黑色背景中的亮色文字:

彩色图像:

识别排成两列的文字:

图像列表的 OCR:

层次  (5)

默认识别的是整幅图像:

识别每块上图像的文本:

按行识别图像中的文本:

按英文单词识别图像中的文本:

按字符识别图像中的文本:

属性  (4)

默认情况下,以字符串形式返回识别的文本:

含有识别文本的绑定框:

识别的强度:

含有识别文本的图像:

含有每个英文单词的子图像:

获取识别出的文本和每个单词的强度:

获取每行识别文本的图像:

根据每个英文单词的识别文本的多个属性构建数据集:

选项  (11)

Language  (4)

默认的识别语言是 $Language

指定要识别的文本语言:

用实体指定语言:

识别含有多种语言的文本:

Masking  (1)

默认情况下,使用 Masking->All,会识别整幅图像中的文本:

指定感兴趣区域:

使用一幅图像来指定掩模:

使用掩模指定多个感兴趣区域:

为每个感兴趣区域使用分离的掩模:

Method  (3)

默认情况下,使用最合适的方法:

指定文档的类型:

指定使用的 engine:

RecognitionPrior  (3)

指名图像包含单个字符:

没有 RecognitionPrior,可能返回多个字符:

没有正确的 RecognitionPrior,可能无法识别文本:

指定 RecognitionPrior:

识别排成两列的文字:

将双换行符替换为一个换行符:

应用  (7)

对识别出的文字进行频次分析:

可视化结果,突出显示出现频次较低的单词:

LanguageIdentify 鉴定识别出的文字的语种:

使用识别的语言,改善 OCR 的结果:

格式化识别出的文字,交互式地显示每个单词的定义:

拆分文本以将所有单词分开:

保留文本内容结构,包括空格和标点符号,以便日后重建:

编写在字典中查找单词的定义的函数:

对提取出的文本中的单词运用函数:

把文字放在一个单元里:

识别几何图中的字符:

指明包含文本的区域:

提取某些属性并在图像中突出显示:

用识别出的文字和强度突出显示每个字符:

识别文本行和其对应的绑定框:

突出显示带有文本提示的识别行的绑定框:

识别、分组并突出显示图像中所有单个单词:

合成与图像中文本相对应的音频:

读取书的封面:

属性和关系  (2)

识别扭曲的文字:

默认情况下,整幅图像被认为是感兴趣区域:

去除所有空行:

用单个换行替代多余的空行:

可能存在的问题  (8)

可能无法正确识别旋转的文本:

可能无法识别不同的颜色:

通过图像处理可能改善识别文本的质量:

无法识别小于某个尺寸的字体:

通过放大图像,可以提高识别出的文本的准确率:

在识别格式化的数字时,空格可能会导致光学字符识别 (OCR) 错误:

可能无法完全识别不同颜色的文字:

调整颜色和上采样可能有助于改善识别结果:

无法准确识别以轮廓线形式给出的文字:

对背景进行填充以改进结果:

无法准确识别被非文本内容包围的文字:

指定内容的类型可能会改善识别结果:

有些时候无法识别大图像中的小文本:

指定包含文本的区域来改善识别:

Wolfram Research (2010),TextRecognize,Wolfram 语言函数,https://reference.wolfram.com/language/ref/TextRecognize.html (更新于 2024 年).

文本

Wolfram Research (2010),TextRecognize,Wolfram 语言函数,https://reference.wolfram.com/language/ref/TextRecognize.html (更新于 2024 年).

CMS

Wolfram 语言. 2010. "TextRecognize." Wolfram 语言与系统参考资料中心. Wolfram Research. 最新版本 2024. https://reference.wolfram.com/language/ref/TextRecognize.html.

APA

Wolfram 语言. (2010). TextRecognize. Wolfram 语言与系统参考资料中心. 追溯自 https://reference.wolfram.com/language/ref/TextRecognize.html 年

BibTeX

@misc{reference.wolfram_2024_textrecognize, author="Wolfram Research", title="{TextRecognize}", year="2024", howpublished="\url{https://reference.wolfram.com/language/ref/TextRecognize.html}", note=[Accessed: 24-November-2024 ]}

BibLaTeX

@online{reference.wolfram_2024_textrecognize, organization={Wolfram Research}, title={TextRecognize}, year={2024}, url={https://reference.wolfram.com/language/ref/TextRecognize.html}, note=[Accessed: 24-November-2024 ]}