TextRecognize

TextRecognize[image]

image 中のテキストを認識し文字列として返す.

TextRecognize[image,level]

指定された構造化レベルの文字列のリストを返す.

TextRecognize[image,level,prop]

指定されたレベルのテキストについての prop を返す.

詳細とオプション

  • テキスト認識は,OCRとしても知られているもので,画像中のテキストを検出してこれをテキストに変換する過程であり,スキャンした書籍,ドキュメントの画像等からテキストを抽出するためによく使われる.
  • TextRecognizeは各画素の強度に対して作用し,任意のグレースケールおよび多重チャンネルの画像に使うことができる.
  • TextRecognize[{image1,image2,}]は,imageiすべての認証を返す.
  • デフォルトで,画像全体について認識されたテキストが単一の文字列として返される.認識されたテキストはいくつかのレベルに分けることができる.
  • 次は,level で指定された構造化要素である.
  • Automatic 単一の文字列としての,画像全体の中で求まったテキスト(デフォルト)
    "Block"テキストの各ブロックごとの結果のリスト
    "Line"行ごとの結果のリスト
    "Word"単語ごとの結果のリスト
    "Character"文字ごとの結果のリスト
  • TextRecognize[image,level,prop]は,指定の levelprop を計算し,結果をリスト{val1,val2,}として返す.
  • 次は,prop の可能な設定である.
  • "BoundingBox"Rectangleとしてのテキスト周囲の境界ボックス
    "Confidence"認識されたテキストの強度
    "Image"認識されたテキストを含む,切り取られた画像
    "Text"認識されたテキスト(デフォルト)
    {prop1,prop2,}特性のリスト
  • 次はして可能なオプションである.
  • Language $Language認識する言語
    Masking Allテキストを含む関心領域
    Method Automatic使用するメソッド
    RecognitionPrior Automaticマスクされた各エリア内のテキストについての仮定
  • TextRecognizeLanguageオプションを取る.デフォルトで,Language:>$Languageが使われる.Language->{lang1,lang2,}を使って複数の言語を認識することができる.
  • 使用可能なLanguage設定
  • デフォルトで,画像の任意の場所にあるテキストが返される.Masking を使って関心領域を指定することができる.次は使用可能な設定である.
  • All画像全体
    mask単一の関心領域
    {mask1,mask2,}複数の関心領域
  • 次は,Methodの可能な設定である.
  • Automaticメソッドの自動選択
    "Document"スキャンしたドキュメント内の検出に最適化
    "NaturalScene"自然風景画像の検出に最適化
  • 次は,ドキュメントタイプを指定する,Methodの可能な設定である.
  • Automaticメソッドの自動選択
    "Document"スキャンしたドキュメント内の検出に最適化
    "NaturalScene"自然風景画像の検出に最適化
  • 次は,エンジンを指定するMethodの可能な設定である.
  • Automaticメソッドの自動選択
    "EasyOCR"スキャンしたドキュメント内の検出に最適化
    "NeuralNetwork"自然風景中のテキストに最適化されたWolframネット
    "Tesseract"スキャンしたドキュメントに最適化
  • RecognitionPriorを使うと,画像全体あるいは各マスクされた部分に存在するテキストの種類についての仮定を行うことができる.次は使用可能な設定である.
  • Automatic自動構造認識(デフォルト)
    "Column"テキストの単一の列
    "Line"テキストの単一の行
    "Word"単一の単語
    "Character"単一の文字
    "SparseText"特定の構造に属さないテキスト
  • TextRecognizeは機械学習を使う.含まれるメソッド,訓練集合,バイアスは,Wolfram言語のバージョンによって異なることがあり,与えられる結果も異なる可能性がある.
  • TextRecognizeはリソースをダウンロードすることがある.ダウンロードされたリソースは,$LocalBaseのローカルなオブジェクトストアに保存され,LocalObjects[]でリストしたりResourceRemoveで削除したりできる.

例題

すべて開くすべて閉じる

  (2)

画像中のテキストを認識する:

数行のテキストと対応する境界ボックスを認識する:

認識された各行の境界ボックスをハイライトする:

スコープ  (14)

基本的な用法  (5)

明るい背景上の明度の低いテキストを認識する:

暗い背景上の明度の高いテキストを認識する:

カラー画像:

2段組みのテキスト:

画像のリストのOCR:

レベル  (5)

デフォルトの認識は画像全体に対して行われる:

画像中のテキストをブロックごとに認識する:

画像中のテキストを行ごとに認識する:

画像中のテキストを単語ごとに認識する:

画像中のテキストを文字ごとに認識する:

特性  (4)

デフォルトで,認識されたテキストは文字列として返される:

認識されたテキストを含む境界ボックス:

認識の強度:

認識されたテキストを含む画像:

各単語を含む部分画像:

各単語について,認識されたテキストとその強度を得る:

認識されたテキストの画像を行ごとに得る:

単語ごとに認識されたテキストの複数の特性からデータ集合を構築する:

オプション  (11)

Language  (4)

デフォルトの認識言語は$Languageである:

認識させるテキストの言語を指定する:

言語実体を使って言語を指定する:

複数の言語を含むテキストを認識する:

Masking  (1)

デフォルトで,Masking->Allを使うと画像全体のテキストが認識される:

関心領域を指定する:

画像を使ってマスクを指定する:

複数の関心領域を指定するマスクを使う:

各関心領域に別々のマスクを使う:

Method  (3)

デフォルトで,最適のメソッドが使われる:

ドキュメントのタイプを指定する:

使用するエンジンを指定する:

RecognitionPrior  (3)

画像が単一の文字を含むと指定する:

事前確率がないと,複数の文字が返されるかもしれない:

正しい事前確率がないと,テキストは認識されないかもしれない:

事前確率を指定する:

2列にフォーマットされたテキストを認識する:

2つの新規行を1つの新規行で置き換える:

アプリケーション  (7)

認識されたテキストについて頻度分析を行う:

あまり頻度が高くない単語をハイライトして結果を可視化する:

LanguageIdentifyを使って認識されたテキストの言語を特定する:

識別された言語を使ってOCRの結果を向上させる:

各単語の定義がインタラクティブに表示されるように,認識されたテキストをフォーマットする:

すべての単語が分離されるようにテキストを分割する:

後で再構築するために,空白や句読点を含むテキストコンテンツの構造を保つ:

単語の定義を辞書で検索する関数を書く:

関数を抽出したテキスト中の単語に適用する:

テキストを1つのセルにまとめる:

幾何学的図の中の文字を認識する:

テキストと含む領域を指定する:

いくつかの特性を抽出し,画像上でハイライトする:

各文字を,認識されたテキストと強度でハイライトする:

テキストのリストと対応する境界ボックスを認識する:

認識された各行の境界ボックスを,各ボックスのツールチップを使ってハイライトする:

画像中の単一の単語を認識し,グループにまとめ,ハイライトする:

画像中のテキストに対応する音声を合成する:

本の表紙を読む:

特性と関係  (2)

ゆがんだテキストを認識する:

デフォルトで,画像全体が関心領域であるとみなされる:

新規行をすべて削除する:

複数の新規行を単一の新規行で置換する:

考えられる問題  (8)

回転されたテキストは正しく認識されないかもしれない:

色が違うテキストは認識されないことがある:

画像を処理することで,認識されたテキストの品質が向上することがある:

一定サイズより小さいフォントは認識されない:

画像を拡大すると認識されるテキストの質が向上することがある:

フォーマットされた数字を認識する際に空白によってOCRエラーが起る可能性がある:

色が違うテキストは完全には認識されないことがある:

色の調整とアップサンプリングをすると認識結果が向上するかもしれない:

アウトラインで与えられたテキストは適切に認識されない:

背景を塗り潰すと結果が向上する:

テキスト以外のコンテンツで囲まれたテキストは適切に認識されないことがある:

コンテンツタイプを指定すると認識結果が向上するかもしれない:

大きい画像中の小さいテキストは,時に認識されないことがある:

テキストが含まれる領域を指定して認識を向上させる:

Wolfram Research (2010), TextRecognize, Wolfram言語関数, https://reference.wolfram.com/language/ref/TextRecognize.html (2024年に更新).

テキスト

Wolfram Research (2010), TextRecognize, Wolfram言語関数, https://reference.wolfram.com/language/ref/TextRecognize.html (2024年に更新).

CMS

Wolfram Language. 2010. "TextRecognize." Wolfram Language & System Documentation Center. Wolfram Research. Last Modified 2024. https://reference.wolfram.com/language/ref/TextRecognize.html.

APA

Wolfram Language. (2010). TextRecognize. Wolfram Language & System Documentation Center. Retrieved from https://reference.wolfram.com/language/ref/TextRecognize.html

BibTeX

@misc{reference.wolfram_2024_textrecognize, author="Wolfram Research", title="{TextRecognize}", year="2024", howpublished="\url{https://reference.wolfram.com/language/ref/TextRecognize.html}", note=[Accessed: 21-November-2024 ]}

BibLaTeX

@online{reference.wolfram_2024_textrecognize, organization={Wolfram Research}, title={TextRecognize}, year={2024}, url={https://reference.wolfram.com/language/ref/TextRecognize.html}, note=[Accessed: 21-November-2024 ]}