FindImageText

FindImageText[image]

image 中のテキストを検出し,境界ボックスを1つ返す.

FindImageText[image,level]

指定された構造レベルにおける境界ボックスのリストを返す.

FindImageText[image,level,prop]

指定されたレベルのテキストの prop を返す.

詳細とオプション

  • FindImageTextを使ってテキストを含む画像の部分を検出する.特定の構造レベルを要求すると,それぞれがParallelogramとして与えられる境界ボックスのリストが返される.
  • 座標{x,y}は標準的な画像座標系であると仮定される.
  • TextRecognizeを使って検出されたテキストの内容を認識する.
  • 次は,level の可能な設定である.
  • Automatic 画像全体の中で見付かったテキストを単一の結果として(デフォルト)
    "Block"テキストの各ブロックについての結果のリスト
    "Line"各行についての結果のリスト
    "Word"各単語についての結果のリスト
    "Character"各文字についての結果のリスト
  • 次は prop の可能な設定である.
  • "AlignedImage"検出された各テキストを含む切り取られ整列された画像
    "BoundingBox"検出された各テキストの周りのRectangleとしての境界ボックス
    "BoundingBoxArea"各テキストの周りの境界ボックスの面積
    "Confidence"認識されたテキストの強度
    "DeskewAngle"検出されたテキストの歪み調整角度
    "Image"検出されたテキストを含む切取り画像
    "OrientedBoundingBox"検出された各テキストの周りの平行四辺形(デフォルト)
    "RegionCentroid"テキストの周りの境界ボックスの重心
    {prop1,prop2,}特性のリスト
  • 次は,使用可能なオプションである.
  • AcceptanceThreshold Automatic検出の受容閾値
    MaxFeatures All返すテキストボックスの数
    MaxOverlapFraction Automatic許容される最大のオーバーラップ
    Method Automatic使用するメソッド
    PaddingSize 0各検出項目の周りの充填量
  • 次は,Methodの可能な設定である.
  • Automaticメソッドの自動選択
    "Document"スキャンされたドキュメントからの検出に最適化
    "NaturalScene"自然の場面における画像からの検出に最適化
    detector使用するテキスト検出法
  • 次は,detector の可能な設定である.
  • "DBNet"微分可能な二値化ネット
    "Tesseract"Tesseractエンジン
  • FindImageTextは機械学習を使う.含まれるメソッド,訓練集合,バイアスは,Wolfram言語のバージョンによって異なることがあり,与えられる結果も異なる可能性がある.
  • FindImageTextはリソースをダウンロードすることがある.ダウンロードされたリソースは,$LocalBaseのローカルなオブジェクトストアに保存され,LocalObjects[]でリストしたりResourceRemoveで削除したりできる.

例題

すべて開くすべて閉じる

  (2)

画像中のテキストを検出する:

検出された単語を含む画像を切り取る:

スコープ  (8)

基本的な用法  (2)

画像中のテキストを求める:

画像中の検出されたテキストをハイライトする:

レベル  (1)

画像中のテキスト内容を検出する:

テキストブロックを検出する:

テキスト行を検出する:

単一の単語を検出する:

単一の文字を検出する:

特性  (5)

デフォルトで,検出されたすべてのものについて方向のある境界ボックスが返される:

標準的な軸と平行の境界ボックスを返す:

検出された各単語を含む画像の部分を抽出する:

切り取ったものを画像の枠と揃える:

検出された各単語の境界ボックスの面積を検出する:

各単語の領域の重心:

複数の特性を一度に計算して返す:

オプション  (7)

AcceptanceThreshold  (1)

デフォルトで,受容閾値0.5が使われる:

受容閾値を下げるとより多くのテキストが検出されるかもしれない:

MaxFeatures  (1)

デフォルトで,検出されたすべてのテキストが返される:

MaxFeatures30を使って検出強度が高いものから30個だけを返すようにする:

MaxOverlapFraction  (1)

デフォルトで,若干重なり合うボックスが返される:

カスタムの最大の重なりを指定する:

重なり合わないボックスだけを返す:

Method  (3)

デフォルトで,FindImageTextは画像により適した検出メソッドを選択しようとする:

カスタムメソッドを指定する:

不適切なメソッドを使うとよい結果が得られないかもしれない:

Method"NaturalScene"を使って自然な場面に存在するテキストを検出する:

スキャンされたドキュメントに対してMethod"Document"を使う:

PaddingSize  (1)

PaddingSizes を使って検出された単語の境界ボックスの充填を指定する:

2つの境界ボックス軸に沿って異なる充填サイズを使う:

相対的な充填サイズを使う:

負の充填を使ってより狭い境界ボックスを返す:

アプリケーション  (1)

テキスト以外のコンテンツがたくさん含まれた画像に対して光学文字認識(OCR)を行うのは難しいかもしれない:

まずFindImageTextを使って画像を前処理する:

切り取られた画像に対してOCRを行うとよりよい結果が得られる:

特性と関係  (3)

FindImageTextは方向に関係なくテキストを検出する:

FindImageTextを使って画像中のテキストコンテンツを検出する:

TextRecognizeを使って画像のコンテンツにOCRを行う:

FindImageTextを使って画像中のナンバープレートを検出する:

TextRecognizeを使ってナンバープレートを認識し,もとの画像中でハイライトする:

考えられる問題  (4)

検出は手書きのテキストには最適化されない:

テキストの向きによって検出される境界ボックスが画像の境界を越えることがある:

テキストの向きが複数の画像では検出に失敗するかもしれない:

向きによってはテキストが検出されないことがある:

Wolfram Research (2020), FindImageText, Wolfram言語関数, https://reference.wolfram.com/language/ref/FindImageText.html (2024年に更新).

テキスト

Wolfram Research (2020), FindImageText, Wolfram言語関数, https://reference.wolfram.com/language/ref/FindImageText.html (2024年に更新).

CMS

Wolfram Language. 2020. "FindImageText." Wolfram Language & System Documentation Center. Wolfram Research. Last Modified 2024. https://reference.wolfram.com/language/ref/FindImageText.html.

APA

Wolfram Language. (2020). FindImageText. Wolfram Language & System Documentation Center. Retrieved from https://reference.wolfram.com/language/ref/FindImageText.html

BibTeX

@misc{reference.wolfram_2024_findimagetext, author="Wolfram Research", title="{FindImageText}", year="2024", howpublished="\url{https://reference.wolfram.com/language/ref/FindImageText.html}", note=[Accessed: 21-November-2024 ]}

BibLaTeX

@online{reference.wolfram_2024_findimagetext, organization={Wolfram Research}, title={FindImageText}, year={2024}, url={https://reference.wolfram.com/language/ref/FindImageText.html}, note=[Accessed: 21-November-2024 ]}