TextRecognize
TextRecognize[image]
image 中のテキストを認識し文字列として返す.
TextRecognize[image,level]
指定された構造化レベルの文字列のリストを返す.
TextRecognize[image,level,prop]
指定されたレベルのテキストについての prop を返す.
詳細とオプション
- テキスト認識は,OCRとしても知られているもので,画像中のテキストを検出してこれをテキストに変換する過程であり,スキャンした書籍,ドキュメントの画像等からテキストを抽出するためによく使われる.
- TextRecognizeは各画素の強度に対して作用し,任意のグレースケールおよび多重チャンネルの画像に使うことができる.
- TextRecognize[{image1,image2,…}]は,imageiすべての認証を返す.
- デフォルトで,画像全体について認識されたテキストが単一の文字列として返される.認識されたテキストはいくつかのレベルに分けることができる.
- 次は,level で指定された構造化要素である.
-
Automatic 単一の文字列としての,画像全体の中で求まったテキスト(デフォルト) "Block" テキストの各ブロックごとの結果のリスト "Line" 行ごとの結果のリスト "Word" 単語ごとの結果のリスト "Character" 文字ごとの結果のリスト - TextRecognize[image,level,prop]は,指定の level で prop を計算し,結果をリスト{val1,val2,…}として返す.
- 次は,prop の可能な設定である.
-
"BoundingBox" Rectangleとしてのテキスト周囲の境界ボックス "Confidence" 認識されたテキストの強度 "Image" 認識されたテキストを含む,切り取られた画像 "Text" 認識されたテキスト(デフォルト) {prop1,prop2,…} 特性のリスト - 次はして可能なオプションである.
-
Language $Language 認識する言語 Masking All テキストを含む関心領域 Method Automatic 使用するメソッド RecognitionPrior Automatic マスクされた各エリア内のテキストについての仮定 - TextRecognizeはLanguageオプションを取る.デフォルトで,Language:>$Languageが使われる.Language->{lang1,lang2,…}を使って複数の言語を認識することができる.
- 使用可能なLanguage設定
- デフォルトで,画像の任意の場所にあるテキストが返される.Masking を使って関心領域を指定することができる.次は使用可能な設定である.
-
All 画像全体 mask 単一の関心領域 {mask1,mask2,…} 複数の関心領域 - 次は,Methodの可能な設定である.
-
Automatic メソッドの自動選択 "Document" スキャンしたドキュメント内の検出に最適化 "NaturalScene" 自然風景画像の検出に最適化 - 次は,ドキュメントタイプを指定する,Methodの可能な設定である.
-
Automatic メソッドの自動選択 "Document" スキャンしたドキュメント内の検出に最適化 "NaturalScene" 自然風景画像の検出に最適化 - 次は,エンジンを指定するMethodの可能な設定である.
-
Automatic メソッドの自動選択 "EasyOCR" スキャンしたドキュメント内の検出に最適化 "NeuralNetwork" 自然風景中のテキストに最適化されたWolframネット "Tesseract" スキャンしたドキュメントに最適化 - RecognitionPriorを使うと,画像全体あるいは各マスクされた部分に存在するテキストの種類についての仮定を行うことができる.次は使用可能な設定である.
-
Automatic 自動構造認識(デフォルト) "Column" テキストの単一の列 "Line" テキストの単一の行 "Word" 単一の単語 "Character" 単一の文字 "SparseText" 特定の構造に属さないテキスト - TextRecognizeは機械学習を使う.含まれるメソッド,訓練集合,バイアスは,Wolfram言語のバージョンによって異なることがあり,与えられる結果も異なる可能性がある.
- TextRecognizeはリソースをダウンロードすることがある.ダウンロードされたリソースは,$LocalBaseのローカルなオブジェクトストアに保存され,LocalObjects[]でリストしたりResourceRemoveで削除したりできる.
例題
すべて開くすべて閉じるスコープ (14)
レベル (5)
オプション (11)
Language (4)
Masking (1)
アプリケーション (7)
LanguageIdentifyを使って認識されたテキストの言語を特定する:
各単語の定義がインタラクティブに表示されるように,認識されたテキストをフォーマットする:
後で再構築するために,空白や句読点を含むテキストコンテンツの構造を保つ:
認識された各行の境界ボックスを,各ボックスのツールチップを使ってハイライトする:
テキスト
Wolfram Research (2010), TextRecognize, Wolfram言語関数, https://reference.wolfram.com/language/ref/TextRecognize.html (2024年に更新).
CMS
Wolfram Language. 2010. "TextRecognize." Wolfram Language & System Documentation Center. Wolfram Research. Last Modified 2024. https://reference.wolfram.com/language/ref/TextRecognize.html.
APA
Wolfram Language. (2010). TextRecognize. Wolfram Language & System Documentation Center. Retrieved from https://reference.wolfram.com/language/ref/TextRecognize.html