TextContents
テキストのコンテンツタイプのリスト »TextContents[text]
text 中に見付かった,実体,日付,数量,その他の,内容に関連した要素についての情報のデータ集合を与える.
TextContents[text,form]
タイプ form の例を検索する.
TextContents[text,{form1,form2,…}]
タイプ form1, form2, …の例を検索する.
TextContents[text,forms,props]
生成されたデータ集合内の各オブジェクトの特性 props を含む.
詳細とオプション
- TextContents[text,…]の text は,文字列,File[…]で表されるテキストファイル,ContentObject式,あるいはこれらのテキストオブジェクトのリストでよい.
- TextContents[{text1,text2,…},…]は,各 textiの例を与える.
- 識別タイプ form には以下がある.
-
"type" 任意のテキストのコンテンツタイプ(例:"Noun","City") Entity[…,…] テキストのコンテンツタイプの特定の実体 form1form2… - 任意の formiにマッチするフォーム
Containing[outer,inner] タイプ inner を含むタイプ outer のフォーム Verbatim["string"] 厳密にマッチされる特定の文字列 pattern マッチされる文字列パターン Automatic 実体,日付,数量,およびその他のコンテンツに関連した要素 - 次は,特性 props の可能な選択肢である.
-
"String" 識別されたテキスト文字列(デフォルト) "Position" text 中の文字列の始点と終点の位置 "Probability" 識別が正しいという推定の確率 "Type" コンテンツタイプ(実体タイプ等) "Interpretation" 識別された文字列の標準的な解釈 "Snippet" 識別された文字列前後のテキストの断片 "HighlightedSnippet" 識別された文字列がハイライトされた,テキストの断片 All 上記の全特性 {prop1,prop2,…} 特性指定のリスト - 次は,使用可能なオプションである.
-
AcceptanceThreshold Automatic 識別を許容する最低確率 TargetDevice "CPU" 実体検出にCPUまたはGPUの計算を使うべきかどうか VerifyInterpretation False 解釈可能性をチェックするべきかどうか
例題
すべて開くすべて閉じるオプション (2)
AcceptanceThreshold (1)
デフォルトで,検出された実体の推定確率は,すべて0.5より上である:
AcceptanceThresholdを高くして,ほぼ確実に正しい実体だけを得る:
VerifyInterpretation (1)
デフォルトで,実体の中には,正しくないあるいはまだ知識ベースに収録されていないという理由で解釈できないものがある:
VerifyInterpretationを使って解釈できない実体を除外する:
特性と関係 (1)
TextContentsはTextPositionやTextCasesと同じタイプを扱い,指定されたタイプについて,常にこれらの関数と同じ部分文字列を識別する:
TextCasesを使ってTextContentsの出力に似たデータ集合を得ることができる:
テキスト
Wolfram Research (2019), TextContents, Wolfram言語関数, https://reference.wolfram.com/language/ref/TextContents.html.
CMS
Wolfram Language. 2019. "TextContents." Wolfram Language & System Documentation Center. Wolfram Research. https://reference.wolfram.com/language/ref/TextContents.html.
APA
Wolfram Language. (2019). TextContents. Wolfram Language & System Documentation Center. Retrieved from https://reference.wolfram.com/language/ref/TextContents.html