SpeechRecognize
SpeechRecognize[audio]
audio 中の音声を認識し,これを文字列として返す.
SpeechRecognize[audio,level]
指定された構造レベルの文字列のリストを返す.
SpeechRecognize[audio,level,prop]
指定されたレベルにおけるテキストの prop を返す.
詳細とオプション
- 音声認識は,発せられた音声信号をテキストに変換することを目指している.これは音声読上げとしても知られるもので,音声機能を有効にした人間と機械のインタラクションやデジタルのパーソナルアシスタントによく使われる.
- SpeechRecognize[audio]は,audio 中の認識したすべての音声を単一の文字列として返す.
- 次は,level で指定される構造化要素である.
-
Automatic 音声信号全体で見付かった音声(デフォルト) "Segment" 文字起こしの断片のリスト "Sentence" 文のリスト "Word" 単語のリスト - 特性 prop は,以下のいずれでもよい.
-
"Audio" 認識されたテキストを含む切り取られた音声 "Confidence" 認識されたテキストの強さ "Interval" テキストを含んでいる区間 "SubtitleRules" 時間区間とテキストのリスト "Text" 認識されたテキスト(デフォルト) {prop1,prop2,…} 特性のリスト - 次は,使用可能なオプションである.
-
Language Automatic 認識する言語 Masking All 関心区間 Method Automatic 使用するメソッド PerformanceGoal $PerformanceGoal 最適化しようとするパフォーマンスの局面 ProgressReporting $ProgressReporting 計算の進捗状況を報告するかどうか TargetDevice "CPU" 認識を実行するデバイス - Languagelang1lang2を使って言語 lang1であると仮定される音声を認識し,言語 lang2に翻訳されたテキストを返す.
- デフォルトで,信号全体の音声が認識される.Masking->{int1,int2,…}を使って認識を区間 intiに限定する.
- 次は,Methodの可能な設定である.
-
Automatic 自動メソッド "GoogleSpeech" Google speech-to-textを使う "NeuralNetwork" 組込みのニューラルネットワークを使う "OpenAI" OpenAI speech-to-textを使う - デフォルトで,メソッドが(拍手等の)言語以外のトークンを返すと,それが結果に含まれる.Method{method,"NonSpeechReplacement"replacements}を使って代替物での置換を指定する."NonSpeechReplacement"""とすると言語以外のものが削除される.
- SpeechRecognizeは,英語の以外にも,中国語,オランダ語,フランス語,日本語,スペイン語等のさまざまな言語に使うことができる.
- SpeechRecognizeは機械学習を使う.含まれるメソッド,訓練集合,バイアスはWolfram言語のバージョンによって異なることが考えられる.そのため,与えられる結果も異なることがある.
- SpeechRecognizeはリソースをダウンロードすることがある.ダウンロードされたリソースは,$LocalBaseのローカルなオブジェクトストアに保存され,LocalObjects[]でリストしたりResourceRemoveで削除したりできる.
例題
すべて開くすべて閉じるスコープ (4)
オプション (3)
Masking (1)
Maskingオプションを使って信号の一部を認識する:
アプリケーション (4)
AudioIntervalsを使って信号中の認識する部分を選択する:
Wolfram Research (2019), SpeechRecognize, Wolfram言語関数, https://reference.wolfram.com/language/ref/SpeechRecognize.html (2024年に更新).
テキスト
Wolfram Research (2019), SpeechRecognize, Wolfram言語関数, https://reference.wolfram.com/language/ref/SpeechRecognize.html (2024年に更新).
CMS
Wolfram Language. 2019. "SpeechRecognize." Wolfram Language & System Documentation Center. Wolfram Research. Last Modified 2024. https://reference.wolfram.com/language/ref/SpeechRecognize.html.
APA
Wolfram Language. (2019). SpeechRecognize. Wolfram Language & System Documentation Center. Retrieved from https://reference.wolfram.com/language/ref/SpeechRecognize.html