SpeechInterpreter[form]

音声入力に適用してその音声を指定の形式のオブジェクトとして解釈しようとするインタープリタオブジェクトを表す.

SpeechInterpreter[form,test]

test をオブジェクトに適用した結果がTrueだった場合にのみ,解釈したオブジェクトを返す.その他の場合はFailureオブジェクトを返す.

SpeechInterpreter[form,test,fail]

テストが失敗した場合は,関数を適用した結果として fail が返される.

詳細とオプション

  • SpeechInterpreter[][audio]は,特定の音声録音にインタープリタを適用する.
  • 次は,使用可能な form 指定である.
  • "SemanticExpression"自由形式入力から意味的に派生した式
    "SemanticNumber"意味的に派生した数(例:"half")
    "SemanticInteger"意味的に派生した整数(例:"six")
    "Boolean"ブール値(True/Falseを与える,true/false,1/0等)
    "String"純粋文字列
    "TextArea"任意長のテキスト(テキスト領域としての形式で描画される)
    "TextLine"1行のテキスト
    "SemanticURL"意味的に派生したURL(例:会社名から)
    "Date"任意の標準形式の日付
    "StructuredDate"ピッカーから取得した日付
    "DateTime"日付と時刻
    "Time"1日のうちの時刻
    "ComputedDate",etc.計算から派生した日付(例:"next tuesday")
    "Location"地理位置を与える任意のもの
    "StreetAddress"標準的な任意の住所
    "Country"国または領土
    "AdministrativeDivision"州,県,郡等
    "USState"アメリカ合衆国の州
    "USCounty"アメリカ合衆国の郡
    "Quantity"単位が付いた数量
    "ComputedQuantity"計算で導かれた数量
    "PhysicalQuantity"物理量(例:"mass")
    "CurrencyAmount"通貨額(例:"$7.50")
    "CurrencyName"通貨名(例:"US dollars")
    "Company"会社
    "TickerSymbol"金融商品のティッカーシンボル
    "Color"任意の標準形式による色
    "entity"任意のWolfram言語の実体タイプ(例:"City"
    "entityclass"実体クラス(例:"CityClass"
    Restricted[form,spec]指定の方法で制限されたフォーム
    DelimitedSequence[form,]リストとして返された,分割されたフォームの列
    form1|form2|順に試される,いくつかの可能なフォーム
    {c1,c2,}選択肢 ciのリテラルな集合
    {lab1c1,lab2c2,}ラベル labiが付いた選択肢 ci
    AnySubset[{c1,c2,}]ciの任意の部分集合
    CompoundElement[{form1,}]formiで指定された要素のリスト
    CompoundElement[<|key1form1,|>]formiで指定された要素の連想
    RepeatingElement[form,]すべてが form で指定された要素のリスト
    CloudObject[]配備された GrammarRulesオブジェクト
    QuantityVariable["pq"]物理量 pq と互換の数量
  • $InterpreterTypesは,使用可能なインタープリタタイプの完全リストを与える.
  • "entity"には,EntityValueがサポートする任意の領域を使うことができる.
  • SpeechInterpreter[][audio]は解釈された値を返す.audio から音声が認識できなかった場合はMissing["NoInput"]が返される.
  • SpeechInterpreter[choices]choices には,規則のリストまたは連想を使うことができる.曖昧さがない場合は値の純粋なリストも使うことができる.
  • SpeechInterpreter[form,test][input]は,input を解釈した結果に指定の form を使って test を適用する.
  • test を適用した結果がTrueであれば,input の解釈が返される.
  • test を適用した結果がFailureオブジェクトであれば,このオブジェクトがすぐに返される.
  • test を適用した結果がFalseあるいは他の何かである場合は,SpeechInterpreter[form,test,fail][input]では,failinput の解釈に適用した結果が返される.fail が与えられない場合は,Failureオブジェクトが返される.
  • SpeechInterpreterが直接Failureオブジェクトを生成する場合は,次のタグが使われる.
  • "InterpretationFailure"与えられた文字列は指定の形式では解釈できない
    "RestrictionFailure"解釈は成功したが制限に失敗した
    "ConditionFailure"解釈と制限の両方に成功したが,明示的なテストが失敗した
    "ConnectionFailure"必要なクラウド接続が行えなかった
  • SpeechInterpreterは次のオプションをサポートする.
  • AmbiguityFunctionAutomatic曖昧な意味的結果に適用する関数
    GeoLocation$GeoLocation意味的解釈について仮定する地理位置
    Masking All関心区間
    TargetDevice"CPU"その上で認識を行うデバイス
    TimeZone$TimeZone意味的解釈に仮定する時刻帯
  • SpeechInterpreter[spec][{input1,input2,}]は,spec が与えられた構造を直接解釈するCompoundElementRepeatingElement等の構造物を含む点を除いて{SpeechInterpreter[spec][input1],SpeechInterpreter[spec][input2],}に等しい.
  • SpeechInterpreter[spec][{input1,input2,}]は,spec が与えられた構造を直接解釈するCompoundElementRepeatingElement等の構造物を含む点を除いて,解釈をすべての inputiにマップする.
  • SpeechInterpreter[form][audio1|audio2|]は,結果として,指定された形式を使って解釈可能な audioiの最初のものの解釈を与える.
  • SpeechInterpreterは機械学習を使う.含まれるメソッド,訓練集合,バイアスは,Wolfram言語のバージョンによって異なることがあり,与えられる結果も異なる可能性がある.
  • SpeechInterpreterはリソースをダウンロードすることがある.ダウンロードされたリソースは,$LocalBaseのローカルなオブジェクトストアに保存され,LocalObjects[]でリストしたりResourceRemoveで削除したりできる.

例題

すべて開くすべて閉じる

  (2)

日付を解釈し,DateObjectを生成する:

国を解釈し,Entityオブジェクトを生成する:

スコープ  (19)

基本的な用法  (3)

整数を解釈する:

解釈された値に対してテストを行い,テストの結果がTrueではないときにはFailureを返す:

評価するカスタムの失敗関数を指定する:

入力指定  (4)

単一の録音中の整数を解釈する:

複数の録音中の整数を解釈する:

整数として解釈できる最初の録音の解釈を返す:

複合要素を解釈して解釈のリストを返す:

タイプ指定  (5)

単一の解釈タイプを使う:

録音が指定のタイプではないと解釈は失敗する:

代りの解釈タイプのリストを使う.成功した最初の解釈が返される:

録音中の発話に一致するリテラル選択の集合中の1つを返す:

録音中の発話に一致するリテラル選択に関連付けられた値を返す:

インタープリタタイプ  (7)

大学を解釈し,Entityオブジェクトを返す:

場所を解釈し,GeoPositionオブジェクトを返す:

入力を通貨額として解釈し,Quantityオブジェクトを返す:

解釈された入力に対して計算を行う:

多くのタイプの実体を解釈する:

話された自由形式の式を解釈する:

連続する色を解釈する:

オプション  (1)

Masking  (1)

デフォルトで,録音全体が解釈に使われる:

解釈する関心区間を指定する:

アプリケーション  (2)

音声録音を航空会社として解釈する:

発話された都市の名を解釈する:

認識された都市を地図上に示す:

特性と関係  (1)

SpeechInterpreterは,事実上,SpeechRecognizeの結果についてInterpreterを呼び出す:

直接の発話の解釈と比較する:

Wolfram Research (2020), SpeechInterpreter, Wolfram言語関数, https://reference.wolfram.com/language/ref/SpeechInterpreter.html.

テキスト

Wolfram Research (2020), SpeechInterpreter, Wolfram言語関数, https://reference.wolfram.com/language/ref/SpeechInterpreter.html.

CMS

Wolfram Language. 2020. "SpeechInterpreter." Wolfram Language & System Documentation Center. Wolfram Research. https://reference.wolfram.com/language/ref/SpeechInterpreter.html.

APA

Wolfram Language. (2020). SpeechInterpreter. Wolfram Language & System Documentation Center. Retrieved from https://reference.wolfram.com/language/ref/SpeechInterpreter.html

BibTeX

@misc{reference.wolfram_2024_speechinterpreter, author="Wolfram Research", title="{SpeechInterpreter}", year="2020", howpublished="\url{https://reference.wolfram.com/language/ref/SpeechInterpreter.html}", note=[Accessed: 21-November-2024 ]}

BibLaTeX

@online{reference.wolfram_2024_speechinterpreter, organization={Wolfram Research}, title={SpeechInterpreter}, year={2020}, url={https://reference.wolfram.com/language/ref/SpeechInterpreter.html}, note=[Accessed: 21-November-2024 ]}