SpeakerMatchQ

SpeakerMatchQ[audio,ref]

audio の話者の特徴が参照 ref の話者と一致する場合はTrueを，それ以外の場合はFalseを返す．

SpeakerMatchQ[{audio₁,audio₂,…},ref]

各 audio_iの結果のリストを与える．

SpeakerMatchQ[ref]

音声オブジェクトに適用可能なSpeakerMatchQの演算子形を表す．

詳細とオプション

SpeakerMatchQは，audio と参照 ref の話者の特徴を計算し，話者の特徴間の距離が許容可能な場合はTrueを返す．
参照 ref は次のいずれでもよい．
ref 単一の参照Audioオブジェクト

ref₁|ref₂|… 順に試される，いくつかの可能な参照
次は，使用可能なオプションである．

AcceptanceThreshold	0.5	許容できるとみなす最低の確率
Masking	All	関心区間
RecognitionPrior	0.5	結果がTrueとなる事前確率
TargetDevice	"CPU"	計算を行うターゲットデバイス

Maskingオプションを使って任意の audio_iの関心区間を指定する．次は，使用可能な設定である．
All 音声全体を使う

{t₁,t₂} t₁から t₂までの区間を使う

{{t₁₁,t₁₂},{t₂₁,t₂₂},…} audio_iの t_i1から t_i2までの区間を使う
SpeakerMatchQは機械学習を使う．含まれるメソッド，訓練集合，バイアスは，Wolfram言語のバージョンによって異なることがあり，与えられる結果も異なる可能性がある．
SpeakerMatchQはリソースをダウンロードすることがある．ダウンロードされたリソースは，$LocalBaseのローカルなオブジェクトストアに保存され，LocalObjects[]でリストしたりResourceRemoveで削除したりできる．

例題

すべて開くすべて閉じる

例 (2)

2つの録音が同じ話者のものかどうかチェックする：

録音の話者と時間を引き延ばしたバージョンの話者を比較する：

スコープ (3)

録音中の話者がいくつかの参照のいずれかと一致するかどうかを調べる：

録音のリストにある話者の中に参照と一致するものがあるかどうかを調べる：

SpeakerMatchQの演算子形を使う：

オプション (4)

AcceptanceThreshold (1)

デフォルトで，受容閾値として0.5が使われる：

受容可能であるとみなされる最小確率を指定する：

Masking (2)

デフォルトで，音声録音全体が比較される．このため，話者が複数のときはうまくいかないことがある：

録音中の関心区間を指定して参照と比較する：

録音のリスト中の各入力音声に異なるマスキングを適用する：

RecognitionPrior (1)

録音中の話者が参照と一致する事前確率を指定する：

より高い事前確率を使用する：

アプリケーション (3)

録音の話者と時間を引き延ばしたバージョンの話者を比較する：

録音の話者とピッチをシフトしたバージョンの話者を比較する：

Spoken Digit Commandデータ集合中で，録音の部分集合について話者が一致する行列を構築する：

データ集合に2つから5つのサンプルがある話者からランダムに10人を選ぶ：

それらの話者に対応するすべての録音を抽出し，話者のIDによってソートする：

一致する話者の行列を計算してプロットする：

特性と関係 (1)

SpeakerMatchQは入力録音について話者の特徴を計算し，埋め込まれたそれらを比較する．

Spoken Digit Commandデータ集合から，録音が2つから5つしかない話者の録音を抽出する：

各録音について話者の特徴を計算する：

計算された特徴のサンプルを可視化する：

話者の特徴を比較し，それらについての距離行列をプロットする：

話者の特徴が一致するかどうかを示すバイナリ距離行列を計算する：

SpeakerMatchQの結果と比較する．差は録音の中に音声が検出できないものがあるからである：

考えられる問題 (1)

SpeakerMatchQは，最初に有声区間を求める．入力のどれにも声が検出できない場合は失敗する：

トップへ

その他のラーニングリソース

テクニカルサポート

大人用の教育プログラム

若者のための教育プログラム

イベント

Wolframイニシアチブ

教育リソース

趣味とプロジェクト

Wolframソリューション

教育のためのWolframソリューション

使い始める

Grow Your Skills

Wolframと繋がる

読む

大人用の教育プログラム

若者のための教育プログラム

イベント

SpeakerMatchQ

詳細とオプション

例題

例 (2)

スコープ (3)

オプション (4)

AcceptanceThreshold (1)

Masking (2)

RecognitionPrior (1)

アプリケーション (3)

特性と関係 (1)

考えられる問題 (1)

テキスト

CMS

APA

BibTeX

BibLaTeX

	ref	単一の参照Audioオブジェクト
	ref₁\|ref₂\|…	順に試される，いくつかの可能な参照

	All	音声全体を使う
	{t₁,t₂}	t₁から t₂までの区間を使う
	{{t₁₁,t₁₂},{t₂₁,t₂₂},…}	audio_iの t_i1から t_i2までの区間を使う

SpeakerMatchQ

詳細とオプション

例題

例 (2)

スコープ (3)

オプション (4)

AcceptanceThreshold (1)

Masking (2)

RecognitionPrior (1)

アプリケーション (3)

特性と関係 (1)

考えられる問題 (1)

関連項目

関連するガイド

履歴

テキスト

CMS

APA

BibTeX

BibLaTeX