SpeakerMatchQ
SpeakerMatchQ[audio,ref]
SpeakerMatchQ[{audio1,audio2,…},ref]
给出每个 audioi 的结果列表.
SpeakerMatchQ[ref]
表示 SpeakerMatchQ 的运算符形式,可将其应用于音频对象.
更多信息和选项
- SpeakerMatchQ 计算 audio 和参考音频 ref 中说话人的特点,如果说话人的特点之间的差距在可接受范围,则返回 True.
- 参考音频 ref 可为以下任意形式:
-
ref 一个参考 Audio 对象 ref1ref2… 几个可能的参考音频,按顺序进行测试 - 可给出以下选项:
-
AcceptanceThreshold 0.5 可接受的最小概率 Masking All 感兴趣的时间间隔 RecognitionPrior 0.5 得出 True 结果的先验概率 TargetDevice "CPU" 要用来进行计算的目标设备 - 使用 Masking 选项任意指定 audioi 中感兴趣的时间间隔. 可能的设置包括:
-
All 使用整段音频 {t1,t2} 使用时间间隔 t1 到 t2 {{t11,t12},{t21,t22},…} 使用 audioi 中的时间间隔 ti1 到 ti2 - SpeakerMatchQ 使用机器学习. 在不同版本的 Wolfram 语言中,其方法、训练集和偏差可能会改变并给出不同的结果.
- SpeakerMatchQ 可能会下载将保存在本地对象存储(位于 $LocalBase)中的资源,可用 LocalObjects[] 列出资源,用 ResourceRemove 将其删除.
范例
打开所有单元关闭所有单元范围 (3)
选项 (4)
应用 (3)
在 Spoken Digit Command 数据集中,为录音的子集构键 speaker-match 矩阵:
属性和关系 (1)
SpeakerMatchQ 计算输入录音中的说话人的特点,并比较这些嵌入.
从 Spoken Digit Command 数据集中提取有 2 到 5 个样本的说话人的录音:
与 SpeakerMatchQ 的结果相比较; 区别在于,在某些录音中没有检测到声音:
可能存在的问题 (1)
SpeakerMatchQ 首先找到有声音的区间,如果在任何一个输入中都未检测到语音,则无法给出结果:
文本
Wolfram Research (2020),SpeakerMatchQ,Wolfram 语言函数,https://reference.wolfram.com/language/ref/SpeakerMatchQ.html.
CMS
Wolfram 语言. 2020. "SpeakerMatchQ." Wolfram 语言与系统参考资料中心. Wolfram Research. https://reference.wolfram.com/language/ref/SpeakerMatchQ.html.
APA
Wolfram 语言. (2020). SpeakerMatchQ. Wolfram 语言与系统参考资料中心. 追溯自 https://reference.wolfram.com/language/ref/SpeakerMatchQ.html 年