SpeakerMatchQ

SpeakerMatchQ[audio,ref]

如果 audio 中说话人的特点与参考音频 ref 中说话人的特点匹配,给出 True,否则给出 False.

SpeakerMatchQ[{audio1,audio2,},ref]

给出每个 audioi 的结果列表.

SpeakerMatchQ[ref]

表示 SpeakerMatchQ 的运算符形式,可将其应用于音频对象.

更多信息和选项

  • SpeakerMatchQ 计算 audio 和参考音频 ref 中说话人的特点,如果说话人的特点之间的差距在可接受范围,则返回 True.
  • 参考音频 ref 可为以下任意形式:
  • ref 一个参考 Audio 对象
    ref1|ref2|几个可能的参考音频,按顺序进行测试
  • 可给出以下选项:
  • AcceptanceThreshold 0.5可接受的最小概率
    Masking All感兴趣的时间间隔
    RecognitionPrior 0.5得出 True 结果的先验概率
    TargetDevice"CPU"要用来进行计算的目标设备
  • 使用 Masking 选项任意指定 audioi 中感兴趣的时间间隔. 可能的设置包括:
  • All使用整段音频
    {t1,t2}使用时间间隔 t1t2
    {{t11,t12},{t21,t22},}使用 audioi 中的时间间隔 ti1ti2
  • SpeakerMatchQ 使用机器学习. 在不同版本的 Wolfram 语言中,其方法、训练集和偏差可能会改变并给出不同的结果.
  • SpeakerMatchQ 可能会下载将保存在本地对象存储(位于 $LocalBase)中的资源,可用 LocalObjects[] 列出资源,用 ResourceRemove 将其删除.

范例

打开所有单元关闭所有单元

基本范例  (2)

检查两个录音是否属于同一个说话人:

比较一段录音及其时间拉伸版本中的说话人:

范围  (3)

检查录音中的说话者是否与参考中的任何一个匹配:

检查一组录音中的说话人是否与参考匹配:

使用运算符形式的 SpeakerMatchQ

选项  (4)

AcceptanceThreshold  (1)

默认情况下,将可接受阈值设为 0.5:

指定认为可接受的最小概率:

Masking  (2)

默认情况下,将比较整个音频记录,如果其中包含多个说话人,可能会失败:

指定一个感兴趣的时间间隔,与参考音频进行比较:

对录音列表中的每个输入音频分别应用遮罩:

RecognitionPrior  (1)

指定录音中说话者与参考相匹配的先验概率:

使用更高的先验概率:

应用  (3)

比较一段录音及其时间拉伸版本中的说话人:

比较一段录音及移调后的版本中的说话人:

Spoken Digit Command 数据集中,为录音的子集构键 speaker-match 矩阵:

随机选择 10 个数据集中有 2 到 5 个样本的说话者:

提取与这些说话者对应的所有录音,并按说话者的 ID 进行排序:

计算并绘制匹配说话者矩阵:

属性和关系  (1)

SpeakerMatchQ 计算输入录音中的说话人的特点,并比较这些嵌入.

Spoken Digit Command 数据集中提取有 2 到 5 个样本的说话人的录音:

计算每个录音中说话人的特点:

可视化算出的特征的样本:

比较说话人的特点并据此绘制距离矩阵:

计算显示说话者特征是否匹配的二进制距离矩阵:

SpeakerMatchQ 的结果相比较; 区别在于,在某些录音中没有检测到声音:

可能存在的问题  (1)

SpeakerMatchQ 首先找到有声音的区间,如果在任何一个输入中都未检测到语音,则无法给出结果:

Wolfram Research (2020),SpeakerMatchQ,Wolfram 语言函数,https://reference.wolfram.com/language/ref/SpeakerMatchQ.html.

文本

Wolfram Research (2020),SpeakerMatchQ,Wolfram 语言函数,https://reference.wolfram.com/language/ref/SpeakerMatchQ.html.

CMS

Wolfram 语言. 2020. "SpeakerMatchQ." Wolfram 语言与系统参考资料中心. Wolfram Research. https://reference.wolfram.com/language/ref/SpeakerMatchQ.html.

APA

Wolfram 语言. (2020). SpeakerMatchQ. Wolfram 语言与系统参考资料中心. 追溯自 https://reference.wolfram.com/language/ref/SpeakerMatchQ.html 年

BibTeX

@misc{reference.wolfram_2024_speakermatchq, author="Wolfram Research", title="{SpeakerMatchQ}", year="2020", howpublished="\url{https://reference.wolfram.com/language/ref/SpeakerMatchQ.html}", note=[Accessed: 21-November-2024 ]}

BibLaTeX

@online{reference.wolfram_2024_speakermatchq, organization={Wolfram Research}, title={SpeakerMatchQ}, year={2020}, url={https://reference.wolfram.com/language/ref/SpeakerMatchQ.html}, note=[Accessed: 21-November-2024 ]}