Wolfram Language & System Documentation Center

SpeakerMatchQ

SpeakerMatchQ[audio,ref]

如果 audio 中说话人的特点与参考音频 ref 中说话人的特点匹配，给出 True，否则给出 False.

SpeakerMatchQ[{audio₁,audio₂,…},ref]

给出每个 audio_i 的结果列表.

SpeakerMatchQ[ref]

表示 SpeakerMatchQ 的运算符形式，可将其应用于音频对象.

更多信息和选项

SpeakerMatchQ 计算 audio 和参考音频 ref 中说话人的特点，如果说话人的特点之间的差距在可接受范围，则返回 True.
参考音频 ref 可为以下任意形式：
ref 一个参考 Audio 对象

ref₁|ref₂|… 几个可能的参考音频，按顺序进行测试
可给出以下选项：

AcceptanceThreshold	0.5	可接受的最小概率
Masking	All	感兴趣的时间间隔
RecognitionPrior	0.5	得出 True 结果的先验概率
TargetDevice	"CPU"	要用来进行计算的目标设备

使用 Masking 选项任意指定 audio_i 中感兴趣的时间间隔. 可能的设置包括：
All 使用整段音频

{t₁,t₂} 使用时间间隔 t₁ 到 t₂

{{t₁₁,t₁₂},{t₂₁,t₂₂},…} 使用 audio_i 中的时间间隔 t_i1 到 t_i2
SpeakerMatchQ 使用机器学习. 在不同版本的 Wolfram 语言中，其方法、训练集和偏差可能会改变并给出不同的结果.
SpeakerMatchQ 可能会下载将保存在本地对象存储（位于 $LocalBase）中的资源，可用 LocalObjects[] 列出资源，用 ResourceRemove 将其删除.

范例

打开所有单元关闭所有单元

基本范例 (2)

检查两个录音是否属于同一个说话人：

比较一段录音及其时间拉伸版本中的说话人：

范围 (3)

检查录音中的说话者是否与参考中的任何一个匹配：

检查一组录音中的说话人是否与参考匹配：

使用运算符形式的 SpeakerMatchQ：

选项 (4)

AcceptanceThreshold (1)

默认情况下，将可接受阈值设为 0.5：

指定认为可接受的最小概率：

Masking (2)

默认情况下，将比较整个音频记录，如果其中包含多个说话人，可能会失败：

指定一个感兴趣的时间间隔，与参考音频进行比较：

对录音列表中的每个输入音频分别应用遮罩：

RecognitionPrior (1)

指定录音中说话者与参考相匹配的先验概率：

使用更高的先验概率：

应用 (3)

比较一段录音及其时间拉伸版本中的说话人：

比较一段录音及移调后的版本中的说话人：

在 Spoken Digit Command 数据集中，为录音的子集构键 speaker-match 矩阵：

随机选择 10 个数据集中有 2 到 5 个样本的说话者：

提取与这些说话者对应的所有录音，并按说话者的 ID 进行排序：

计算并绘制匹配说话者矩阵：

属性和关系 (1)

SpeakerMatchQ 计算输入录音中的说话人的特点，并比较这些嵌入.

从 Spoken Digit Command 数据集中提取有 2 到 5 个样本的说话人的录音：

计算每个录音中说话人的特点：

可视化算出的特征的样本：

比较说话人的特点并据此绘制距离矩阵：

计算显示说话者特征是否匹配的二进制距离矩阵：

与 SpeakerMatchQ 的结果相比较；区别在于，在某些录音中没有检测到声音：

可能存在的问题 (1)

SpeakerMatchQ 首先找到有声音的区间，如果在任何一个输入中都未检测到语音，则无法给出结果：

Top

More Learning

Tech Support

Wolfram Solutions

Wolfram Solutions For Education

Get Started

Grow Your Skills

Work with Us

Educational Programs for Adults

Educational Programs for Youth

Read

SpeakerMatchQ

更多信息和选项

范例

基本范例 (2)

范围 (3)

选项 (4)

AcceptanceThreshold (1)

Masking (2)

RecognitionPrior (1)

应用 (3)

属性和关系 (1)

可能存在的问题 (1)

文本

CMS

APA

BibTeX

BibLaTeX

	ref	一个参考 Audio 对象
	ref₁\|ref₂\|…	几个可能的参考音频，按顺序进行测试

	All	使用整段音频
	{t₁,t₂}	使用时间间隔 t₁ 到 t₂
	{{t₁₁,t₁₂},{t₂₁,t₂₂},…}	使用 audio_i 中的时间间隔 t_i1 到 t_i2

SpeakerMatchQ

更多信息和选项

范例

基本范例 (2)

范围 (3)

选项 (4)

AcceptanceThreshold (1)

Masking (2)

RecognitionPrior (1)

应用 (3)

属性和关系 (1)

可能存在的问题 (1)

参见

相关指南

历史

文本

CMS

APA

BibTeX

BibLaTeX