Wolfram 语言与系统参考资料中心

AudioIntervals

AudioIntervals[audio]

返回 audio 的可听区间.

AudioIntervals[audio,crit]

只返回区间大于时长 mindur 的音频.

AudioIntervals[audio,crit,mindur]

只返回大于给定长度 mindur 的区间.

AudioIntervals[video,…]

仅返回 video 中第一个音轨的音程.

更多信息和选项

AudioIntervals 可用于检测音频信号的某部分是否有特定特征.
标准 crit 可以是一个指定高级目标的字符串或使用本地音频属性的一个纯函数.
crit 的高级字符串设置可以是：

	"Audible"	可听区间，大于 0.01 的 RMS 幅度
	"Inaudible"	不可听区间，小于等于 0.01 的 RMS 幅度
	"Loud"	更大声区间，数据相关阈值
	"Quiet"	更安静区间，数据相关阈值
	"VoiceActivity"	检测到语音的区间
	"VoiceInactivity"	没有检测到语音的区间

标准 crit 也可以是一个接受 #prop 自变量的函数，对每个选择的分区使用局部属性 "prop".
下列属性可用于区间选取.
基本直方图属性：
"MaxAbs" 最大绝对值

"Max" 最大值

"StandardDeviation" 值的标准差
强度属性：
"Power" 根号平均值

"RMSAmplitude" 均方根值

"Loudness" 估算响度计量

"LoudnessEBU" 基于 EBU 瞬时标准的响度
时间域属性：

	"CrestFactor"	最大值除以均方根值
	"Entropy"	值的熵
	"PeakToAveragePowerRatio"	最大功率除以平均功率
	"ZeroCrossingRate"	零交叉率
	"ZeroCrossings"	零交叉数量

频域属性：

	"FundamentalFrequency"	估算基础频率
	"ModifiedKullbackLeibler"	连续分区波谱间的经调整的 KL 距离
	"SpectralCentroid"	功率谱的质心
	"SpectralCrest"	功率谱的最大值除以平均值
	"SpectralFlatness"	功率谱的几何平均除以平均值
	"SpectralKurtosis"	幅度谱的峰度
	"SpectralRollOff"	大部分能量频率集中的在该值之下的频率
	"SpectralSkewness"	幅度谱的峰度
	"SpectralSlope"	幅度谱的估算斜率
	"SpectralSpread"	功率谱的带宽计量
	"SpeechFundamentalFrequency"	针对语音信号优化的基本频率
	"VoiceActivity"	检测到语音信号的语音活动

最短持续时间 mindur 可以是以秒为单位的非负实数、时间量或者样本量.
可给出以下选项：
Alignment Automatic 对齐带分区的时间戳

FourierParameters {-1,1} 傅里叶参数

PartitionGranularity Automatic 音频分区规格
默认情况下，量度在每个分区中心返回. 使用 Alignment 选项，则在每个分区的开头（Left）或结束（Right）返回量度.

范例

打开所有单元关闭所有单元

基本范例 (2)

计算音频的无声区间：

查找幅度均方根值小于 0.01 的区间：

可视化无声区间：

查找具有低 RMS 幅值的区间：

可视化找到的区间：

范围 (4)

用与数据相关的阈值查找静音区间：

缺省情况下，返回所有长度的区间：

计算区间时长：

查找时长大于指定阈值的区间：

同时测试多个属性：

分析视频音轨：

选项 (2)

PartitionGranularity (2)

指定 100 毫秒大小的分割：

使用 10 毫秒的补偿：

使用平滑视窗：

使用不同分割规范将给出不同结果：

粗略分割会提高计算速度：

应用 (4)

删除音频的无声区间：

查找幅度均方根值大于某一阈值的音频区间：

合并提取的音频区间：

也可以使用 EBU 标准的瞬间响度定义查找静音区间：

用 "VoiceActivity" 属性来检测语音信号的有声区间：

可视化检测到的区间：

结合其他属性（例如RMS幅度和频谱平坦度）以找到清晰的音频片段：

可视化检测到的区间：

检测无声音的分段并进行减弱：

使用 "VoiceActivity" 属性检测无声音的区间：

可视化探测到的区间：

减弱探测到的区间：

可能存在的问题 (1)

如果返回值不是布尔值，则标准函数将失败：

某些属性（例如"FundamentalFrequency"）可以具有非数字值，因此要格外小心：

Top

更多学习资源

技术支持

Wolfram 解决方案

Wolfram 的教育解决方案

开始

提高你的技能

与我们合作

成人教育计划

青少年教育计划

欢迎阅读

AudioIntervals

更多信息和选项

范例

基本范例 (2)

范围 (4)

选项 (2)

PartitionGranularity (2)

应用 (4)

可能存在的问题 (1)

文本

CMS

APA

BibTeX

BibLaTeX

	"MaxAbs"	最大绝对值
	"Max"	最大值
	"StandardDeviation"	值的标准差

	"Power"	根号平均值
	"RMSAmplitude"	均方根值
	"Loudness"	估算响度计量
	"LoudnessEBU"	基于 EBU 瞬时标准的响度

Alignment	Automatic	对齐带分区的时间戳
FourierParameters	{-1,1}	傅里叶参数
PartitionGranularity	Automatic	音频分区规格

AudioIntervals

更多信息和选项

范例

基本范例 (2)

范围 (4)

选项 (2)

PartitionGranularity (2)

应用 (4)

可能存在的问题 (1)

参见

相关指南

历史

文本

CMS

APA

BibTeX

BibLaTeX