AudioIntervals

AudioIntervals[audio]

返回 audio 的可听区间.

AudioIntervals[audio,crit]

只返回区间大于时长 mindur 的音频.

AudioIntervals[audio,crit,mindur]

只返回大于给定长度 mindur 的区间.

AudioIntervals[video,]

仅返回 video 中第一个音轨的音程.

更多信息和选项

  • AudioIntervals 可用于检测音频信号的某部分是否有特定特征.
  • 标准 crit 可以是一个指定高级目标的字符串或使用本地音频属性的一个纯函数.
  • crit 的高级字符串设置可以是:
  • "Audible"可听区间,大于 0.01 的 RMS 幅度
    "Inaudible"不可听区间,小于等于 0.01 的 RMS 幅度
    "Loud"更大声区间,数据相关阈值
    "Quiet"更安静区间,数据相关阈值
    "VoiceActivity"检测到语音的区间
    "VoiceInactivity"没有检测到语音的区间
  • 标准 crit 也可以是一个接受 #prop 自变量的函数,对每个选择的分区使用局部属性 "prop".
  • 下列属性可用于区间选取.
  • 基本直方图属性:
  • "MaxAbs"最大绝对值
    "Max"最大值
    "StandardDeviation"值的标准差
  • 强度属性:
  • "Power"根号平均值
    "RMSAmplitude"均方根值
    "Loudness"估算响度计量
    "LoudnessEBU"基于 EBU 瞬时标准的响度
  • 时间域属性:
  • "CrestFactor"最大值除以均方根值
    "Entropy"值的熵
    "PeakToAveragePowerRatio"最大功率除以平均功率
    "ZeroCrossingRate"零交叉率
    "ZeroCrossings"零交叉数量
  • 频域属性:
  • "FundamentalFrequency"估算基础频率
    "ModifiedKullbackLeibler"连续分区波谱间的经调整的 KL 距离
    "SpectralCentroid"功率谱的质心
    "SpectralCrest"功率谱的最大值除以平均值
    "SpectralFlatness"功率谱的几何平均除以平均值
    "SpectralKurtosis"幅度谱的峰度
    "SpectralRollOff"大部分能量频率集中的在该值之下的频率
    "SpectralSkewness"幅度谱的峰度
    "SpectralSlope"幅度谱的估算斜率
    "SpectralSpread"功率谱的带宽计量
    "SpeechFundamentalFrequency"针对语音信号优化的基本频率
    "VoiceActivity"检测到语音信号的语音活动
  • 最短持续时间 mindur 可以是以秒为单位的非负实数、时间量或者样本量.
  • 可给出以下选项:
  • AlignmentAutomatic对齐带分区的时间戳
    FourierParameters{-1,1}傅里叶参数
    PartitionGranularity Automatic音频分区规格
  • 默认情况下,量度在每个分区中心返回. 使用 Alignment 选项,则在每个分区的开头(Left)或结束(Right)返回量度.

范例

打开所有单元关闭所有单元

基本范例  (2)

计算音频的无声区间:

查找幅度均方根值小于 0.01 的区间:

可视化无声区间:

查找具有低 RMS 幅值的区间:

可视化找到的区间:

范围  (4)

用与数据相关的阈值查找静音区间:

缺省情况下,返回所有长度的区间:

计算区间时长:

查找时长大于指定阈值的区间:

同时测试多个属性:

分析视频音轨:

选项  (2)

PartitionGranularity  (2)

指定 100 毫秒大小的分割:

使用 10 毫秒的补偿:

使用平滑视窗:

使用不同分割规范将给出不同结果:

粗略分割会提高计算速度:

应用  (4)

删除音频的无声区间:

查找幅度均方根值大于某一阈值的音频区间:

合并提取的音频区间:

也可以使用 EBU 标准的瞬间响度定义查找静音区间:

"VoiceActivity" 属性来检测语音信号的有声区间:

可视化检测到的区间:

结合其他属性(例如RMS幅度和频谱平坦度)以找到清晰的音频片段:

可视化检测到的区间:

检测无声音的分段并进行减弱:

使用 "VoiceActivity" 属性检测无声音的区间:

可视化探测到的区间:

减弱探测到的区间:

可能存在的问题  (1)

如果返回值不是布尔值,则标准函数将失败:

某些属性(例如"FundamentalFrequency")可以具有非数字值,因此要格外小心:

Wolfram Research (2016),AudioIntervals,Wolfram 语言函数,https://reference.wolfram.com/language/ref/AudioIntervals.html (更新于 2024 年).

文本

Wolfram Research (2016),AudioIntervals,Wolfram 语言函数,https://reference.wolfram.com/language/ref/AudioIntervals.html (更新于 2024 年).

CMS

Wolfram 语言. 2016. "AudioIntervals." Wolfram 语言与系统参考资料中心. Wolfram Research. 最新版本 2024. https://reference.wolfram.com/language/ref/AudioIntervals.html.

APA

Wolfram 语言. (2016). AudioIntervals. Wolfram 语言与系统参考资料中心. 追溯自 https://reference.wolfram.com/language/ref/AudioIntervals.html 年

BibTeX

@misc{reference.wolfram_2024_audiointervals, author="Wolfram Research", title="{AudioIntervals}", year="2024", howpublished="\url{https://reference.wolfram.com/language/ref/AudioIntervals.html}", note=[Accessed: 05-November-2024 ]}

BibLaTeX

@online{reference.wolfram_2024_audiointervals, organization={Wolfram Research}, title={AudioIntervals}, year={2024}, url={https://reference.wolfram.com/language/ref/AudioIntervals.html}, note=[Accessed: 05-November-2024 ]}