AudioIdentify

AudioIdentify[audio]

试图识别 audio 是什么音频并给出结果.

AudioIdentify[audio,category]

将识别限制在指定的 category 内.

AudioIdentify[audio,category,n]

给出最多 n 种可能的识别结果.

AudioIdentify[audio,category,n,"prop"]

给出每个识别的指定属性.

更多信息和选项

  • 音频识别,亦称为音频分类,试图识别录音中的声音.
  • AudioIdentify[{audio1,audio2,},] 可用来识别多个音频对象中的对象.
  • AudioIdentify[audio,category] 中,category 可能的形式包括:
  • "class"已命名声音类别,与用在 "Sound" 实体中的类别一样
    Entity[]任意合适的实体
    category1|category2|任意 categoryi
  • 默认情况下,AudioIdentify[audio] 返回形式为 Entity["Sound",] 的对象.
  • 属性 "prop" 可为以下形式:
  • "Probability"概念和概率的关联
    "Sound"声音实体对象
    "prop""Sound" 实体支持的属性
    {prop1,}属性指定列表
  • 可给出以下选项:
  • AcceptanceThreshold Automatic视为可接受的最小概率
    Masking All感兴趣的区间
    PerformanceGoal$PerformanceGoal识别时优化的目标
    SpecificityGoal Automatic要寻找什么样特殊类型的对象
    TargetDevice"CPU"运行计算的目标设备
  • PerformanceGoal 的可能的设置包括 "Speed""Quality".
  • SpecificityGoal 的可能的设置包括
  • "Low"希望找出一般类别的对象
    "High"希望找出特定种类的对象
    s位于 0(最低)和 1(最高)之间的特殊性
  • 如果在可接受范围内(由 AcceptanceThreshold 指定的)没有识别出对象,AudioIdentify 返回 Missing["Unidentified"].
  • AudioIdentify 使用机器学习. 在不同版本的 Wolfram 语言中,其方法、训练集和偏差可能会更改,并产生不同的结果.
  • AudioIdentify 可下载将存储在 $LocalBase 本地对象库中的资源,可使用 LocalObjects[] 列出,用 ResourceRemove 删除.

范例

打开所有单元关闭所有单元

基本范例  (2)

识别录音中的声音:

返回识别结果列表:

范围  (3)

识别录音中声音的类别:

在特定类别的声音范围内进行识别:

在几种类别的声音范围内进行识别:

获取几个识别结果:

返回的识别结果是肯定结果和请求的数量中的较小者:

获取每个识别结果的概率:

类别概率是独立的,因为在单个记录中可能存在多个源:

选项  (4)

AcceptanceThreshold  (2)

AcceptanceThreshold 控制返回结果的置信度:

增大阈值,只获取概率较大的识别结果:

在获取多个识别结果时,也可使用 AcceptanceThreshold

降低阈值以获取更多结果:

Masking  (1)

包含各种声音的录音可能会导致混乱的识别结果:

使用 masking 选项,仅在信号中的特定区域进行识别:

SpecificityGoal  (1)

SpecificityGoal 选项控制结果的普通性:

应用  (3)

识别 ExampleData 集合中的所有声音:

获取包含各种声音的信号的多个识别结果和概率:

AudioBlockMap 对 1 秒的时间段进行识别:

将结果相同的时间段合并起来:

绘制结果:

WebAudioSearch 构建动物声音的小数据集:

FeatureSpacePlot 可视化嵌入在语义上重要的 2D 空间中的信号:

定义一个函数,识别动物声音信号:

用识别结果生成一个 WordCloud

属性和关系  (1)

可用 NetModel 访问 AudioIdentify 使用的神经网络:

Wolfram Research (2019),AudioIdentify,Wolfram 语言函数,https://reference.wolfram.com/language/ref/AudioIdentify.html.

文本

Wolfram Research (2019),AudioIdentify,Wolfram 语言函数,https://reference.wolfram.com/language/ref/AudioIdentify.html.

CMS

Wolfram 语言. 2019. "AudioIdentify." Wolfram 语言与系统参考资料中心. Wolfram Research. https://reference.wolfram.com/language/ref/AudioIdentify.html.

APA

Wolfram 语言. (2019). AudioIdentify. Wolfram 语言与系统参考资料中心. 追溯自 https://reference.wolfram.com/language/ref/AudioIdentify.html 年

BibTeX

@misc{reference.wolfram_2024_audioidentify, author="Wolfram Research", title="{AudioIdentify}", year="2019", howpublished="\url{https://reference.wolfram.com/language/ref/AudioIdentify.html}", note=[Accessed: 05-November-2024 ]}

BibLaTeX

@online{reference.wolfram_2024_audioidentify, organization={Wolfram Research}, title={AudioIdentify}, year={2019}, url={https://reference.wolfram.com/language/ref/AudioIdentify.html}, note=[Accessed: 05-November-2024 ]}