语音计算

主题概览 »

语音计算包括处理语音信号并对其进行分析以推断信息. 操作包括更改说话者的音高、检测发声间隔以及识别说话者或语音.  Wolfram 语言提供内置和完全集成的音频处理、统计分析、可视化和机器学习,可实现易于原型设计和高效的语音计算.

Generating & Importing Speech »

SpeechSynthesize 根据文本合成语音信号

AudioCapture 从输入设备中获取语音信号

Audio  ▪  Import  ▪  WebAudioSearch  ▪  ExampleData  ▪  ResourceData  ▪  ...

可视化

Spectrogram 绘制语音信号的频谱图

Cepstrogram  ▪  Periodogram  ▪  AudioPlot

理解语音

SpeechRecognize 将语音信号转换为文本

LanguageIdentify  ▪  SpeechCases  ▪  SpeechInterpreter  ▪  PitchRecognize  ▪  SpeakerMatchQ

语音分析

AudioIntervals 查找有声或无声间隔

AudioLoudness  ▪  AudioLocalMeasurements  ▪  ShortTimeFourier

语音操作

AudioPitchShift 将变调应用于语音信号

AudioTimeStretch  ▪  AudioFrequencyShift

语音合成

SpeechSynthesize 产生文本的语音信号

VoiceStyleData  ▪  $VoiceStyles

机器学习 »

Classify 对语音信号集合执行分类

FeatureSpacePlot  ▪  FeatureSpacePlot3D  ▪  FeatureExtractor  ▪  Nearest  ▪  ...

神经网络 »

NetModel 使用预训练的网络进行语音分析

NetEncoder  ▪  "Audio"  ▪  "AudioMFCC"  ▪  "AudioMelSpectrogram"  ▪  ...

NetTrain  ▪  GatedRecurrentLayer  ▪  LongShortTermMemoryLayer  ▪  CTCLossLayer  ▪  ...

标签合注释

AudioAnnotate 用分析结果注释音频对象

AnnotationKeys  ▪  AnnotationValue  ▪  AnnotationDelete

音频操作 »

AudioTrim 提取感兴趣部分的语音信号

AudioJoin  ▪  AudioReplace  ▪  LowpassFilter  ▪  WienerFilter  ▪  ...