语音计算
主题概览 »语音计算包括处理语音信号并对其进行分析以推断信息. 操作包括更改说话者的音高、检测发声间隔以及识别说话者或语音. Wolfram 语言提供内置和完全集成的音频处理、统计分析、可视化和机器学习,可实现易于原型设计和高效的语音计算.
Generating & Importing Speech »
SpeechSynthesize — 根据文本合成语音信号
AudioCapture — 从输入设备中获取语音信号
Audio ▪ Import ▪ WebAudioSearch ▪ ExampleData ▪ ResourceData ▪ ...
可视化
Spectrogram — 绘制语音信号的频谱图
Cepstrogram ▪ Periodogram ▪ AudioPlot
理解语音
SpeechRecognize — 将语音信号转换为文本
LanguageIdentify ▪ SpeechCases ▪ SpeechInterpreter ▪ PitchRecognize ▪ SpeakerMatchQ
语音分析
AudioIntervals — 查找有声或无声间隔
AudioLoudness ▪ AudioLocalMeasurements ▪ ShortTimeFourier
语音操作
AudioPitchShift — 将变调应用于语音信号
AudioTimeStretch ▪ AudioFrequencyShift
语音合成
SpeechSynthesize — 产生文本的语音信号
机器学习 »
Classify — 对语音信号集合执行分类
FeatureSpacePlot ▪ FeatureSpacePlot3D ▪ FeatureExtractor ▪ Nearest ▪ ...
神经网络 »
NetModel — 使用预训练的网络进行语音分析
NetEncoder ▪ "Audio" ▪ "AudioMFCC" ▪ "AudioMelSpectrogram" ▪ ...
NetTrain ▪ GatedRecurrentLayer ▪ LongShortTermMemoryLayer ▪ CTCLossLayer ▪ ...
标签合注释
AudioAnnotate — 用分析结果注释音频对象
AnnotationKeys ▪ AnnotationValue ▪ AnnotationDelete
音频操作 »
AudioTrim — 提取感兴趣部分的语音信号
AudioJoin ▪ AudioReplace ▪ LowpassFilter ▪ WienerFilter ▪ ...