Enable JavaScript to interact with content and submit forms on Wolfram websites. Learn how

语音计算

主题概览 »

语音计算包括处理语音信号并对其进行分析以推断信息. 操作包括更改说话者的音高、检测发声间隔以及识别说话者或语音. Wolfram 语言提供内置和完全集成的音频处理、统计分析、可视化和机器学习，可实现易于原型设计和高效的语音计算.

Generating & Importing Speech »

SpeechSynthesize — 根据文本合成语音信号

AudioCapture — 从输入设备中获取语音信号

Audio ▪ Import ▪ WebAudioSearch ▪ ExampleData ▪ ResourceData ▪ ...

可视化

Spectrogram — 绘制语音信号的频谱图

Cepstrogram ▪ Periodogram ▪ AudioPlot

理解语音

SpeechRecognize — 将语音信号转换为文本

LanguageIdentify ▪ SpeechCases ▪ SpeechInterpreter ▪ PitchRecognize ▪ SpeakerMatchQ

语音分析

AudioIntervals — 查找有声或无声间隔

AudioLoudness ▪ AudioLocalMeasurements ▪ ShortTimeFourier

语音操作

AudioPitchShift — 将变调应用于语音信号

AudioTimeStretch ▪ AudioFrequencyShift

语音合成

SpeechSynthesize — 产生文本的语音信号

VoiceStyleData ▪ $VoiceStyles

机器学习 »

Classify — 对语音信号集合执行分类

FeatureSpacePlot ▪ FeatureSpacePlot3D ▪ FeatureExtractor ▪ Nearest ▪ ...

神经网络 »

NetModel — 使用预训练的网络进行语音分析

NetEncoder ▪ "Audio" ▪ "AudioMFCC" ▪ "AudioMelSpectrogram" ▪ ...

NetTrain ▪ GatedRecurrentLayer ▪ LongShortTermMemoryLayer ▪ CTCLossLayer ▪ ...

标签合注释

AudioAnnotate — 用分析结果注释音频对象

AnnotationKeys ▪ AnnotationValue ▪ AnnotationDelete

音频操作 »

AudioTrim — 提取感兴趣部分的语音信号

AudioJoin ▪ AudioReplace ▪ LowpassFilter ▪ WienerFilter ▪ ...

顶部