音声の計算では,音声信号を処理し,それを解析して情報を推測する.操作には話し手の音高の変更,発話区間の検出,話し手や音声の認識等が含まれる. Wolfram言語は完全に統合された組込みの音声の処理,統計解析,可視化,機械学習を提供しており,プロトタイプ作成が容易で高効率の音声計算を実現している.

音声の生成とインポート »

SpeechSynthesize テキストから音声信号を合成する

AudioCapture 入力デバイスからの音声信号を取り込む

Audio  ▪  Import  ▪  WebAudioSearch  ▪  ExampleData  ▪  ResourceData  ▪  ...

可視化

Spectrogram 音声信号のスペクトログラムをプロットする

Cepstrogram  ▪  Periodogram  ▪  AudioPlot

音声の理解

SpeechRecognize 音声テキスト変換をして,発声された音声信号をテキストに変換する

LanguageIdentify  ▪  SpeechCases  ▪  SpeechInterpreter  ▪  PitchRecognize  ▪  SpeakerMatchQ

音声解析

AudioIntervals 有声と無声の区間を求める

AudioLoudness  ▪  AudioLocalMeasurements  ▪  ShortTimeFourier

音声操作

AudioPitchShift 音声信号に音高シフトを適用する

AudioTimeStretch  ▪  AudioFrequencyShift

音声の合成

SpeechSynthesize テキストから音声信号を生成する

VoiceStyleData  ▪  $VoiceStyles

機械学習 »

Classify 音声信号の集合を分類する

FeatureSpacePlot  ▪  FeatureSpacePlot3D  ▪  FeatureExtractor  ▪  Nearest  ▪  ...

ニューラルネットワーク »

NetModel 訓練済みネットワークを使って音声解析を行う

NetEncoder  ▪  "Audio"  ▪  "AudioMFCC"  ▪  "AudioMelSpectrogram"  ▪  ...

NetTrain  ▪  GatedRecurrentLayer  ▪  LongShortTermMemoryLayer  ▪  CTCLossLayer  ▪  ...

ラベルと注釈

AudioAnnotate 音声オブジェクトに解析結果の注釈を付ける

AnnotationKeys  ▪  AnnotationValue  ▪  AnnotationDelete

音声操作 »

AudioTrim 音声信号の興味深い部分を抽出する

AudioJoin  ▪  AudioReplace  ▪  LowpassFilter  ▪  WienerFilter  ▪  ...