音声解析は信号から抽出されたローカルおよびグローバルな特徴を視覚的またはプログラム的に検査することによって実現される.音声信号の場合,解析は時間または周波数,あるいはその両方で行われる. Wolfram言語は,音声信号の分類や音声認識のための低レベルのスペクトル解析から高レベルの関数まで,多数の関数のコレクションを提供する.

音声の可視化

AudioPlot 音声の波形プロット

Spectrogram 音声のスペクトログラムまたは時間-周波数プロット

Periodogram 音声のパワースペクトルプロット

Cepstrogram 音声のパワーケプストラプロット

音声の解析

AudioDistance 2つの音声オブジェクト間の距離測度を計算する

AudioBlockMap 音声のパーティションに関数を適用する

AudioLoudness 音声信号のさまざまなラウドネス基準を計算する

AudioIntervals  ▪  AudioMeasurements  ▪  AudioLocalMeasurements

周波数分析

ShortTimeFourier 短時間フーリエ変換 (STFT) を計算する

Fourier  ▪  PeriodogramArray  ▪  SpectrogramArray  ▪  CepstrogramArray  ▪  CepstrumArray  ▪  InverseShortTimeFourier  ▪  InverseSpectrogram

音声信号の理解

AudioIdentify 音声信号が何の音声記録であるのかを判定しようとする

PitchRecognize  ▪  AudioInstanceQ

音声の理解 »

SpeechRecognize 発声された音声信号をテキストに変換する

SpeechCases  ▪  SpeechInterpreter  ▪  ...

音声注釈

AudioAnnotate 音声オブジェクトに注釈を付ける

AudioAnnotationLookup  ▪  AnnotationDelete  ▪  AnnotationRules

機械学習 »

Classify, Predict 音声信号に分類器あるいは予測器を作成または適用する

Nearest  ▪  FeatureNearest  ▪  FeatureSpacePlot  ▪  FindClusters  ▪  ...

NetEncoder  ▪  NetChain  ▪  NetGraph  ▪  ...