音声計算
この分野の概要 »
音声の計算では,音声信号を処理し,それを解析して情報を推測する.操作には話し手の音高の変更,発話区間の検出,話し手や音声の認識等が含まれる. Wolfram言語は完全に統合された組込みの音声の処理,統計解析,可視化,機械学習を提供しており,プロトタイプ作成が容易で高効率の音声計算を実現している.
音声の生成とインポート »
SpeechSynthesize — テキストから音声信号を合成する
AudioCapture — 入力デバイスからの音声信号を取り込む
Audio ▪ Import ▪ WebAudioSearch ▪ ExampleData ▪ ResourceData ▪ ...
可視化
Spectrogram — 音声信号のスペクトログラムをプロットする
Cepstrogram ▪ Periodogram ▪ AudioPlot
音声の理解
SpeechRecognize — 音声テキスト変換をして,発声された音声信号をテキストに変換する
LanguageIdentify ▪ SpeechCases ▪ SpeechInterpreter ▪ PitchRecognize ▪ SpeakerMatchQ
音声解析
AudioIntervals — 有声と無声の区間を求める
AudioLoudness ▪ AudioLocalMeasurements ▪ ShortTimeFourier
音声操作
AudioPitchShift — 音声信号に音高シフトを適用する
AudioTimeStretch ▪ AudioFrequencyShift
音声の合成
SpeechSynthesize — テキストから音声信号を生成する
機械学習 »
Classify — 音声信号の集合を分類する
FeatureSpacePlot ▪ FeatureSpacePlot3D ▪ FeatureExtractor ▪ Nearest ▪ ...
ニューラルネットワーク »
NetModel — 訓練済みネットワークを使って音声解析を行う
NetEncoder ▪ "Audio" ▪ "AudioMFCC" ▪ "AudioMelSpectrogram" ▪ ...
NetTrain ▪ GatedRecurrentLayer ▪ LongShortTermMemoryLayer ▪ CTCLossLayer ▪ ...
ラベルと注釈
AudioAnnotate — 音声オブジェクトに解析結果の注釈を付ける
AnnotationKeys ▪ AnnotationValue ▪ AnnotationDelete
音声操作 »
AudioTrim — 音声信号の興味深い部分を抽出する
AudioJoin ▪ AudioReplace ▪ LowpassFilter ▪ WienerFilter ▪ ...