Wolfram言語＆システムドキュメントセンター

AudioIdentify

AudioIdentify[audio]

audio が何の録音かの識別を試み，その結果を返す．

AudioIdentify[audio,category]

識別を指定された category に限定する．

AudioIdentify[audio,category,n]

n 個までの可能な識別のリストを与える．

AudioIdentify[audio,category,n,"prop"]

各識別について，指定された特性を与える．

AudioIdentify

AudioIdentify[audio]

audio が何の録音かの識別を試み，その結果を返す．

AudioIdentify[audio,category]

識別を指定された category に限定する．

AudioIdentify[audio,category,n]

n 個までの可能な識別のリストを与える．

AudioIdentify[audio,category,n,"prop"]

各識別について，指定された特性を与える．

詳細とオプション

音声識別は，音声分類としても知られるもので，音声録音中の音の識別を試みる．

AudioIdentify[{audio₁,audio₂,…},…]を使って複数の音声オブジェクト中のオブジェクトを識別することができる．
AudioIdentify[audio,category]の category の可能な形には以下がある．

	"class"	"Sound" 実体で使われる，名前付きのサウンドクラス
	Entity[…]	適切な任意の実体
	category₁\|category₂\|…	category_iのいずれか

デフォルトで，AudioIdentify[audio]はEntity["Sound",…]の形のオブジェクトを返す．
特性"prop"は以下の任意のものでよい．

	"Probability"	概念と確率の連想
	"Sound"	サウンド実体オブジェクト
	"prop"	"Sound"実体がサポートする特性
	{prop₁,…}	特性指定のリスト

次は，使用可能なオプションである．

AcceptanceThreshold	Automatic	許容可能とみなす最低確率
Masking	All	関心区間
PerformanceGoal	$PerformanceGoal	識別において何を最適化するか
SpecificityGoal	Automatic	オブジェクトタイプのどの特異性を求めるか
TargetDevice	"CPU"	評価を行うターゲットデバイス

PerformanceGoalの可能な設定には"Speed"と"Quality"がある．
SpecificityGoalの可能な設定には以下がある．

	"Low"	オブジェクトの一般的なカテゴリを優先する
	"High"	特定の種類のオブジェクトを優先する
	s	0（最低）から1（最高）までの特異性

AudioIdentifyは，AcceptanceThresholdで指定された許容レベルで識別できないときにはMissing["Unidentified"]を返す．
AudioIdentifyは機械学習を使う．含まれるメソッド，訓練集合，バイアスはWolfram言語のバージョンによって異なることがあり，与えられる結果も異なる可能性がある．
AudioIdentifyはリソースをダウンロードすることがある．ダウンロードされたリソースは，$LocalBaseのローカルなオブジェクトストアに保存され，LocalObjects[]でリストしたりResourceRemoveで削除したりできる．

例題

すべて開くすべて閉じる

例 (2)

録音中のサウンドを識別する：

識別したもののリストを返す：

スコープ (3)

録音中のサウンドクラスを識別する：

特定のカテゴリのサウンド内で識別する：

いくつかのカテゴリのサウンドの中から任意のもので識別する：

いくつかの識別を得る：

返される識別は，明確な識別の数と要求された数のうち小さい方である：

各識別の確率を得る：

単一の録音に複数の音源が存在するかもしれないので，クラス確率は独立である．

オプション (4)

AcceptanceThreshold (2)

AcceptanceThresholdを使って返される結果の信頼度を制御する：

閾値を上げて確率が高い識別のみを得る：

AcceptanceThresholdは複数の識別を得る場合にも使われる：

閾値を下げてより多くの結果を得る：

Masking (1)

さまざまなサウンドを含む音声録音の識別は混乱することがある：

マスキングオプションを使って信号中の特定の領域だけを識別する：

SpecificityGoal (1)

SpecificityGoalオプションを使って結果の一般性を制御する：

アプリケーション (3)

ExampleDataの中のすべてのサウンドを識別する：

さまざまなサウンドを含む信号について，複数の識別と確率を得る：

AudioBlockMapを使って1秒間の識別を行う：

同じ識別結果の区間をマージする：

結果をプロットする：

WebAudioSearchを使って動物の音の小さなデータベースを構築する：

FeatureSpacePlotを使って意味論的に重要な2D空間に埋め込まれた信号を可視化する：

信号を動物の音としてのみ識別する関数を定義する：

識別結果を使ってWordCloudを生成する：

特性と関係 (1)

AudioIdentifyが使うニューラルネットには，NetModelを使ってアクセスできる：

Top

その他のラーニングリソース

テクニカルサポート

Wolframソリューション

教育のためのWolframソリューション

使い始める

Grow Your Skills

Wolframと繋がる

大人用の教育プログラム

若者のための教育プログラム

読む

AudioIdentify

詳細とオプション

例題

例 (2)

スコープ (3)

オプション (4)

AcceptanceThreshold (2)

Masking (1)

SpecificityGoal (1)

アプリケーション (3)

特性と関係 (1)

テキスト

CMS

APA

BibTeX

BibLaTeX

AudioIdentify

詳細とオプション

例題

例 (2)

スコープ (3)

オプション (4)

AcceptanceThreshold (2)

Masking (1)

SpecificityGoal (1)

アプリケーション (3)

特性と関係 (1)

関連項目

関連するガイド

履歴

テキスト

CMS

APA

BibTeX

BibLaTeX