"Characters" (ネットエンコーダ)
NetEncoder["Characters"]
ASCII文字列を整数コードの数列に変換するエンコーダを表す.
NetEncoder[{"Characters",table}]
表 table 内の文字から成る文字列を変換するエンコーダを表す.
NetEncoder[{"Characters",table,form}]
文字列を出力のタイプ form に変換するエンコーダを表す.
NetEncoder[{"Characters",…,"param"value}]
追加のパラメータが特定されているエンコーダを表す.
詳細
- NetEncoder[…][input]はエンコーダを文字列に適用し,出力を作る.
- NetEncoder[…][{input1,input2,…}]はエンコーダを文字列のリストに適用し,出力のリストを作る.
- table によって指定される,文字からコードへのマッピングには,以下の形式が使える:
-
"c1c2…" 各文字 ci を連続する使用可能なコードにマップする "c1c2…"n すべての文字 ci をコード n にマップする "c1c2…"Automatic すべての文字 ci を次の使用可能なコードにマップする n;;mspec n から m の間の文字を spec にマップする {spec1,spec2,…} speci からのコード列を割り当てる - 以下の記号文字グループが表の中で使用可能である:
-
Automatic 表示可能なすべてのASCII文字プラス空白,タブ,改行 LetterCharacter aからz,およびAからZまでの文字 DigitCharacter 0から9までの数字 WordCharacter LetterCharacterとDigitCharacterの結合 PunctuationCharacter 目に見えるすべてのASCII句読点記号 WhitespaceCharacter 空白,タブ,改行 StartOfString 文字列の始まりの前に置かれるバーチャル文字 EndOfString 文字列の終りの後に置かれるバーチャル文字 _ その他の割り当てられていない文字 - NetEncoder["Characters"] は典型的な英語の散文に適しており,表示可能なすべてのASCII文字およびタブ,空白,改行から成る.
- NetEncoder["Characters"]はNetEncoder[{"Characters",{"\t","\n",FromCharacterCode[Range[32,126]]}}]に相当する.
- form が"Index"(デフォルト)であるとき,エンコーダの出力は入力文字列に呼応する整数コードで構成される.
- form が"UnitVector"であるとき,エンコーダの出力は n 次元の単位ベクトルで構成される.i 番目のベクトルは pi 番目の方向にあり,pi は i 番目の文字に呼応するコードである.
- ネットワークの構築時に"port"->NetEncoder[…]を指定すると,エンコーダをネットワークの入力ポートに付加することができる.
- NetEncoder[{"Characters",…}][["Alphabet"]]はエンコーダに認識される文字のリストを作り出す.
- NetDecoder[NetEncoder[{"Characters",…}]]は,指定のエンコーダと同じ符号化によってNetDecoder[{"Characters",…}]を作り出す.
- パラメータ"IgnoreCase"Trueを指定すると,大文字も小文字も同じ値として符号化される.デフォルト値は"IgnoreCase"Falseである.
- デフォルトのパラメータ設定"TargetLength"->Allでは,入力文字列内のすべての文字が符号化される.
- パラメータ"TargetLength"->n を使うと,入力文字列内の最初の n 個の文字は符号化される.n 個未満の場合は充填される.文字のリストにEndOfStringがある場合は.充填値がそれに関連付けられた整数コードになる.それ以外の場合は最後の文字に関連付けられたコードが使われる.