CharacterNormalize
CharacterNormalize["text",form]
text 中の文字を指定された正規化フォームに変換する.
詳細
- CharacterNormalizeは以下のUnicode正規化フォームをサポートする.
-
"NFD" 正準分解(フォームD) "NFC" 正準分解 + 正準合成(フォームC) "NFKD" 互換分解(フォームKD) "NFKC" 互換分解 + 正準合成(フォームKC) - CharacterNormalize[text,…]の text は文字列または文字列のリストでよい.
- "NFD"と"NFC"では,正準分解は次の4つのタイプの操作を意味する.
-
Å Å,… 記号の分解 Ȱ Ȱ,… 記号の分解と順序 한 한, … ハングル文字をジャモに分解する Ω(Ohm) Ω (Omega),… 文字をその正準Unicode相当にマッピングする - "NFKD"と"NFKCでは,互換分解は以下のような操作を意味する.
-
ℌH ,ℍH,… フォントの異体の正規化 (NBSP)(Space), … 改行の違いの正規化 ﻉ ع,ﻊ ع, … 位置の異体の正規化 ①1, … 円で囲んだ異体の正規化 カカ, … 幅の異体の正規化 ︷{ ,︸} , … 回転異体の正規化 i⁹ i9,i₉ i9, … 上付き文字/下付き文字の正規化 ㌀アパート, … 正方形配置文字の正規化 ¼ 1/4 , … 分数の正規化 dž→dž, … その他の正規化
例題
すべて開くすべて閉じる例 (5)
スコープ (2)
一般化と拡張 (1)
CharacterNormalizeは要素単位でリストに縫い込まれる:
CharacterNormalizeは異なる文字体系の文字列に使うことができる:
Wolfram Research (2020), CharacterNormalize, Wolfram言語関数, https://reference.wolfram.com/language/ref/CharacterNormalize.html.
テキスト
Wolfram Research (2020), CharacterNormalize, Wolfram言語関数, https://reference.wolfram.com/language/ref/CharacterNormalize.html.
CMS
Wolfram Language. 2020. "CharacterNormalize." Wolfram Language & System Documentation Center. Wolfram Research. https://reference.wolfram.com/language/ref/CharacterNormalize.html.
APA
Wolfram Language. (2020). CharacterNormalize. Wolfram Language & System Documentation Center. Retrieved from https://reference.wolfram.com/language/ref/CharacterNormalize.html