CharacterNormalize

CharacterNormalize["text",form]

text 中の文字を指定された正規化フォームに変換する.

詳細

  • CharacterNormalizeは以下のUnicode正規化フォームをサポートする.
  • "NFD"正準分解(フォームD)
    "NFC"正準分解 + 正準合成(フォームC)
    "NFKD"互換分解(フォームKD)
    "NFKC"互換分解 + 正準合成(フォームKC)
  • CharacterNormalize[text,]text は文字列または文字列のリストでよい.
  • "NFD"と"NFC"では,正準分解は次の4つのタイプの操作を意味する.
  • Å ,記号の分解
    Ȱ Ȱ,記号の分解と順序
    한, ハングル文字をジャモに分解する
    (Ohm) Ω (Omega),文字をその正準Unicode相当にマッピングする
  • "NFKD"と"NFKCでは,互換分解は以下のような操作を意味する.
  • H ,H,フォントの異体の正規化
    (NBSP)(Space), 改行の違いの正規化
    ع, ع, 位置の異体の正規化
    1, 円で囲んだ異体の正規化
    , 幅の異体の正規化
    { ,} , 回転異体の正規化
    i⁹ i9,i₉ i9, 上付き文字/下付き文字の正規化
    アパート, 正方形配置文字の正規化
    ¼ 1/4 , 分数の正規化
    dždž, その他の正規化

例題

すべて開くすべて閉じる

  (5)

正準分解を使って文字列の文字を正規化する:

互換分解を使って文字列の文字を正規化する:

互換分解に続けて正準合成を使って文字列中の文字を正規化する:

正準分解に続けて正準合成を使って文字列の文字を正規化する:

互換分解を使って文字列の文字を正規化する:

付加記号がある文字は分解される:

スコープ  (2)

合成文字をその成分に分解する:

正規化の後では記号と文字の順序が変わっている:

「Ohm」文字をそのコードから得る:

NFDは文字をその正準等価なUnicodeにマッピングする.NFDを使って文字を正規化する:

出力(omega) をその文字コードに変換する:

一般化と拡張  (1)

CharacterNormalizeは要素単位でリストに縫い込まれる:

CharacterNormalizeは異なる文字体系の文字列に使うことができる:

考えられる問題  (1)

互換等価性は,文字の異なる形式を正準形に変換してしまうかもしれない:

互換等価性は,正準相当文字では変わらない形式の違いを取り除いてしまうかもしれない:

Wolfram Research (2020), CharacterNormalize, Wolfram言語関数, https://reference.wolfram.com/language/ref/CharacterNormalize.html.

テキスト

Wolfram Research (2020), CharacterNormalize, Wolfram言語関数, https://reference.wolfram.com/language/ref/CharacterNormalize.html.

CMS

Wolfram Language. 2020. "CharacterNormalize." Wolfram Language & System Documentation Center. Wolfram Research. https://reference.wolfram.com/language/ref/CharacterNormalize.html.

APA

Wolfram Language. (2020). CharacterNormalize. Wolfram Language & System Documentation Center. Retrieved from https://reference.wolfram.com/language/ref/CharacterNormalize.html

BibTeX

@misc{reference.wolfram_2024_characternormalize, author="Wolfram Research", title="{CharacterNormalize}", year="2020", howpublished="\url{https://reference.wolfram.com/language/ref/CharacterNormalize.html}", note=[Accessed: 21-November-2024 ]}

BibLaTeX

@online{reference.wolfram_2024_characternormalize, organization={Wolfram Research}, title={CharacterNormalize}, year={2020}, url={https://reference.wolfram.com/language/ref/CharacterNormalize.html}, note=[Accessed: 21-November-2024 ]}