CharacterNormalize

CharacterNormalize["text",form]

text 中的字符转换为指定的规范化形式.

更多信息

  • CharacterNormalize 支持以下 Unicode 规范化形式:
  • "NFD"正规分解 (Form D)
    "NFC"先正规分解,再正规合成 (Form C)
    "NFKD"兼容分解 (Form KD)
    "NFKC"先兼容分解,再正规合成 (Form KC)
  • CharacterNormalize[text,] 中,text 可以是字符串或字符串列表.
  • 在 "NFD" 和 "NFC" 中,正规分解是指以下四种类型的操作:
  • Å ,分解标记符
    Ȱ Ȱ,分解标记符并排序
    한, 分解韩语文字 (Hangul) 并合成韩语的谚文字母 (Jamo)
    (Ohm) Ω (Omega),将字符映射到等价的正规 Unicode 字符
  • 在 "NFKD" 和 "NFKC" 中,兼容分解指的是以下操作:
  • H ,H,规范化字型变体
    (NBSP)(Space), 规范化换行
    ع, ع, 规范化位置变体
    1, 规范化圈起来的变体
    , 规范化宽度变体
    { ,} , 规范化旋转过的变体
    i⁹ i9,i₉ i9, 规范化下标/上标
    アパート, 分解方形字符
    ¼ 1/4 , 规范化分数
    dždž, 其他规范化

范例

打开所有单元关闭所有单元

基本范例  (5)

用正规分解规范化字符串中的字符:

用兼容分解规范化字符串中的字符:

先用兼容分解,再用正规合成规范化字符串中的字符:

先用正规分解,再用正规合成规范化字符串中的字符:

用兼容分解规范化字符串中的字符:

有变音符号的字符已被分解:

范围  (2)

分解复合字符:

规范化后标记和字符的顺序已改变:

用代码获取 "Ohm" 字符:

NFD 将字符映射到其规范等效的 Unicode. 用 NFD 规范化字符:

将输出 (omega) 转换为字符代码:

推广和延伸  (1)

CharacterNormalize 可逐项作用于列表的各个元素:

CharacterNormalize 适用于不同的字体及不同字母组成的字符串:

可能存在的问题  (1)

兼容等价转换可能会将不同形式的字符转换为同一种规范形式:

兼容等价转换可能会移除格式上的区别,而在正规等价转换时字符中的这些区别则被保留:

Wolfram Research (2020),CharacterNormalize,Wolfram 语言函数,https://reference.wolfram.com/language/ref/CharacterNormalize.html.

文本

Wolfram Research (2020),CharacterNormalize,Wolfram 语言函数,https://reference.wolfram.com/language/ref/CharacterNormalize.html.

CMS

Wolfram 语言. 2020. "CharacterNormalize." Wolfram 语言与系统参考资料中心. Wolfram Research. https://reference.wolfram.com/language/ref/CharacterNormalize.html.

APA

Wolfram 语言. (2020). CharacterNormalize. Wolfram 语言与系统参考资料中心. 追溯自 https://reference.wolfram.com/language/ref/CharacterNormalize.html 年

BibTeX

@misc{reference.wolfram_2024_characternormalize, author="Wolfram Research", title="{CharacterNormalize}", year="2020", howpublished="\url{https://reference.wolfram.com/language/ref/CharacterNormalize.html}", note=[Accessed: 21-November-2024 ]}

BibLaTeX

@online{reference.wolfram_2024_characternormalize, organization={Wolfram Research}, title={CharacterNormalize}, year={2020}, url={https://reference.wolfram.com/language/ref/CharacterNormalize.html}, note=[Accessed: 21-November-2024 ]}