CharacterNormalize
CharacterNormalize["text",form]
将 text 中的字符转换为指定的规范化形式.
更多信息
- CharacterNormalize 支持以下 Unicode 规范化形式:
-
"NFD" 正规分解 (Form D) "NFC" 先正规分解,再正规合成 (Form C) "NFKD" 兼容分解 (Form KD) "NFKC" 先兼容分解,再正规合成 (Form KC) - 在 CharacterNormalize[text,…] 中,text 可以是字符串或字符串列表.
- 在 "NFD" 和 "NFC" 中,正规分解是指以下四种类型的操作:
-
Å Å,… 分解标记符 Ȱ Ȱ,… 分解标记符并排序 한 한, … 分解韩语文字 (Hangul) 并合成韩语的谚文字母 (Jamo) Ω(Ohm) Ω (Omega),… 将字符映射到等价的正规 Unicode 字符 - 在 "NFKD" 和 "NFKC" 中,兼容分解指的是以下操作:
-
ℌH ,ℍH,… 规范化字型变体 (NBSP)(Space), … 规范化换行 ﻉ ع,ﻊ ع, … 规范化位置变体 ①1, … 规范化圈起来的变体 カカ, … 规范化宽度变体 ︷{ ,︸} , … 规范化旋转过的变体 i⁹ i9,i₉ i9, … 规范化下标/上标 ㌀アパート, … 分解方形字符 ¼ 1/4 , … 规范化分数 dž→dž, … 其他规范化
范例
打开所有单元关闭所有单元
Wolfram Research (2020),CharacterNormalize,Wolfram 语言函数,https://reference.wolfram.com/language/ref/CharacterNormalize.html.
文本
Wolfram Research (2020),CharacterNormalize,Wolfram 语言函数,https://reference.wolfram.com/language/ref/CharacterNormalize.html.
CMS
Wolfram 语言. 2020. "CharacterNormalize." Wolfram 语言与系统参考资料中心. Wolfram Research. https://reference.wolfram.com/language/ref/CharacterNormalize.html.
APA
Wolfram 语言. (2020). CharacterNormalize. Wolfram 语言与系统参考资料中心. 追溯自 https://reference.wolfram.com/language/ref/CharacterNormalize.html 年