文本数据处理

Mathematica 具有独特灵活的处理大量文本数据的能力. 大多数以字符串形式表示的数据,可以转换为可用 Mathematica 强大的符号语言结构操控的列表或其它结构.

参考资料参考资料

Import 从文件或网络导入数据

"Text", "PDF", "TeX", "HTML" 选取纯文本、表格数据等

FindList 搜寻包含特殊字符串纪录的文件

StringSplit 将字符串分离成为单词和句子等

StringCount 计算单词等的出现次数

StringCases 找出匹配字符串模式的实例

StringExpression 匹配字符串模式

Sort 按字母顺序排序

Tally 相同字符串的统计数

Nearest 从列表中找出最匹配的字符串

FindClusters 求出字符串数据中相应的簇

EditDistance 编辑距离或 Levenshtein 距离

SequenceAlignment 在字符串中寻找匹配序列

Hash 用不同方案求出散列码

DictionaryLookup 在英文和其它字典中查找单词

WordData 找出单词的语义、语法、词汇形态等特性

New to Mathematica? Find your learning path »
Have a question? Ask support »