Mathematica 9 is now available
THIS IS DOCUMENTATION FOR AN OBSOLETE PRODUCT.
SEE THE DOCUMENTATION CENTER FOR THE LATEST INFORMATION.
Mathematica > 数据处理 >
Mathematica > 计算数据 > 语言数据 >
文本数据处理
Mathematica 具有独特灵活的处理大量文本数据的能力。大多数以字符串形式表示数据,可以用 Mathematica 强大的符号语言能力,将其转换为列表或其它操控结构。
Import 从文件或网络输入数据
"Text", "PDF", "TeX", "HTML" 选取普通文本、表格数据等
FindList 搜寻包含特殊字符串纪录的文件
    
StringSplit 将字符串分离成为单词和句子等
StringCount 计算单词等的出现次数
StringCases 找出匹配字符串模式的实例
    
StringExpression 匹配字符串模式
Sort 按字母顺序排序
Tally 相同子符串的统计数
    
Nearest 从列表中找出匹配的最近字符串
FindClusters 求出字符串数据中相应的簇
EditDistance 编辑距离或 Levenshtein 距离
    
SequenceAlignment 在字符串中寻找相符序列
    
Hash 用不同方案求出 hash 码
    
DictionaryLookup 在英文字典中查找单词
WordData 找出单词的词义、词法等特征
教程
更多关于
Ask a question about this page  |  Suggest an improvement  |  Leave a message for the team