Mathematica > 数据处理 > 文本数据处理 >
Mathematica > 可计算数据 > 语言数据 > 文本数据处理 >
文本数据处理
Mathematica 具有独特灵活的处理大量文本数据的能力. 大多数以字符串形式表示的数据,可以转换为可用 Mathematica 强大的符号语言结构操控的列表或其它结构.
Import 从文件或网络导入数据
"Text", "PDF", "TeX", "HTML" 选取纯文本、表格数据等
FindList 搜寻包含特殊字符串纪录的文件
    
StringSplit 将字符串分离成为单词和句子等
StringCount 计算单词等的出现次数
StringCases 找出匹配字符串模式的实例
    
StringExpression 匹配字符串模式
Sort 按字母顺序排序
Tally 相同字符串的统计数
    
Nearest 从列表中找出最匹配的字符串
FindClusters 求出字符串数据中相应的簇
EditDistance 编辑距离或 Levenshtein 距离
    
SequenceAlignment 在字符串中寻找匹配序列
    
Hash 用不同方案求出散列码
    
DictionaryLookup 在英文和其它字典中查找单词
WordData 找出单词的语义、语法、词汇形态等特性
教程
更多关于
Ask a question about this page  |  Suggest an improvement  |  Leave a message for the team
格式:   HTML  |  CDF