|
SOLUTIONS
|
MATHEMATICA 指南
文本数据处理
Mathematica 具有独特灵活的处理大量文本数据的能力. 大多数以字符串形式表示的数据,可以转换为可用 Mathematica 强大的符号语言结构操控的列表或其它结构.
精选实例精选实例 |
-
Analyze Words in a Block of Text
-
Cluster Similar Words
-
Find Successive Nearest Words in Text
-
Fit Word Length Data to Distributions
-
Model Word Lengths by Binomial Distributions
-
Search Files for Text
-
Use Character Codes to Extract Special Characters from Text
-
Word Length Distribution in Various Languages
参考资料参考资料
Import — 从文件或网络导入数据
"Text", "PDF", "TeX", "HTML" — 选取纯文本、表格数据等
FindList — 搜寻包含特殊字符串纪录的文件
StringSplit — 将字符串分离成为单词和句子等
StringCount — 计算单词等的出现次数
StringCases — 找出匹配字符串模式的实例
StringExpression — 匹配字符串模式
Sort —按字母顺序排序
Tally — 相同字符串的统计数
Nearest — 从列表中找出最匹配的字符串
FindClusters — 求出字符串数据中相应的簇
EditDistance — 编辑距离或 Levenshtein 距离
SequenceAlignment — 在字符串中寻找匹配序列
Hash — 用不同方案求出散列码
DictionaryLookup — 在英文和其它字典中查找单词
WordData — 找出单词的语义、语法、词汇形态等特性
Mathematica 9 is now available!
New to Mathematica?
Find your learning path »
Have a question?
Ask support »
