WordCounts
WordCounts["string"]
キーが string 中の識別可能な単語であり,その値が string 中でのこれらの単語の出現回数を与えるような連想を与える.
WordCounts["string",n]
string 中の n 語の連なりからなる,識別可能な n グラムの数を与える.
WordCounts[{"string1","string2",…},…]
各 stringiの数を与える.
詳細とオプション
- WordCounts[string,…]は,TextWordsと同じ方法で string 中の単語を認識する.
- WordCounts[string,n]では,n グラムの一部とみなされる単語は,空白文字以外の単語ではない記号で分割されることなく,string 中に連続して現れなければならない.
- WordCountsはオプションIgnoreCaseを有する.IgnoreCase->Trueの設定のとき,文字はすべて,事実上,数えられる前に小文字に変換される.
例題
すべて開くすべて閉じるオプション (2)
IgnoreCase (2)
デフォルト設定のIgnoreCase->Falseでは,大文字小文字が異なるものとして扱われる:
IgnoreCase->Trueは大文字と小文字は同じものとして扱われる:
アプリケーション (2)
アーサー・コナン・ドイル(Arthur Conan Doyle)の数編の小説中で,主人公のシャーロック・ホームズと副主人公のジョン・ワトソンについて言及されている回数を求める:
ExampleDataからミゲル・セルバンテス(Miguel Cervantes)の小説「ドン・キホーテ」を取り出し,経験的なジップ(Zipf)の法則を検証する:
ジップの法則は,単語頻度と頻度表中の順位が両対数スケールでほぼ線形関係になるという.最も頻度が高い1,000単語についてこれを検証する:
テキスト
Wolfram Research (2015), WordCounts, Wolfram言語関数, https://reference.wolfram.com/language/ref/WordCounts.html (2024年に更新).
CMS
Wolfram Language. 2015. "WordCounts." Wolfram Language & System Documentation Center. Wolfram Research. Last Modified 2024. https://reference.wolfram.com/language/ref/WordCounts.html.
APA
Wolfram Language. (2015). WordCounts. Wolfram Language & System Documentation Center. Retrieved from https://reference.wolfram.com/language/ref/WordCounts.html