WordCounts

WordCounts["string"]

キーが string 中の識別可能な単語であり,その値が string 中でのこれらの単語の出現回数を与えるような連想を与える.

WordCounts["string",n]

string 中の n 語の連なりからなる,識別可能な n グラムの数を与える.

WordCounts[{"string1","string2",},]

stringiの数を与える.

詳細とオプション

  • WordCounts[string,]は,TextWordsと同じ方法で string 中の単語を認識する.
  • WordCounts[string,n]では,n グラムの一部とみなされる単語は,空白文字以外の単語ではない記号で分割されることなく,string 中に連続して現れなければならない.
  • WordCountsはオプションIgnoreCaseを有する.IgnoreCase->Trueの設定のとき,文字はすべて,事実上,数えられる前に小文字に変換される.

例題

すべて開くすべて閉じる

  (3)

文字列中の識別可能な単語を数える:

文字列中の識別可能な2グラムの単語列を数える:

各文字列リストの識別可能な単語を数える:

スコープ  (1)

単語には,数字とハイフンを含めることはできるがほとんどの句読点は含められない:

オプション  (2)

IgnoreCase  (2)

デフォルト設定のIgnoreCase->Falseでは,大文字小文字が異なるものとして扱われる:

IgnoreCase->Trueは大文字と小文字は同じものとして扱われる:

大文字小文字の違いは無視して n グラムを数える:

アプリケーション  (2)

アーサー・コナン・ドイル(Arthur Conan Doyle)の数編の小説中で,主人公のシャーロック・ホームズと副主人公のジョン・ワトソンについて言及されている回数を求める:

結果を可視化する:

ExampleDataからミゲル・セルバンテス(Miguel Cervantes)の小説「ドン・キホーテ」を取り出し,経験的なジップ(Zipf)の法則を検証する:

このテキスト中の全単語の頻度表を生成する:

ジップの法則は,単語頻度と頻度表中の順位が両対数スケールでほぼ線形関係になるという.最も頻度が高い1,000単語についてこれを検証する:

結果はに近い.このフィットを実際のデータとともに可視化する:

おもしろい例題  (1)

テキスト本体の最頻20語を求める:

同じことを2グラムの単語列について行う:

Wolfram Research (2015), WordCounts, Wolfram言語関数, https://reference.wolfram.com/language/ref/WordCounts.html (2024年に更新).

テキスト

Wolfram Research (2015), WordCounts, Wolfram言語関数, https://reference.wolfram.com/language/ref/WordCounts.html (2024年に更新).

CMS

Wolfram Language. 2015. "WordCounts." Wolfram Language & System Documentation Center. Wolfram Research. Last Modified 2024. https://reference.wolfram.com/language/ref/WordCounts.html.

APA

Wolfram Language. (2015). WordCounts. Wolfram Language & System Documentation Center. Retrieved from https://reference.wolfram.com/language/ref/WordCounts.html

BibTeX

@misc{reference.wolfram_2024_wordcounts, author="Wolfram Research", title="{WordCounts}", year="2024", howpublished="\url{https://reference.wolfram.com/language/ref/WordCounts.html}", note=[Accessed: 21-November-2024 ]}

BibLaTeX

@online{reference.wolfram_2024_wordcounts, organization={Wolfram Research}, title={WordCounts}, year={2024}, url={https://reference.wolfram.com/language/ref/WordCounts.html}, note=[Accessed: 21-November-2024 ]}