WORDCOUNTは,頻繁に使われる英単語を1位から86800位までランク付けしたサイトです.デザインは「minimalist aesthetic」というだけあって綺麗です.現在のデータ提供元はBritish National Corpusですが,最終的にはインターネット全体からデータ収集を行うことを目指しているようです.そうなれば更に生きたランキングが提供されるでしょう.日本語でも同様のサービスがあれば面白いと思うのですが,どうなのでしょうか.それか,すでにそのようなサービスが存在するのか.最も頻繁に使われる日本語の単語とは,一体何でしょうかね.時々刻々と変化するものかもしれませんが,英単語の場合は1位を「The」が飾っているので,時間的な変化(ブームによる一過性の変化)の影響は思ったより少ないのかもしれません.
ところで,同サイトの説明に面白い記述がありました.
For instance, “God” is one word from “began”, two words from “start”, and six words from “war”. Another sequence is "america ensure oil opportunity".
Godはbeganから1つ目,startから2つ目,そしてwarから6つ目の単語であり,これを繋げると「God began/start war(神は戦争を始めた/始める)」となります(今日現在ではwarのランクが304に変動していますが).聖戦の名の元にテロリズムを繰り返すアルカイダを彷彿とさせるセンテンスです.また別のケースでは,ランキングが「america ensure oil opportunity」という順番になっています.実際のアメリカはイラク戦争などによってこの機会(opportunity)を逃した格好になっている気がしますが,同ランキングではそれを皮肉るような結果となっているのは興味深いです.他にも面白い並びがあるかもしれません.考古学者のように探してみてください.
WORDCOUNT / Tracking the Way We Use Language /
WordCount™ is an artistic experiment in the way we use language. It presents the 86,800 most frequently used English words, ranked in order of commonness. Each word is scaled to reflect its frequency relative to the words that precede and follow it, giving a visual barometer of relevance. The larger the word, the more we use it. The smaller the word, the more uncommon it is.
writeback message: Ready to post a comment.