集計トップへ戻る

★★★ 集 計 の お き て ★★★

 品詞ごとのルール。

◆ 名詞

 可算名詞は単数形になおして集計する。

◆ 代名詞

 不定代名詞(something、nothing など)のみを集計の対象とする。人称代名詞(I、you、she など)、関係代名詞(that、which など)、指示代名詞(this など)、疑問代名詞(when、where など)は集計の対象としない。

◆ 動詞

 be、have、do は集計の対象としない。また、gonna も「助動詞」と見なし、集計の対象とはしない。get は集計対象とするが、(have) got は、本動詞の場合 have や do と意味が似通っており、さらに(have) got to (=gotta)の形でも助動詞と見なせるので、対象としない。
 現在分詞、過去分詞の分詞構文や形容詞用法は動詞の本来の意味を残しているので、「動詞」になおして集計する。ただし、動名詞は「名詞」と見なす。
 want ⇔ wanted や use ⇔ used のように意味がかなり異なる分詞派生の形容詞はもちろん別の単語と見なす。let's(=let us)、gimme (=give me) 、 c'mon (=come on)、wanna (=want to)といった特殊な形はそれぞれ let、give 、come、want に含める。

◆ 助動詞

 すべて集計の対象としない。used to (昔〜していた)はここに含む。

◆ 形容詞

 比較級、最上級は原級に戻して集計する。ただし、good/well - better - best 、bad/badly - worse - worst 、much/many - more - most 、late - later/latter - last/latest、little - less - least はそれぞれ別に集計する。口語助動詞 better(〜したほうが良い)も形容詞の better と意味的には同じなので含める。また、冠詞に近い機能をもつ any、some、no、all などは対象としない。

◆ 副詞

 in や on など、前置詞と紛れやすく、句動詞の一部としても機能しうる語は集計対象としない。否定辞 no、not 、意味の軽い副詞である here、there、then なども除く。

◆ 数詞

 集計の対象とする。ここには、代名詞の one も含める。

◆ 冠詞、前置詞、接続詞、間投詞

 すべて集計の対象としない。

 また、タイトルも歌詞のうちとし、数に含めることにする。例えば、GUNS N' ROSES の "Welcome To The Jungle" だったら、Welcome が1回、Jungle が1回ずつ数に加わることになる。

今回の集計方法の注意点

 love は名詞、動詞ともによく使われる。このように品詞を越えてよく使われる言葉は、品詞に関係なく同じ語として集計する。この集計ではどんな英単語が好まれるか、ということが重要なので、動詞の love と名詞の love どちらがよく使われるか、ということはさして大きな問題にはならないからである。ただし、上でも言っているように、同綴異義語の場合(like、spring など)は、別に集計する。

 もうひとつ注意したいのは、サビの部分の問題である。例えば、IRON MAIDENの曲 "The Evil That Men Do" の場合、サビのフレーズ"The evil that men do lives on and on" が4回くりかえされる。すると、歌詞への書かれ方に違いが出てくる可能性がある。

【パターンA】
The evil that men do lives on and on
The evil that men do lives on and on
The evil that men do lives on and on
The evil that men do lives on and on

【パターンB】
The evil that men do lives on and on (Chorus: repeat 4 times)

【パターンC】
The evil that men do lives on and on

 このように、同じフレーズなのに、何通りかありうる。今回はこのような場合、Aは各単語4回、Cは1回と数える。Bは4倍するという手もあるが、1回と数えてしまう(もちろん、"Chorus:〜"以下は含めない)。なぜなら今回の集計の趣旨はあくまでどんな英単語が好まれるかということである。上のような歌詞の場合、「のべ語数」では差が出るものの、「現れ語数」では差は生じない。「現れ語数」のほうがより趣旨に合った数値なので、書かれたままを数える方法で集計していく。

 ★語数についてはここを見てください