2002年4月13日
表紙

ErogameScape−エロゲー批評空間−

メニュー

優しい統計の知識

主な指標について

 統計の勉強をしたことがないと「平均値」ってのがすべてを代表する値と勘違いするのですが、「平均値」というのはあてにならない場合が多いです。まーそんなわけで以下のような指標も参考にしましょうということです。

平均値
 みんなが知っている平均のこと。分布が正規分布の時は信用していいが、エロゲー評価の点数のようにみんなが高い点数を出しているところで一人だけ勘違いして0点とかつけるとあっという間に値が下がったり、みんなが低い点数をとっているところで勘違いして100点とかつけるとあっという間に値が上がったりする値。
中央値
 中央の値のこと。だと、わかんないので説明。例えば(1,1,3,4,4)というデータがあった場合、中央値3になる。ちなみに、(1,1,2,3,5,5)のようにデータが偶数だった場合は、(2+3)/2=2.5と真ん中の2つの値を平均をとる。値の分布が偏っている場合は平均値より中央値の方がその分布を代表している、要するに中央値ってのは誰かがみんなとかけはなれた評価点を出してもみんなの総意を反映しやすい値になる。平均値と中央値がだいたい同じになっている場合は結構いい感じで信用していいと思う。
標準偏差
 受験で重宝するパラメータ。この値が大きいとデータの値のバラツキが大きいということ。要するにこの値が大きいとそのゲームは好みが分かれているということで、この値が小さいとみんなが同じ感じ方をしているということ。このエロゲー評価だと標準偏差が10前後だとバラツキが少ない要するにみんな同じ感じ方をしていると考えていいと思う。
最高値と最低値
 最高値が80で最低値が20とかになっていると、評価が分かれるゲームだなと判断するパラメータ。
データ数
 これが少ないとデータはあんまり当てにならない。少なくとも5つくらいはサンプルが欲しいなあ。

平均値と中央値

 平均値が時としてなんでデータを代表しない値になってしまうかを説明いたします。まず、下のヒストグラムをご覧ください。多分、小学生か中学生の時に書かされたことがあると思います。
正規分布のヒストグラム偏った分布のヒストグラム
 X軸が点数でY軸がその点数を出した数とします。例えば左側のグラフで10点を出したのは1つ、となります。
 左の綺麗な山形になっている分布のことを正規分布といいます。こういうグラフになっている時に平均値を出すと、50となります。この50という数値はこのヒストグラムを代表する値と思えるので使える数値です。
 しかし右側の左に偏ったグラフで平均値を出すと平均が30になってしまいます。しかし、感覚的には「これは10点と20点の人が多いから15点くらいがこのヒストグラムを代表する値としては妥当なんじゃないか?」と思います。こんな時には中央値を使います。中央値というのは上に書いたように中央の値です。で、このヒストグラムで中央値を出すと15点となり我々の感覚にあっています。したがって偏ったグラフの場合は中央値を使うべきだということが分かります。

 エロゲーの評点の場合、みなさんが感想を読む人のことを考えて「自分の独断と偏見でなく、みんながこれを面白いと思うかどうか」で点数をつけていただくと、多分綺麗な分布である左側のようなグラフになるのですが「おれはこのゲームが大好きだ、だから100点」とか「誰がなんといおうとおれはこのゲームが嫌いだ、だから10点」なーんてつけちゃうので、どうしても突拍子もない点数が出現し、平均値が我々の感覚に合わないものとなってしまいます。そんなとき、中央値を見るといいかなーってことです。ちなみにデータ数が少ないんで平均値も中央値も何もない気もしますが(爆

この統計の主旨と得点の取得の仕方と免責事項とか

この統計の主旨について

 エロゲーを一年ぶりに購入しようと思いました。しかし最近流行っているゲームが分からない。しょうがないので感想ページを片っ端から見ていいゲームを記録しようと思いましたが、あまりの感想ページとゲームの多さに閉口してやめました。
 もし、全部のページの得点集めて集計して「インターネットでのエロゲー評価の総意」が分かるページがあるといいなあなんて思いました。そこで作ったのがエロゲー評価統計情報でした。
 エロゲー評価統計情報の対象者は「エロゲーを買いたいけど、どれを買っていいか分からない方」「毎日、感想ページの更新履歴を見てゲームをチェックするのが面倒な方」「エロゲー雑誌がたまりにたまってしまって処分に困るから買わなくなったため情報が入らなくなった方」「自分の好きなゲームがインターネットでどのように評価されているか興味がある方」です。毎日ちゃんと各感想ページの評価をチェックしている方には無縁のページです。
 そののちCinemaScape?映画批評空間?のエロゲー版を作るかなーと思いまして、作ったのがErogameScapeです。

このサイトの生い立ちについて

 エロゲー評価統計情報は最初Excel統計した結果をHTMLにぺたぺた貼っていたのですが、麦ねこさんに「平均順にも並べられない統計表で拍子抜け」みたいなことを言われた?ので、悔しかったのでPHPとPostgreSQLを使って統計表からデータベースに転向。
 そののち2chのレビューサイトをレビューするスレに「エロゲーにもCinemaScape?映画批評空間?みたいなのがあったらいいなあ」という話がちょろっとあって「あ、それいいなあ」と思って現在にいたります。

免責事項

 このページの評価点が高かったから買ったけどつまんなかったから訴訟をおこして賠償請求してやる、というたぐいは却下です。統計情報というのは、見てそれを自分で解釈しないと駄目です。ゲームを購入するときは自分の責任で購入してください。関係ないですけどエロゲー雑誌の評価でいいやつを買ったら滅茶苦茶つまんなかったってのが一度や二度じゃすまないでいるのは気のせいでしょうか。

得点の取得の仕方

 ゲーム購入への道さんとX-NavigatorさんとGATE DIVEさんに登録されているサイトと私がたまたま発見したサイトの中でエロゲーを得点で5段階以上で評価しているサイトを利用しています。
 得点はすべて私が勝手に100点満点に換算して、平均値、中央値などを出しています。
 ちなみに、サイトによっては50点が普通だったら30点が普通だったりと基準がいろいろです。そんなことおかまいなしに集計しています。
 ☆が最高5つとかのサイトの場合は、☆一つが20点。☆二つが40点とか勝手に解釈して点数つけちゃってます。
 私の記憶が確かならば元の分布が正規分布でなくても、たくさん分布を重ねあわせると正規分布に近似できるようになるという法則があった気がするので、たくさんデータをもってくればOKと思ってます。

数字を暖かく見るために

前置き

ミス日本一を選ぶ審査員はどのように評価を下すか

 ミス日本一を選ぶ場合、審査員は日本を代表してミスを選ばなければなりません。したがって、自分的には1番がいいと思っていても、日本の多くの方が2番を選ぶであろうと思われるなら2番を選ばないと駄目です。それが審査員です。

じゃあエロゲーの場合はどうなの?

 多分、私を含めて自分の主観が多かれ少なかれ入っていると思います。なので、統計をとった場合「みなさんの代表となる値がでるか?」と言われると「そりゃ、でないっす」と言うしかないのですが、それでも全体の傾向はつかめると思ってます。なんとなく、ちまたで受けているゲームは一応「統計的にお勧め」になっていますよね。

本題

統計の限界

 統計ってのは数字です。よって数字で表せないものは表せません。その昔All Boys Believe Anythingの志賀有樹朗さんが日記でおっしゃってたように突出したものは統計化されないです。俺は「ONE」が大好きだ、だからいつもは10点満点だけど「ONE」は点数で評価できないぜ、と思っても集計上は10点にせざるを得ません。これは、統計の限界です。
 また、みんながおもしろくないゲームと思っていても、数値を取得したサイトがみんないい点数を出していたら、いいゲームになってしまいます。これも統計の限界です。

数字は冷たい

 文章で書かれた感想はそれを書いた方の感じ方がもろに伝わってきます。「ほんとに面白かったんだなあ」とか「めっちゃつまんなかったんだろうなあ」ってのが分かります。その結果「○○点」と書いてあると、ああなるほどなと納得するわけです。
 でも、統計のように数字だけが「○○点」と並んでいると、何か冷たい感じがしますし、その数字が出た過程をいっさいがっさい無視するので、不気味と言えば不気味です。

統計情報のうまい使い方

 でも、この統計の限界と数字の冷たさを知ってから、数字を見ると今まで見えなかったものが見えるのも事実だと思います。また数字をみて再確認する事項もあると思います。
 そんなわけで、数字の性質をある程度知っていただいたあとに統計をみていただくとうれしいです。数字を見て鵜呑みにするのではなくて、その数字の意味を考えると、少しは数字も暖かく見えてきませんか?  ・・・見えませんか  ・・・うぐぅ

終わりに

終わりに

 感想を書かれている方々は、みなさんに感想を読んでもらいたいと思いますし、良いゲームでしたら良さが伝わるように一生懸命感想を書くと思うのですが、すべての感想を読める方はそうそういないと思って作ったものですので、その主旨を理解していただけると幸いです。
 居心地が悪くなってしまいますのは、すみません、どうしようもないです・・・

おまけ

 私は数字が大好き(数学は好きではないですが)で「国語の答えってのは一つじゃないから嫌だ」な人間です。そこを加味して頂けるとありがたいかなあと思います。

▲上へ


表紙
 ひろいん
 erscape @ apost.plala.or.jp