真の実力評価法1

実力の評価法について

実力による選抜システム”がうまく機能する為には、精度の高い評価法が必要になります。まずその評価法についての話から入ります。

評価法には、絶対評価と、相対評価があります。絶対評価とは、あるもの(ここの入るのは人でも物でも何でもよい)のある性質(ここに入るのも性質にあたるものであれば何でも良い、麻雀の強さだったり足の速さだったり背の高さだったり)について評価する場合に、他のものその性質についての評価を考慮せず、特定の指標によって評価する方法です。一方、相対評価とは、評価する場合に、評価の対象になる母集団全体のどのあたりの位置にあるかで評価しようとするもので、一定の割合(上から順番に1位2位3位と評定したり、上から10%までをA、30%までをB・・・というように評定したり)で評定をつける評価法のことです。

A君とB君どちらが足が速いかを比較したいだけであれば、かけっこをすれば事足ります。A君が勝てばA君はB君より足が速いことが言えます。この場合の評価は、相対評価です(母集団はA君とB君の2人、A君が1位、B君が2位というのが評定)。しかし、この評価法では、A君がB君より足が速いことが判るだけで、A君B君がどの程度速いのかは判りません。また、母集団全体をそれぞれ比較する必要がある為、母集団が多すぎると相対評価を行うことが非常に困難になります。そこで出てくる評価法が絶対評価なのです。この場合に特定の指標として用いるのはもちろん、Aさんは100mを12秒で走ったという、”タイム”なのです。

かけっこの”タイム”に相当するような指標が麻雀にもあれば、誰がどのくらい麻雀が強いのかが一目で判り大変便利です。しかし、麻雀において、かけっこにおける時間や背の高さにおける身長のような絶対的指標は存在しません。何故なら、プロ試験で問われるような問題の正答率では麻雀の実力を測定できるとは到底言えず、平均順位や平均収支といった指標で評価すると、対戦相手の実力によって大きく変化してしまうからです。これでは精度の高い評価はできません。

そこで用いられるのがR制度です。特定の実力の場合のRをxとおき、R計算式によって得られるxとの実力差を示した値をyとすると、その人のRはx+yで表されます。R計算式には様々なものがありますが、例えば東風荘では、対戦相手のレベルが同じであった場合、平均順位が0.1違えばRが120差が出るようになっています。

参考文献:あらの(一人)麻雀研究所 「東風荘のRについて

ここで気をつけねばならないのは、Rは対戦相手のRと比較しているから相対評価と誤解してはいけないということです。Rは確かに相対的なものですが、(絶対的な指標が存在し得ないので)、相対的な指標を用いて、上に挙げた定義に基づいた”絶対評価”をしているのです。

参考文献:将棋倶楽部掲示板 「レーティングは絶対評価
(このことについてはこのスレの事務局なる人物の説明が判り易いと思います。この内容を書くことにした理由も、このスレを偶然発見した為でもあります。)

しかし、指標が絶対的でないが故の問題は生じます。1年前の1mと現在の1mで長さが変わることは有り得ませんが、母集団の平均レベル(平均レベルをR1500とおいている)が変われば、1年前のR2000と現在のR2000は実力が違うことになります。しかし、十分な数の構成員が居れば、参加自体に実力による選抜要素が無い(PC環境さえあれば誰でも参加可能)以上、そんなに母集団全体の平均レベルに変化があることはそうないでしょう。よって、これについてはそう問題ではないと思います。

戦績の記録が無い新規の打ち手は実力を評価しようがないので、便宜上どのような実力であれR1500で始める為、十分な試合数をこなさなければ高い精度で評価できないという問題点もあります。また、これにより、平均値のR1500付近の打ち手は実力通りのRの収束し辛いという問題もでてきます(真の実力と見かけのRが大きく違う相手と対戦する可能性が高い為)。これについては、試合数補正によって対処されているわけです。(見かけRが真の実力より極端に上回ったり下回ったりする期間が減る。)

但し、麻雀は運の要素の強いゲームなので、見かけRだけではかなりばらつきが生じ、高い精度で実力を測定できるとは言えません。その問題を解決する為に用いるのが、安定R保証安定Rなのです。

参考文献:システマティック麻雀研究所 「安定R・保証安定R(実力)って何ですか?

とつげき東北HPのスコアランキングはこの保証安定Rを用いており、現時点で麻雀の実力を測る指標として最も精度の高いものであると言えます。

長くなりましたので次に移ります。

inserted by FC2 system