2013年08月24日

ビートマニアのスコアを評価する(1)

一言でいえば、冥+卑弥呼+PP+灼熱 という方式の付け方じゃダメっていうこと
どういう評価をすべきか、という点について考えましょう。

要約
1.スコアの足し算→マラソンのタイム+100mのタイム?
2.MAXや歴代TOPに近いほど1点の重み付けが高くならないとおかしい(人は人類の限界でワクワクする理論)

前振り−ビートマニアのスコア評価について

評価といっても難しいものではなく、単純に比べることからスタートしたい

たとえばFLY ABOVE2023点と穴冥3555点のどっちがすごいか?
たとえば穴冥3400点と、AA3400点の、どっちがすごいか?

という疑問があったとしよう
(別にSecrets7落ちとVANESSA20落ちとGO BEYOND56落ちの比較でもいいが)

同じ3400点でも全く比較しようがないのである。
アボベと穴冥では全く尺度が違って比較しようもない

たとえば、100m走が10.50秒で、800m走が2分00秒だとして、平泳ぎ100mが70秒だとする。
どれが優れているかを比較することは、
なんらかのデータの加工をしないと出来ないはずである

今回の連載テーマは
「冥とAAとアボベの3曲のスコアがあったとき、誰が一番すぐれているかはっきり評価する」
でお送りします。

まずアボベ2000点と冥3400点に点数を付けて評価できるようになり、
それから複数曲合計スコアの評価方法について考えよう。
まずはスコア評価はどうあるべきか?という点から考える。

冥、AA、アボベ = 3556,3400,2010 の人と、
冥、AA、アボベ = 3600,3380,2000 の人と、
冥、AA、アボベ = 3400,3500,2032 の人が居たとする

この3人の実力に順番をつけて評価することは出来ないだろうか。
古くからあるやり方だと、
冥+AA+アボベ のスコアランキング という方法がある。
(さっきのスポーツのタイムで例えるとトライアスロンみたいな測り方)


1.単純な合計点の評価はおかしい
この方法は、ノーツが多い曲ほど、みんなのスコアが低い曲ほど、大差が付きやすく過大に評価される点が問題である

考えてみれば、
「マラソン42.195kmのタイム+100m走のタイム ランキング!!!
長距離と短距離の総合力がわかる!!!」
とか言っても何の意味も無いよねっていうこと

大会とかで、ノーツ少ない曲(たとえば☆1とか)を投げる人が居ないのはノーツが少ない曲でいくら勝っても、
点数の合計で勝敗が付くんだったら相手の曲で付いた点差で結局負けちゃうから。

つまり、曲の点数の単純な合計では実力が正しく評価できない

ひとつの改善策は、スコアをそのまま合計するのではなく、スコアをパーセントにして合計してみるという策。
#30ASAというサイトで☆1〜☆12まで、課題曲30曲のスコアアタックをしたときはこの方法でやりました。
☆1のキーポンNで190点だろうが195点だろうが、☆12の穴冥3000点か3100点かの前では些細なように感じますが、
キーポンは1点が0.5%くらいあるのに対し、穴冥は1点が0.025% つまり1点の重みに20倍の差がありました。
キーポンを5点詰めることが穴冥の100点に相当するわけです。
低難易度を詰めることも大きなウェイトを占めたので一部の参加者は不満顔でしたが、低レベルからしっかりスコア地力を上げるという観点では良いアイデアだったと思います。

実は冥卑弥呼PP灼熱合計スコア問題ではここの問題はあんまり無いです。
どれもノーツが2000近い曲で、ノーツが少ない灼熱も差がはっきり出るので、なんとなくみんなこの方法で納得はしていた。
大会も多くはスコアの単純な合計点なので、なんだかそれっぽい感じもする。

しかし本当に実力を考える上ではこれでは問題が出てくる。
それが発狂勢の存在。

冥+卑弥呼+PP+灼熱ランキングとか作るとTAKA.Sは灼熱1曲が苦手なせいですごく順位が下がる(20位くらいになる)が、
それでTAKA.Sの実力が全国で上から数えて20番程度でしかない、と思う人は居ないだろう(沢山の歴代TOPを持ち5本の指に入るような優れたプレイヤーだ)
ということです。

灼熱以外の4曲は全国5本クラスなのに灼熱が苦手なだけで20位というのはおかしくないでしょうか。ビーマニ収録曲は灼熱以外の曲の方が多いはずです。


2.MAXに近いほど高い評価を受けるべき(かつMAXから遠ければ評価上切り捨てるべき)
アボベ2032点(理論値) 灼熱AA の人と、
アボベ2000点 灼熱AA+50 の人では、どちらの方がより優れているかと聞かれれば
俺は前者だと思います。
MAXのスコアは誰にも破ることが出来ない到達点であり、灼熱AAはありふれたスコアだからです。
後者の方が合計で18点高いから上手いと思う人は多分居ないでしょう。

大学入試で100点0点より55点55点の方が点数が高いというのとは訳が違います
(大学入試は最初から合計点で評価することがルールだけど、ビーマニのスコアは合計点勝負をするというルールではない)


「人間の限界、人間のフロンティア」を超えることに称賛が集まる(ワクワクする)
「今まで誰も○○を達成していない」から、「○○を達成することに大きな価値がある」のです。

「世界で初めてフルコン」
「歴代TOPのスコア」

こういうことが、人々の称賛を集める。わくわくできる。
二番煎じではその注目度は大きく下がってしまう。

TAKA.Sが冥AAA+200 灼熱AA-200点 だったとして、
あるプレイヤーが冥AAA 灼熱AA だったとき、
TAKA.Sよりそのプレイヤーの方が優れていると考える人は少ないと思います。
穴冥AAA+200はワクワク出来ます(歴代TOPからわずか50点差です)が、灼熱AAはワクワク出来ないからです。

スコアの合計という「総合力」で片づけてしまえばそれまでですが、
そもそも灼熱AAだったりAA-200なんていうスコアは、ランカー同士を比較するならどちらも0点ないしは低い点数で切り捨て
とするのが正しいのではないでしょうか
(もちろん公式大会では同点の評価になってしまいますが、それはむしろ公式大会の評価方法がおかしいのです)

きちんとワクワクを反映するスコア評価にするために、
たとえば指数関数的に評価するというのが私の案です。

もうここまで書いて疲れたので続きはまた別の機会に。

posted by ロボたいしょう at 01:24 | Comment(0) | ゲーム | このブログの読者になる | 更新情報をチェックする
この記事へのコメント
コメントを書く
お名前:

メールアドレス:

ホームページアドレス:

コメント: