「本日のセール偏差値ランキング」を見ていて、たまに70を超えるタイトルに出会うことがあります。これって、実際どれくらいレアなことなんでしょうか。
正直に断っておくと、このサイトはまだ始まったばかりで、「過去〇〇日分のデータを集計したら、70超えは〇%でした」というような実測はまだできていません。その代わり、今回は偏差値という仕組みそのものが持つ、理論上の珍しさについて書いてみます。
偏差値の仕組みをおさらい
このサイトの偏差値は、平均が常に50になるように設計されています。そして「標準偏差10」という基準で分布を作っているので、統計的には次のような目安になります。
- 偏差値40〜60の範囲に、全体のおよそ68%が収まる(平均から標準偏差1つ分)
- 偏差値30〜70の範囲に、全体のおよそ95%が収まる(平均から標準偏差2つ分)
これは学校の模試の偏差値でもよく言われる目安と同じ考え方です。つまり偏差値70というのは、理論上「上位2.5%」に入るくらいの珍しさだということになります。単純計算すると、その日100タイトルがセール中なら、70超えは2〜3本くらいしか出ない計算です。
ただし、注意点もある
理論上はそうなのですが、実際にはいくつかズレる要因があります。
- 母集団が毎日たった10〜20タイトル程度しかない:統計的な「上位2.5%」という理屈は、本来もっと多いサンプル数を前提にしています。母集団が少ないと、たまたま強いタイトルが1本入るだけで平均や標準偏差自体が動いてしまい、70超えが出やすい日・出にくい日にばらつきが出ます。
- 本当に正規分布しているとは限らない:セール中のタイトルの「お得度スコア」が、綺麗な釣鐘型に分布している保証はありません。実際にはもっと偏った分布になっている可能性もあります。
なので、「70超え=上位2.5%」というのはあくまで理論上の目安であり、実際の出現頻度とは今後ズレていく可能性があります。
これから検証していきたいこと
このサイトを続けていくと、日々の偏差値データが溜まっていきます。数ヶ月分のデータが溜まったら、
- 実際に70超えがどれくらいの頻度で出ているか
- 曜日やセール時期によって偏りがあるか
といった実測ベースの記事も書きたいと思っています。今回はあくまで「理論編」として、また実測データが溜まったら「実測編」を書く予定です。