今回は高校数学で日陰に追いやられがちな「データの分析」にスポットを当ててみようと思います。
まず、以下の対応を考えてみようと思います。
平面もしくは空間における零ベクトルではないベクトル , について、 , のなす角を とします。
このとき
等式 が成り立ちます。
( は , の内積を表します。)
また、 を満たします。
次に変量 , の 個のデータの組 , , … , を考えます。( は2以上の整数とします。)
このとき , の標準偏差 , がどちらも でないときに , の相関係数 が次で定義されます。
( は , の共分散を表します。)
ベクトルにおける「内積 」→データの分析における「共分散 」
ベクトルにおける「大きさ 」→データの分析における「標準偏差 」
ベクトルにおける「なす角の余弦 」→データの分析における「相関係数 」
というような対応をふんわりと感じられます。
今回はその部分をもう少し深堀りしてみましょう。
【予備知識】
数学Ⅰ「データの分析」や数学B「ベクトル」をある程度知っていることが望ましいです。
余弦定理もどき*2
定理1
変量 , の 個のデータの組 , , … , を与える。( は2以上の整数とする。)
( )
で変量 を定める。
変量 の分散を と書くと以下の等式が成り立つ。
(ただし(2)は標準偏差 , がどちらも でないときに成り立つ。)
(1)
(2)
(1)はベクトルの等式 に対応します。
(2)は3辺の長さが の三角形における(第2)余弦定理
に対応します。( は辺の長さが となる辺の対角です。)
このことからデータの分析の図形っぽさが垣間見えますね。
(証明)
(2)は(1)が成り立てば、相関係数の定義を用いて簡単に証明できます。
そこで(1)の証明を簡単に説明します。
以下 , , はそれぞれ の平均値を表します。)
このように定義に沿って計算するだけです。
(証明終わり)
三角不等式
定理2
これはベクトルで言うと次の不等式が対応します。
これは一般に三角不等式と呼ばれます。*3
高校数学というよりも様々な「距離」を入れる大学数学ではなじみが深いものですが、そちらへの発展をにおわせるために今回紹介しています。
(証明)
定理1と同様の計算により
と書けます。
そのため
を得ます。
(最後の不等式はコーシー・シュワルツの不等式を用いています。相関係数が定義されるなら相関係数の範囲を用いていると捉えることもできます。)
(証明終わり)
まとめ
今回はデータの分析の図形っぽさを見るためにベクトルとの対応を等式・不等式から捉えてみました。
他にも様々な視点がありますのでいろいろと試してみてはいかかでしょうか。
それでは最後までお読みいただきありがとうございました。