データ分析・中級問題チェック
問題 9 /40
ベクトルのノルムに関する説明で、誤っているものはどれか。
選択 1
ノルムとはベクトルの大きさをスカラーで表現したものである。
選択 2
原点(0, 0)とベクトル(4, 3)のマンハッタン距離は「12」である。
選択 3
原点(0, 0)とベクトル(4, 3)のユークリッド距離は「5」である。
選択 4
ノルムは機械学習の正則化で利用される。
解説
選択肢2が正解です。
ノルムとはベクトルの大きさをスカラー(数値)で表現したものです。
この場合のスカラーは距離と考えます。この距離を測る方法で代表的なものが、マンハッタン距離とユークリッド距離です。
【マンハッタン距離】
「マンハッタン = 格子状の街並み = 道に沿って縦横を移動して距離を測る」と考えます。選択肢2のベクトル(4,3)は、原点から右に4移動し、上に3移動するので、足して「7」が正解です。
原点ではなく、例えばA(1,2)とB(4,3)のマンハッタン距離を求める場合は、AとBのxy成分をそれぞれ引いて絶対値にして足します。AからBを引く場合は「1-4=-3」と「2-3=-1」で、それぞれの結果を絶対値にして足すので「4」になります。BからAを引く場合は「4-1=3」と「3-2=1」を足して「4」になります。絶対値にするので各成分を引く方向はどちらでも変わりません。
【ユークリッド距離】
ユークリッド距離は三平方の定理(ピタゴラスの定理)を使って計算します。三平方の定理は、底辺の2乗と高さの2乗を足してルートを付けることで、斜辺の長さを求める計算方法です。問題文の場合は、「4の2乗=16」と「3の2乗=9」を足して25にルートを付けるので、「5」になります。
原点ではなく、例えばA(1,2)とB(4,3)のユークリッド距離を求める場合は、AとBのxy成分をそれぞれ引いて2乗します。BからAを引く場合は、「4-1=3」と「3-2=1」をそれぞれ2乗してルートを付けるので、「√10」になります。各成分を引いて2乗するので、マンハッタン距離と同じで引く方向はどちらでも問題ありません。
ノルムは機械学習の正則化で利用されます。機械学習は、訓練用のデータにモデルがフィットし過ぎると過学習になり、未知のデータに対する汎化性能が低くなることがあります。そこで、正則化項を付けてペナルティを与えると、汎化性能が高いモデルになることがあります。
(公式書籍 p.64)


