305 マハラノ距離予測プログラム
(1)要旨
このプログラムは、多変量データにおいて、基準データのマハラノ距離から、予測データの
マハラノ距離を計算し、どのデータが外れ値になるかを予測するときに使用します。
   
サンプルデータ マハラノ距離結果
基準データ Q1 Q2 Q3 Q4 A 1.62
A 13 11 5 3 B 0.628
B 13 9 3 5 C 0.141
C 16 10 4 8 D 0.304
D 17 10 5 9 E 1.769
E 21 11 2 10 F 0.347
F 17 10 6 8 G 0.978
G 21 11 8 10 H 1.778
H 20 12 2 14 J 1.436
J 25 14 7 12 x1 0.978
x2 3.675
予測データ Q1 Q2 Q3 Q4 x3 1.463
x1 21 11 8 10
x2 20 12 7 14   平均値 標準偏差
x3 25 14 6 12 Q1 18.111 3.755
ここで、Qは変数(属性です。) Q2 10.889 1.37
Q3 4.667 2
Q4 8.778 3.154
(2)プログラムでの処理方法
このプログラムでは右図のダイアログに基準データ
を指定します。
なお、基準データ行列の制限は500行x200列です。
同様に、予測データを指定します。
なお、予測データ行列の制限は50行x200列です。
また、ラベルの有無をチェックします。
この制限の拡張は、有償にて承ります。
 
出力先としてセルの位置を指定します。
図表示を「あり」とすると、シートの中央に表示されます。
このプログラムでのポイントは、マハラノビス距離を
求めることです。
従って、まず、基準データ行列AAを読込みます。
その相関係数行列RRを求めます。
AA行列の標準化を行います。
次に示す関係式を用いてマハラノビス距離を計算します。
   マハラノビス距離=AA行列*RRの逆行列*AAの転置行列/変数の個数
基準データ Q1 Q2 Q3 Q4 標準化した基準データAA
A 13 11 5 3   Q1 Q2 Q3 Q4
B 13 9 3 5 A -1.361 0.0811 0.1667 -1.832
C 16 10 4 8 B -1.361 -1.379 -0.833 -1.198
D 17 10 5 9 C -0.562 -0.649 -0.333 -0.247
E 21 11 2 10 D -0.296 -0.649 0.1667 0.0704
F 17 10 6 8 E 0.7694 0.0811 -1.333 0.3875
G 21 11 8 10 F -0.296 -0.649 0.6667 -0.247
H 20 12 2 14 G 0.7694 0.0811 1.6667 0.3875
J 25 14 7 12 H 0.5031 0.8111 -1.333 1.6555
標準偏差 3.7548 1.3699 2 3.1545 J 1.8347 2.2711 1.1667 1.0215
平均値 18.111 10.889 4.6667 8.7778
相関RR Q1 Q2 Q3 Q4
Q1 1 0.8017 0.2861 0.8464 AA行列*逆行列の結果=BB
Q2 0.8017 1 0.2704 0.6114 1行目 -2.256 2.9599 -0.039 -1.733
Q3 0.2861 0.2704 1 -0.029 2行目 0.5499 -0.926 -0.773 -1.119
Q4 0.8464 0.6114 -0.029 1 3行目 -0.89 -0.418 0.0566 0.7636
4行目 -1.217 -0.928 0.8155 1.6921
相関行列の逆行列 5行目 6.5824 -1.942 -2.811 -4.079
8.5269 -3.054 -1.772 -5.402 6行目 -0.391 -1.128 1.1071 0.8063
-3.054 2.9355 0.1032 0.7931 7行目 1.2666 -1.632 1.7564 0.365
-1.772 0.1032 1.5224 1.4813 8行目 -4.767 2.02 -0.385 4.4441
-5.402 0.7931 1.4813 5.1303 9行目 1.123 1.9942 0.2728 -1.14
BB行列の1行目*AAの置換行列の乗算を行い、結果を4で割ると(変数の個数が4個)、
次に示すマハラノビスの距離が得られます。
A B C D E F G H J
1.62 0.628 0.141 0.304 1.769 0.347 0.978 1.778 1.436
上の表で、最大値はH項目の1.778です。
従って、このH項目の「1.778」が、外れ値の基準閾値となります。
次に、予測データについても同様な計算を行います。結果は次のとおりです。
x1 x2 x3
0.978 3.675 1.463
この表のX2項目のマハラノビス距離は基準閾値より大きいので、外れ値と判断します。

Download
デモ

ご購入はこちらからどうぞ
(インフォカートの決済画面が表示されます)

特定商取引法に基づく表記

その他お問い合わせ

 

ダウンロード前に必ずお読みください!

  • ダウンロードは、「Downloadデモ」をクリックして下さい。ダウンロード後、HDD内の任意の場所で解凍してご利用下さい。
    Windows LZH形式の圧縮ファイルです。LZH形式対応のファイル圧縮解凍ソフトが別途必要です。「+Lhaca」などフリーウェアもインターネット上では配布されておりますので、ご利用下さい。
  • ご使用にあたり、Windows(R)版 Microsoft(R) Excel(R)97以降(Excel2000以降推奨)のバージョンで、Excelが通常動作できる程度のRAMとHDD容量が必要です。また、分析ツールが稼動することが必要です。「分析ツール-VBA」をアドインさせて下さい。
  • 本ソフトウエアの営利目的の譲渡を禁じます。本ソフトウエアに対する解析、リバースエンジニアリング、逆アセンブル、修正等は一切禁止します。
  • 本ソフトウエアの導入によって生じた損害等につきましては、著作権者は一切の責任を負い兼ねます。また、本ツールのご使用に基づく解析経過や結果におきましては、ご自身のリスクと判断でご活用下さい。解析結果及び直接の損害・不便のほか、第三者の不便等一切の責任を負いかねます。予めご了承下さい。
  • ファイルのアップロードの時点で、出来る限りのウィルス対策を施しておりますが、アップロード後に発見されたウィルス等により、検知できない場合がございます。ご使用前には、ご自身の責任と費用負担において、必ずウィルスチェックを行ってください。

以上の項目に同意いただける場合は、ダウンロードを実行してください。同意いただけない場合、ダウンロードはご遠慮ください。ご了承お願いいたします。