上田データマイニング塾から
ハロー!データマイニングへ
上田データマイニング塾を監修された上田太一郎先生のコンセプトを継承する意味を込めて、Webサイトを立ち上げた時に寄せられた上田太一郎先生のメッセージを、以下に残しておきます。掲載しておきます。
上田メッセージ
データマイニングとは、データをマイニング(採掘)して
宝物を見つけるプロセス・手法のことです。
データマイニングの醍醐味は、「うまく」「安く」「早く」「楽しく」です。
Excelは、「安く」「早く」使えるデータマイニング・ツールです。
Excelは、「分析ツール」を搭載していて、これを「うまく」使いこなすことで、
「楽しく」宝物(情報、知見、知識、仮説、課題など)が得られます。
特に、予測問題などを解決する極めて有用な統計手法である回帰分析法がExcelで サポートされています。
Excelでもかなりのことができることは意外に知られていないのです。
とはいえ,勿論それですべてが可能というわけでもありません。
サポートされていない分析手法は、オリジナルのツール(アドイン・ソフト)を開発して、 できるだけ易く かつ安く対応していければ、その世界はさらに、おおきく広がります。
理論よりも実践!
自転車に乗ることに例えると、自転車の運動理論、自転車の設計・開発・テストなどは統計学者に任せてください。
皆さんには、自転車に、うまく、簡単に、早く、楽しく、乗っていただきたい。
それがこの塾の基本指針です。
そして、データマイニングで日本を元気にしたい!
データマイニングの輪をいっぱい広げたい!そんな大志を抱いています。
皆さんのお問い合わせ、ご参加をお待ちしております!
この塾で挑戦したいこと! ・・・「学習」「開発」「分析」
データマイニングは「大量のデータの中から、有益なものを掘り出して活用すること」 と定義されますが、 ここでは、少ないデータからも最大の宝物を発見、という意味も含め、広義に扱い、
データ分析の難解な用語の世界を、身近なものにすることを指向します。
情報発信・セミナー・通信教育などの「学習」、データマイニングツールの「開発」、 データ「分析」の3つが、この塾の活動の3本柱です。
データマイニングは体力勝負?
データマイニング は、かなりの持久力を要します。頭脳労働ですが、データの取捨選択, 集計、成形など、その地道さに正直、根負けしそうになることも時にはあります。
しかし、それを乗越えたときにこそ、宝物が手に入るのです。そして、一番最後のエッセンスだけは、たぶんあなたのセンスにかかってきます。
原石はあなたのセンスで さらに磨けば,最後は宝石として財宝になります。
地道なデータマイニング作業から、最後の頭脳のひらめきで完成するデータマイニングまで、 そのプロセスに挑戦して、ぜひ、その素晴らしさを味わってください。
データの取捨選択、ごみ取り(クレンジング)、成形など、膨大な時間と人手間を要し、 人間のミスを誘う作業を自動化して、さらに分析の自動化へと繋ぎ、
データマイニング のコストダウンとシステム化が可能となってきました。
Excelでサポートされるデータの量、最大65,536行・256列、更にピボットテーブルの 最大約8,000行・255列、などの垣根も取り払って、データマイニングの大量
データにも対応します。
(※Excel2007では、最大1,048,576行×16,384列)
三菱DIAPRISM(何と1,000万件のデータを5秒で、100万件なら2秒で検索集計!)等のデータ
ウェアハウスの能力と発展性も紹介します。
データマイニングへの招待!
我々の手にある、現代のパソコンは、ついこの前のスーパーコンピュータです。
ハードとしてのパソコン処理能力は、すでにデータマイニングのために、その力を 十分発揮できるレベルに達しています。だとすれば、あとは、ソフトとしてのデータマイニングを実用レベルに持っていくことが必要です。
データマイニングが普通に利用されるための環境がかなりのスピードで整いつつあると感じられます。 少しおおげさですが、データマイニングへの招待は、機を熟しているというべきでしょうか?
まずあなたのそばで眠っている”データ”を、”マイニング”することからスタートです!
宝物さがし、始めませんか?
データの海の中に、きっと宝物が見つかります!
上田 太一郎