データマイニング入門講座
第3回 コンビニで売れる女性会社員向け弁当を探る
−有効なアンケートの作成と分析法−
一橋大学商学部 杉村裕喜
データマイニングは通常 POSデータとか顧客データとか膨大なデータを扱います。しかしながら、例えば天然の真珠をむやみに採る(マイニングする)と乱獲になります。そこで、粒揃いの真珠を計画的に作ることを考えます。つまり養殖真珠です。これに相当するのが実験計画法と呼ばれる統計手法です(その中で、特にマーケテイング分野で適用・普及した手法がコンジョイント分析と呼ばれています)。
そこで、今回は実験計画法の事例を紹介します。得られたデータは Excelで解析可能です。読者は事例を理解して、自らも解析できるようになって下さい。
| 実験計画法は1920年代に英国のR.A.フィッシャーが創始した画期的な 統計手法の1つです。費用や時間をあまりかけずにデータを有効にとり(ここではアンケートをとり)、解析し、知見・仮説などを得る手法です。 |
まず、人気弁当を探るためにアンケートを作らなければなりません。メインはどんなものがよいのか、価格はいくらぐらいがよいのかなどです。このアンケートは4種類{メイン、メインの量、おかず、価格}からなります。そして、それぞれがメイン{オムライス、そば、ドリア、サンドイッチ、おにぎり}、メインの量{普通、少なめ、多め}、おかず{サラダ、煮付け、おひたし、炒めもの、なし}、価格{390円、500円、630円}に分かれています。実験計画法ではメイン、おかずなどのことを要因と呼びます。そして、オムライス、サラダ、390円など要因の中身のことを水準と呼びます。このアンケートでは4要因がそれぞれ5、3、5、3水準で成り立っていることになります(表1参照)。
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
アンケートは4要因がそれぞれ5、3、5、3水準で成り立っているわけですから5×3×5×3=225とおりの弁当が考えられます。これをすべてアンケートに盛り込むとなると膨大な量になります。回答する側もいやになってしまいます。そこで、ここでは直交表というものを利用します。直交表については注を参照して下さい。ここではL15直交表を用います。
| 直交表とはバランスよく1と2(あるいは1、2、3、4、5)を並べた表と考えたら理解しやすいでしょう。アンケート作成などの際に、効率良く情報を得るために用いられます。表2にL8直交表の一部を示します。ここでは4列までしかありませんが、本来は7列あります。1と2が規則正しく並んでいることがわかります。 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
表2の相関係数を求めてみると表3のようになります。自分自身の相関係数はもちろん1ですが他の列との相関係数は0になっています。これが直交表の性質の1つです。相関係数とは、ある量とある量との線形な関係の度合いを表す指標で、−1と1の間の値をとります。1あるいは−1に近いとき強い相関があり、0に近いときは相関がないといわれます。
|
|
|
|
|
|
|
|
|
|||
|
|
|
|
||
|
|
|
|
|
|
|
|
|
|
|
|
この L8直交表を用いることにより、4要因2水準は本来ならば2の4乗で16とおりの組み合わせとなりますが、8とおりの組み合わせでよいことになります。具体的に表2に要因及び水準を入れてみましょう(この作業を「割り付け」といいます)。例えばメイン{オムライス、そば}、メインの量{普通、多め}、おかず{サラダ、煮付け}、価格{390円、500円}という要因及び水準の場合、1列をメインとし、1にオムライスを、2にそばを割り付けます。同様にして以下3要因も割り付けます。
表4が割り付けた結果です。
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
本来ならば16(2の4乗)とおりの組み合わせになるはずのものが表4のように8とおりで済みました。このように直交表を利用して、割り付けることにより、非常に効率良く情報を得ることができるようになるのです。
(注)直交表には他に L4、L16、L32(2水準系)、L9、L27(3水準系)などがあります。
直交表を利用して、アンケート用紙を作成します(表5)。
表5 アンケート用紙
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
絶対買うなら10点、わからないなら5点、絶対買わないなら0点を記入して下さい。
直交表を利用したことにより、本来ならば225とおりの弁当に回答してもらう必要がありますが、15とおりで済みました。このように、アンケートを作成する側と回答する側の手間をいかに省くかということも重要なことです。さらに手間を省いたのにもかかわらず、それから得られる情報が多いということも大切です。
このアンケートの見方は、例えば、番号1はメインがオムライスでその量が普通、おかずはサラダで価格は390円ということになります。以下番号2から15までも同じようになります。
このアンケートを女性会社員に回答してもらいました。1から15までの弁当について、絶対買うなら10点、絶対買わないなら0点、わからないなら5点を記入してもらいました。今回は13人の女性会社員の回答結果です。その結果の平均点は表6のようになりました。
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
平均点を棒グラフにしたものが図1になります。平均点は人気度といってもよいでしょう。以下人気度と呼びます。
図1 アンケートの平均点
グラフからもわかるように弁当1がもっとも平均点が高い、すなわち人気があるようです。しかし、もっと平均点の高い組み合わせは存在しないのでしょうか。このことを調べるために表6を分析してみましょう。
| 回帰分析はどの要因のどの水準がどれだけ人気度に影響を与えているかを説明するためのものさし(回帰式)を作るものと考えて下さい。今回は人気度を被説明変数、割り付け表を説明変数として分析しました。回帰分析では人気度にそれぞれの要因がどのくらい影響を与えているかということを調べているので、人気度が被説明変数ということになります。EXCELなどを用いれば回帰式を簡単に求めることができます。 |
そのために表6を回帰分析で可能なように表7のように作り直します。作り方は該当する水準があれば1、そうでなければ0と記入します。
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
表7を回帰分析にかけます。このとき、このままでは回帰分析はできません。統計学的な理由から各要因ごとに1水準ずつ削除する必要があります。削除したものが表8です。
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
表8を回帰分析すると表9のような実行結果が得られます。
|
|
|||||
|
|
|
||||
|
|
|
||||
|
|
|
||||
|
|
|
||||
|
|
|
||||
|
|
|||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||
|
|
|
|
|||
|
|
|||||
|
|
|
||||
|
|
|
||||
|
|
|
||||
|
|
|
||||
|
|
|
||||
|
|
|
||||
|
|
|
||||
|
|
|
||||
|
|
|
||||
|
|
|
||||
|
|
|
||||
|
|
|
||||
|
|
|
||||
|
|
|
||||
|
|
|
||||
|
|
|
||||
|
|
|
||||
表9の係数から人気度を表す次の式が求まります(削除した列は係数を0とします)。
メイン
人気度(y)=−3.43+ 6.20(オムライス)
2.69(そば)
2.86(ドリア)
0.00(サンドイッチ)
2.89(おにぎり)
メインの量 おかず 価格
+ 1.03(普通) + 1.83(サラダ) + 2.93(390円)
0.00(少なめ) 4.92(煮付け) 0.40(500円)
3.15(多め) 3.13(おひたし) 0.00(630円)
2.88(なし)
0.00(炒め物)
・・・(1) (1)式から最も人気が高い弁当はメインがオムライス、メインの量は多め、おかずは煮付け、価格は390円の組み合わせで
−3.43+6.20+3.15+4.92+2.93=13.77点
であることがわかります。かなりの高得点です。逆に、最悪の組み合わせはメインはサンドイッチ、量は少なめ、おかずは炒め物、価格は630円の組み合わせで
−3.43+0+0+0+0=−3.43点
となります。
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
図2 要因の効き方
図2からメインが大きな比重を占めていることがわかります。次におかずの影響が大きいようです。メインの量、価格は同程度です。女性会社員は自分が食べたいものを重視している、ことがわかります。
しかし、コンビニにとっては、人気ばかりを考えるわけにはいきません。ほどほど人気があり、しかも売上に貢献する弁当を見つける必要があります。いろいろ組み合わせてみましょう。メインはオムライス、量は多め、おかずはなし、価格は630円とすると(1)式より
−3 .43+6.20+3.15+2.88+0=8.8点
また、別の組み合わせを考えると、メインはオムライス、量は普通、おかずは煮付け、価格は500円とすると(1)式より
−3 .43+6.20+1.03+4.92+0.40=9.12点
このように、いろいろな組み合わせが考えられます。アンケートを取ったときに、「必ず買う」は10点でした。ですから、10点に近ければ近い程、売れるかつ人気のある弁当であると考えることができます。
女性会社員に人気のあるコンビニ弁当はどのようなものか探るための手順をまとめると以下のようになります。
@弁当を構成する要因(使用したい項目)と水準(項目の中身)をリストアップする
Aアンケート表を作るために、直交表に要因と水準を割りつける
Bアンケートを集計し、平均値を人気度とする
C割り付け表を回帰分析用に作り直す(アンケートを0、1で表す)
D人気度を被説明変数、割り付け表を説明変数として回帰分析を実行する
(注)要因ごとに1列ずつ削除する
E回帰分析結果の各水準の回帰係数から、人気度を表す式を作る
(注)削除した水準列の回帰係数は0とする
F人気度が高くなる要因と水準の組み合わせをとりあげ、10点に近く、かつ売上に貢献する弁当を探す
Gどの要因が効いているか要因分析をおこなう(各要因の最高水準 ?最低水準の値をだし、要因ごとに比較する)
以上御紹介したことは人気のある弁当のコンセプトを開発する方法です。ここでは女性会社員向けコンビニ弁当でしたが、弁当に限りません。色々な商品のコンセプトの開発に適用できます。例えば、ヒットする和定食メニュー、リフレッシュ休暇旅行、学生の海外研修旅行、携帯電話、ゲームソフト、金融商品、等です。コストをかけないで手軽にできる方法です。読者もヒットする商品開発にチャレンジしてみせんか。