マーケティングにおける統計分析の活用法とは?種類や手法も解説
マーケティングのデータ分析を行うなかで「統計って言葉を聞くけど、何を意味しているのか分からない…」と悩まれている方も多いのではないでしょうか。マーケティングでは統計学や統計分析など、さまざまな面で活用されることが多い言葉となり、データを活用するうえでは欠かせない知識といえるでしょう。
マーケティングにおける統計とは?
マーケティングにおける統計とは主に「統計学」のことを指し、ばらつきのあるデータから数値上の規則性や性質を見出すことです。
具体的には以下の観点を目的とします。
- データ収集・分析
- 因果関係の洞察
- 課題解決を行うためのKPI設定
また統計学を用いて複数のデータから仮説や検証を行うことを「統計分析」と呼び、さまざまなフレームワークを活用しながら分析を行います。
マーケティング分野は正解が存在しないため、具体的な数値から成功要因を明確化や、顧客の行動を予測する場合に統計学が必要になります。
統計分析の種類
統計分析には大きく以下の3種類に分類されます。
- 記述統計
- 推計統計
- ベイズ統計
それぞれ根本的な分析方法から特徴が異なるため、活用する際は目的に合わせた分析方法を選択しましょう。
ここでは、統計分析の種類と機械学習の違いについて詳しく解説していきます。
記述統計
与えられたデータの性質を明確化することを記述統計といい、平均を出すことや、データをグラフや表にあてはめるなどの方法があります。
例えば以下のような10人分の身長がある場合、データの特徴を一目で理解することが難しいでしょう。
- 173cm
- 175cm
- 169cm
- 173cm
- 175cm
- 165cm
- 173cm
- 175cm
- 173cm
- 169cm
しかし以下のように分類されていたらいかがでしょうか。
- 175cm:3人
- 173cm:4人
- 169cm:2人
- 165cm:1人
自分で数える必要がなく、一目で理解できます。仮にグラフなどの図形で表されていたら、より簡単に認識できるでしょう。
このようにデータを分かりやすくすることが記述統計の目的になります。
推計統計
与えられた標本から母集団の特徴を分析することを推計統計といいます。
また推計統計は以下の2種類に分けられます。
- 推定:具体的な数値を予測すること
- 検定:母集団に向けて立てた仮説が正しいか判断すること
また推定のなかには2種類の方法が存在します。
- 点推定:1つの値を標本として抜き出すこと
- 区間推定:一定区間の値を標本として抜き出すこと
例えば「日本人の平均年収を推測する」という場合、最も確実な方法は全ての日本人に平均年収を聞くことです。しかし現実的に全ての日本人に調査することは不可能なため、標本となる値を抜き出し推計統計を行います。
仮に抜き出したデータの平均年収が800万円としたとき、この値が正しいかを判断することが検定です。
このように記述統計では表せない値の推測を行う際には、推計統計が活用できます。
ベイズ統計
ベイズの定理を活用した統計学のことをベイズ統計といいます。
ベイズの定理
- P(A|X)=P(A|X)×{P(X|A)/P(X)}
- P(A|X):事象Xの条件のもとで事象Aがおこる確率
- P(A):事象Aがおこる確率
- P(X):平均してそのデータが得られる確率
- P(X|A):事象Aの条件のもとでで事象Xがおこる確率
ベイズ統計の特徴として、記述統計や推測統計とは違い標本を必要としません。また母集団が変化し、データが変わらないという考えとなるため、混合しないように注意しましょう。
主な活用タイミングとしては、検索エンジンやアプリケーションの開発、機械学習などが挙げられます。
機械学習の違い
統計分析の種類を考えるうえで欠かせない要素が「機械学習」についてです。機械学習とは、AI(人工知能)が自立的に学習する技術のことをいいます。
本来は人間が設定を行わない限り勝手に動くことはありませんが、機械学習は自動で学習する仕組みとなり、一度設定すれば後は放置していても問題ありません。
また機械学習には以下の2種類が存在します。
- 教師あり学習
- 教師なし学習
各々、解説していきます。
教師あり学習
教師あり学習とは、AIの学習データに正解をもたせた状態で学習させる手法のことです。教師データやトレーニングデータと呼ばれる学習データを利用することで、システムの不正行為検出など明確な答えを求める際に役立つ方法になります。
具体的な活用タイミングは次にあげる5つが該当します。
- 画像・音声認識
- 機械翻訳
- 自然言語処理
- 株価予測
- 迷惑メールのフィルタリング
教師あり学習のメリットは、学習速度が早いことです。人間がデータを与えるため、精度が高く質の高い学習が行えます。
逆にデメリットとして挙げるならば、学習用の教師データが大量に必要な点です。仮に教師データが不足している状態の場合、AIが正しく認識しないや過敏に反応するなど正常に機能しない可能性があるため注意しましょう。
教師なし学習
教師なし学習とは、学習データを与えることなく機械学習によって学習させる手法のことです。
仮に大量のメールを学習した場合、文章の類似性などからグループ分けする仕組みとなります。
また教師なし学習では以下のようなアルゴリズムが存在します。
- GAN(敵対的生成ネットワーク):生成者と判定者のネットワークが競合し学習する方法
- クラスタリング:データの類似性などからグループ分けする方法
教師なし学習のメリットとしては、教師ありよりも簡易的に始められることです。そのため学習の速度次第では効率的に効果が得られるといえます。
その反面、学習の精度は下がってしまう点はデメリットです。どうしても学習データが存在しないため、教師あり学習ほどの正確さはないと捉えておきましょう。
マーケティングにおける統計分析の活用法
マーケティングではさまざまな面で統計分析を活かせるため、活用方法は多種多様といえるでしょう。なかでも統計分析の活用としておすすめなのが、SNSや人流データの分析です。SNSは顧客のリアルな声を把握するには適した媒体のため、自社の評価を確認するうえでも効果的な活用法になります。
ここでは、マーケティングにおける統計分析の活用法について詳しく解説していきます。
SNS分析による商品の改良
まず1つ目がSNSから顧客情報を分析し、商品の改良に活かす方法です。
SNSは年齢問わずに多くのユーザーが活用しており、リアルな口コミが特徴になります。そのため自社商品について検索し情報を得られれば、実際の本音を拾うことが可能といえるでしょう。
統計分析を活用する際は、AIによって顧客の投稿を自動分析することや、ランク付けによって評価する方法が行なえます。
顧客のリアルな声を拾えることは少ないため、SNSはどの企業にも効果的な分析です。
人流データによるマーケティング戦略の立案
2つ目が、人流データから新しいマーケティング戦略を考える方法です。
人流データとは、人がいつどこにいるのかなど、人間の移動に関する情報のことをいいます。
仮に飲食店に設置されたカメラで考えると、来店してきた顧客情報として以下の項目が確認できます。
- 性別
- 年齢層
- 店舗の滞在時間
- 顧客が集まりやすい場所
仮にコンビニエンスストアの場合、顧客が入り口からどのような動きを経て会計に向かっているのかなど、具体的な動線を考えられるでしょう。
コンビニエンスストアに限らず店舗ビジネスであれば、商品陳列などの指標として活用可能なため、新たなマーケティング戦略に役立つ分析です。
アンケート集計による新商品の開発
3つ目はよく活用されている方法でもありますが、アンケート結果を活かした新商品の開発です。
比較的実施しやすい方法のため、多くの企業が取り入れている統計分析の一つといえるでしょう。
アンケート内容は業種や目的によって異なりますが、主に以下のような内容になります。
- 商品やサービスの品質について
- 商品やサービスの価格について
- 商品やサービスの満足度について
- 同時に購入した商品やサービス
- 顧客の年齢層
- 顧客の性別
- 顧客の居住地
- 顧客の購入理由
アンケート実施後は相関関係などより詳細な分析を行うことで、より顧客の心理や行動を把握できます。
統計データによる新規事業の計画
4つ目は、統計データの活用による新規事業の開発です。
統計分析は既存事業の改善などで使用することが多いですが、新規事業においても根拠として十分に活用できます。
また統計分析を活用した新規事業の具体例については、経済産業省のWebサイトに公表されており、参考になる情報が多く掲載されています。
具体例だけでなく統計データについても参考になる資料が多いため、新規事業に限らず何かしらのデータを活用する際はぜひご活用ください。
マーケティングで活用すべき統計分析の手法6選
統計分析は非常に多くの種類が存在しますが、マーケティングで活用するうえでは以下の6種類を押さえておきましょう。
- 回帰分析
- 主成分分析
- アソシエーション分析
- クラスター分析
- 時系列分析
- SVM(サポートベクターマシン)
各々、解説していきます。
回帰分析
回帰分析とは求めたい要素に対して、他の要素がどような影響を与えているのかを分析するための手法です。
例えば飲食店の売上を考えた場合、立地・席数・競合店舗など、影響する要素は複数考えられます。
ここでポイントとなることが、求めたい要素のことを「目的変数」といい、影響する要素のことを「説明変数」といいます。
そのため今回の例であれば、
- 目的変数:飲食店の売上
- 説明変数:立地・席数・競合店舗
という流れです。
また回帰分析は、説明変数の数によって2つに分類されます。
- 単回帰分析:説明変数が1つの場合
- 重回帰分析:説明変数が2つ以上の場合
回帰分析を活用することで事象の関連性を可視化できるため、上記のように売上高などを考えることが多い分析手法です。
主成分分析
主成分分析とは、数ある変数を少数の項目に置き換え、データを解釈しやすい状態にする分析手法です。
仮にアパレルECサイトを運営している場合、多くの顧客を抱えていれば、その分購入する商品数も増加します。すべての商品を変数化すると考えると膨大な量となってしまうため、このようなときが主成分分析の活用タイミングです。
具体的には主成分分析によって「メンズ」「レディース」「キッズ」の3項目を作り、各商品を項目に割り振っていく流れとなります。
その他で主成分分析を活用するタイミングは以下のとおりです。
- 店舗分析
- 顧客満足度の調査
- 飲食物や作品の総合評価
- 成績分析
主成分分析はデータを簡略的に可視化できるため、複雑な情報を簡潔化させたい場合に活用しましょう。
アソシエーション分析
アソシエーション分析とは、顧客の行動パターンや購買履歴を分析するための手法です。
基本的にはデータベースなどの膨大なデータのなかから、関連パターンを導き出せる点が特徴になります。
具体的にはマシンラーニングモデルを活用し、
- If:もしこうだったら
- Then:こうなる
の2つのアソシエーションルールを作成します。
例えば、
- If:サンドイッチを購入する人は
- Then:コーヒーも購入する
など、関連性の高い要素から組みわわせることが重要です。
アソシエーション分析を活用するタイミングはこちら。
- 店舗の商品陳列
- オンラインストアの商品配置
- 広告のカタログ
- 小売店のレイアウト
商品の同時購入を促す効果があるため、実店舗やオンラインストアだけでなく、広告などのカタログにも有効な分析手法です。
クラスター分析
クラスター分析とは、複数の要素が混ざりあった集団のなかから、類似する要素をグループ分けする分析手法です。
元から分類する基準が定まっているものはクラスター分析とは呼べず、外的基準が何も定まっていない集団に対して行うことが一般的となります。
またクラスター分析には2種類存在します。
- 階層クラスター分析:類似する要素を順にクラスターへとまとめていく手法、樹形図のように広がる
- 非階層クラスター分析:類似する要素を同じクラスターに入れていく手法、階層的な構造はなし
それぞれの分析の活用方法は、集団内の個体数によって考えましょう。
- 個体数100以下:階層クラスター分析
- 個体数100〜300:併用
- 個体数300〜以上:非階層クラスター分析
クラスター分析では人だけでなく、地域やイメージなどさまざまなものに応用可能です。そのため多くの情報から効率良く分類する際に役立つ手法といえるでしょう。
時系列分析
時系列分析とは、時系列データとクロスセクションデータを組み合わせた分析手法です。
- 時系列データ:順序のあるデータ
- クロスセクションデータ:順序のないデータ、時期に偏りがある
主に時間の経過によって変化するデータの分析が目的となります。
また時系列分析は複数のモデルが存在し、当てはめながら分析を行っていきます。
- ARモデル:ある位置のデータを、過去のデータによって回帰するモデル
- ARCHモデル・GARCHモデル:株価のボラティリティの動きを表すモデル
- 状態空間モデル:状態と観測値について考えるモデル
SVM(サポートベクターマシン)
SVM(サポートベクターマシン)とは、ある集合体を2つに分類し、未知のデータがどちらに分類されるのかを分析するための手法です。また、前述で紹介した教師あり学習モデルの一つになります。
主に二者択一の予測に活用でき、以下のようなタイミングで使用します。
- 翌日の株価の上下予想
- 不動産価格の上下予想
- 豪雨による土砂崩れのリスク予想
SVMの強みはデータの次元が大きくなったとしても問題なく識別できる点です。また機械学習のなかでは過学習のリスクが低く扱いやすい点がポイントといえるでしょう。
しかし線形データなど単純な形で分類できる場合は限定的となり、大規模なデータセットにはあまり向かないため扱う際は注意しましょう。