今回は、PyMC-Marketingで作成したモデルを用いた分析についてご紹介します。
データを活用してマーケテイング投資の最適化を目指します。
ライブラリによって様々なViewが組み込まれているので、こちらも複数試してみると良いかと思います。
データ理解(EDA)
今回の分析ではKaggleのデータを用います。時系列データでカラムには売上と3チャンネルの広告投資が含まれています。
売上
コスト(広告投資)
広告は、TV、Radio、NewsPaperの3つのチャネルに分けて投資していることがわかります。
投資額
投資額はTVが最も多く、NewsPaper、Radioの順です。
評価
モデル精度
今回作ったモデルの精度は決定係数(R2)が0.90と高いことがわかりました。このモデルをもとにデータ評価していきます。
売上への貢献度
各々の投資が売り上げにどれだけ寄与しているかが、モデルをつくることで分析することができます。
TVの投資額が大きいため、TVが売り上げに貢献しているようですが、次に大きいNewsPaperの貢献度はRadioより小さいようです。また、投資額のわりにRadioの売上貢献度が高いことがわかります。
チャンネル貢献度とコストシェア
マーケティングチャネルの予算割合が全体の費用に占める割合(コストシェア)を横軸に、そのチャネルが全体の売上や成果に与える影響(チャネル貢献度)を縦軸にプロットしたものです。異なる予算配分が全体の成果にどのように影響するかを視覚的に理解することができます。今回の場合では、Radioに予算をより多く配分した方が貢献度合いが大きいことがわかります。
では、次に広告予算が100とした場合、どのチャンネルに配分すれば効果的かをシミュレーションしてみます。(ただし、100%といういみではなく、単位は今回のデータと同じコスト単位(例えば千円)です。)
推定貢献度 (estimated_contribution) |
最適予算 (optimal_budget) |
|
---|---|---|
TV | 0.979365 | 11.509512 |
Radio | 13.536484 | 88.390488 |
Newspaper | 0.000802 | 0.100000 |
total | 14.516651 | 100.000000 |
左のグラフでは予算100を均等に分けた場合が青色の棒グラフで示されています。この場合の貢献度が右の青色の棒グラフです。一方で、左のオレンジ色の棒グラフでは、最適予算で配分した場合の貢献度が右の棒グラフで示されています。
このように、広告に100投資した場合、どのチャンネルにいくら配分すると効果が最大化されるかがわかり、意思決定を支援することができます。
まとめ
今回のデータは3つの広告チャンネルだけでしたので、比較的シンプルでわかりやすかったと思います。ただ、実際にはより多くの広告チャンネル、ブランド別に分けた投資分析をされるケースがあるかと思います。また、モデルの精度を一定レベルない場合、このシミュレーションの結果も精度が低くなることが考えられますので、シミュレーション結果だけをうのみにせず、これまでの経験も踏まえた意思決定が必要です。