バイアスを回避する「因果推論」の考え方
ビジネスにおいて、マーケティングや販促活動が売上高などの”KPI”に「どのように」「どれほど」影響を与えたかを特定することは重要です。
今回は、そのフレームワークとなる因果推論(統計的因果推論)についてご紹介します。
因果推論(いんがすいろん)とは?
因果推論とは、とある要因のなかにある因果関係を探し、原因と結果の関係性を正しく推定し仮説を導くことを意味します。データとデータの因果関係を統計的に推測していくこの考え方は、様々な分野で活用され始めています。
しかしながら、入手したデータからある施策にて「本当に差があるかどうか」を推測していくことは、実は簡単ではありません。なぜなら、分析の途中で各個人のバイアスが紛れ込むリスクがあるからです。
「広告の効果測定」を事例とした因果推論
上記であげた「バイアスが紛れ込むリスク」について、広告の効果測定を例に見ていきます。
※「広告での因果推論」=広告出稿にて本当に効果があったかの検証
※「CV」=コンバージョン(商品購入等)
<正しくない比較の仕方>
先ずは、広告の効果測定にて正しくない(問題が生じる)ケースを見てみましょう。広告効果を効率的に出すために、以下の条件を考えてみます。
- CV額が一定以上のユーザーにのみ広告を優先表示する
- 最近CVしたユーザーに優先表示する
すると、次のようなユーザーに広告が集中します。
- 過去のCV率が多いユーザー
- 最近CVしたユーザー
この2つのグループを表にまとめてみると下記のようになります。
▼ 広告が配信されたユーザー | ▼ 広告が配信されなかったユーザー |
・ 過去のCV率が多い ・最近CVしたユーザー | ・過去のCV率が少ない |
ここで問題となるのは、広告を配信されなかったユーザーは過去にCVがなく、最近もCVが少ないユーザー集団に偏り、広告配信されたユーザーよりもCV率がそもそも低い状態が集まっています。
グループを分けた時点で最初からCV率に大きな差が付いた(バイアスが生じている)状態になっています。つまり「広告の効果が殆どなかったとしても、あたかも広告効果があったと解釈できる状況」が生まれてしまっています。
このように、比較しているグループの潜在的な特徴が違うことによって生じるバイアスを「選択バイアス」といいます。また上記のように、見せかけの因果関係が生じていることを「交絡(こうらく)」といいます。
「選択バイアス」を取り除く理想的なやり方は「まったく同じ条件を作った上で比較すること」となります。つまり、介入(広告投下)があった場合と介入がなかった場合の両方を比較することです。
因果推論の根本問題
今回のケースの理想としては、広告を打った時にユーザーが「CVありの場合」と「CVなしの場合」を比べてみることです。しかし、現実に観察される結果はどちらか片方だけとなることが多い為、「CVあり・なしの両端を比べる」ことは実現性を考慮しない理想的な例となってしまいます。これを因果推論の根本問題といいます。現実的にみた場合には他の方法を検討することが必要となります。
<正しい比較の仕方>
「選択バイアス」を取り除く正しい効果検証とはどのようなものでしょうか。その答えとしては、介入をランダム(無作為)にしてしまうことです。
ランダムサンプリングによるA/Bテスト
完全にランダム選択することで、交絡効果をなくす(選択バイアスを打ち消せる)ことができます。この手法をランダムサンプリング(無作為抽・RCT)といいます。 この理論手法がなぜ機能するかを端的にいうと、ランダム抽出することで平均的に同質な2つの集団が出来上がることにより、バイアスのない状況を実現できるからです。
しかし、今回ご紹介させていただいたランダムサンプリングは理想的ではありますが、実装コストが高く実用性に欠けてしまう場合があります。 ビジネスにおいて、効果検証の費用対効果も重要なポイントとなります。コスト多過となってしまう場合には、代替的な手段を検討し直すことも必要となります。
<バイアス・ 交絡を取り除くその他の手法>
- 回帰分析による介入効果測定
- 傾向スコアを用いた分析
- 差分の差分法(DID) など
因果推論には様々な手法があり、関連書籍も多く出版されています。それらの情報も参考に、実際に直面しているケースでどのような手法が最適なのかを見極めるながら効果検証にチャレンジしてみるといいかと思います。
おわりに
直観的判断は速度を求めるうえでは最適かもしれませんが、誤った解釈に繋がるリスクを抱えています。そういった状況を見直して正確に分析したい場合や、厳密に因果関係を求める必要がある場合に「因果推論」は大きな役割を果たします。
デジタルマーケティングは計測できるものが多くデータ分析に相性が良い領域ですが、実際に計測しているのはユーザーに関する情報の一部を切り取ったデータとなります。背景や様々なリスクを考慮しながら分析することが重要であると感じるこの頃です。