# 概要
・Yahooフリマで出品者を獲得するための、毎週400万人に配布するクーポン企画において、顧客獲得単価を改善する。
# 担当
・プロジェクトオーナーとして1人で以下を担当
・運用フロー作成
・SQLクエリ記述
・機械学習モデル構築
・テスト
・保守・運用
# 使用技術
### 決定木分析モデル、Tensorflowを用いた機械学習モデル構築
##### ■技術使用目的
クーポンを配布することにより出品しやすくなるユーザーを選定する
### SQLクエリ記述
##### ■技術使用目的
機械学習モデルにおいて出品可能性予測の特徴量に利用する。1ユーザーに対して、訪問、購入、いいねなどの情報を50以上紐付けを行った。
# 課題
・本クーポン企画において、全ユーザーに割引額/割引率の高いクーポンを配布してしまうと、費用対効果が合わず、実施ができない。
・より少ない費用で、より多くの出品者を獲得するため、本プロジェクトを実施した。
# どのようなモデルか
・学習データを2つ用いて、モデルを2つ作成する。目的変数はどちらも出品有無の0,1のカラム。
・下記①、②の差分が大きいユーザーは、クーポンに反応し、出品しやすくなるユーザーと言える。
・①、②の差分が大きいユーザーに優先的に高い割引率/割引額のクーポンを配布する。
①クーポン配布有りのデータで学習したモデル
②クーポン配布無しのデータで学習したモデル
# 思考プロセス
### なぜクーポン企画に機械学習モデルを導入したか
・クーポン企画の対象者に、ルールベースでユーザーによって配布するクーポンを変えたところ、顧客獲得単価に改善があった。
└ルールの例:①直近1ヶ月訪問あり:割引率/割引額の高いクーポンを配布。②直近1ヶ月訪問なし:割引率/割引額の低いクーポンを配布。
・1つの条件を使ったルールベースでも改善が見られたため、複数の特徴量を用いた機械学習モデルであれば、さらに顧客獲得単価が改善できると考えた。
### なぜ上記モデルを作成したか
・事象:機械学習導入の際の初回では、上記「どのようなモデルか」のモデルとは異なり、出品難易度が高いユーザー(つまり出品可能性が低いユーザー)に割引率/割引額の高いクーポンを優先的に配布したが、顧客獲得単価が改善しなかった。
・原因仮説:出品可能性が低いユーザーは、割引率/割引額の高いクーポンを配布しても出品しないユーザーもいる。クーポンによる出品者数を増やせていないので、顧客獲得単価は改善しない。
・解決策:クーポンにより出品するユーザーを増やす必要があるので、①クーポン配布有りのデータで学習したモデル と②クーポン配布無しのデータで学習したモデル の予測値の差分が大きいユーザーに割引率/割引額の高いクーポンを配布すればクーポンによる出品者数を増やし、結果として顧客獲得単価の改善につながると考えた。
### どのようにモデルを改善したか
・事象:初回作成したモデルでは、機械学習モデルを用いない場合と比較し、顧客獲得単価が改善しなかった。
・原因仮説:上記「どのようなモデルか」内の①と②の学習データを取得した期間が違ったために、モデルが出品予測に用いる特徴を読み違えている可能性があると仮説を立てた。(オーガニックの出品者数が多い時期に取得したデータは、本来は出品しづらい特徴を持っていても、出品しやすい特徴と判断される可能性がある)
・解決策:①と②の学習データを取得する期間を合わせることにより、モデルが出品予測に用いる特徴を正しく捉え、顧客獲得単価が下記「出した成果」のように改善した。
# 出した成果
・PayPayフリマの出品者を獲得するクーポン企画において、出品者数を5%改善。
・PayPayフリマの出品者を獲得するクーポン企画において、出品者獲得単価を10%改善。