カスタマーチャーンを抑えるための各種分析の設計、仮説の検証、分析結果をプロダクトの新機能に活用する提案等を担当。
### 役割
データサイエンティスト/ソフトウェアエンジニア
### 体制
要員4名(PM1名、データサイエンティスト2名、データアナリスト1名)
### 使用技術
- データベース・ストレージ: BigQuery、MySQL5.6
- データ分析・機械学習: Python3.9、JupyterLab、scikit-learn、LightGBM、SciPy
- データ可視化: Redash、Tableau、Matplotlib、Seaborn
- データパイプライン: Fluentd、Embulk、dbt
- ドキュメンテーション: notion、Google Sheets(スプレッドシート)、Mermaid
### 担当業務
- 時系列データを使ったカスタマーチャーン発生の予測モデル(LightGBM)の開発
- EmbulkやFluentdを使用したアプリケーションログのBigQueryへの蓄積
- SendGridのメール配信ログを利用した開封率の計算クエリをRedashにて作成
- リリースした機能の効果検証方法の設計とパフォーマンスの可視化(Tableau)の自動化
- 複雑なSQLのリファクタリング、model間の依存関係の可視化(dbt)等によるダッシュボードの保守
- BigQueryテーブルのパーティション分割、クラスタ化フィールド、SQL最適化によるコスト60%削減
- ユーザの行動ログから統計的分析によって特徴を抽出し、管理者向けにユーザの説明文を動的に生成