【プロジェクト概要】
自社サービスの画像分類モデル作成
【チーム構成】 プロダクトマネージャー 1名、バックエンドエンジニア2名、機械学習エンジニア1名 【担当業務】
使用言語はpython, Tensorflow-gpu, SQL,機械学習系ライブラリ。開発環境はAWS上のGCP(EC2, S3)
主にモデルのPOCから実用まで一貫して対応。データの前処理、モデルの選定・実装・作成・運 用
【発揮したバリュー】
・TensorflowのIncdption-resnet-v2(CNN)を改造したモデルで、BUYMA内の特定キーワー ドを予測するアルゴリズムの思案、作成、実用化 ・200万枚のスクラッチ画像をtfrecordなどを使い、大規模データを複数のGPUで並列処 理して計算の効率化
・SQLを使用してデータを効率化して、学習可能な形に正規化した仕組み作り
・補助モデルとしてRGB値をLAB値に変換し、3次元ベクトル計算式が適用な形に変換 する、クラスタリング検出モデルの作成
・ベンチマークのモデルに頼らず、工夫やアイデアで臨機応変に再学習可能なモデルの 作成に成功したこと ・作成モデルをMLops上で(kubernetes)で動かせるようにDjangoでモデルのアプリーケーショ ン化し、Dockerで運用可能な状態にしたこと
・kubenertes上でスケーラビリティ改善のため、curlコマンドで取得した画像URLから推論結 果を返すAPIの作成
・はじめてのDjangoフレームワーク、その他の知識を短期間でキャッチアップして、3ヶ 月ほどで試験段階に移行できたこと