watanta

3年後の目標や野望


データサイエンスでビジネスを成長させたい

理由: ビジネスは何かの課題を解決するものだと思っています。そのビジネスを再現性のある手段で成長させられるようになれば、どんな課題に対しても頑張れば解決できるようになると思うからです。人類が様々な課題を科学で解決してきたように。 したいこと: ・ビジネス課題をデータで取り組める形に翻訳する型を作り、社内に浸透させる 具体内容: データドリブンでの意思決定における最大の課題は、ビジネス上の課題が全てデータによって解けるものではないことが原因であると考えています。ディープラーニングで予測すること自体に価値はありません。予測によって得た情報をアクションの最適化に用い、意思決定が改善して初めて価値があります。どの意思決定ならデータドリブンに進めることによって価値が出るのか、その意思決定をどのように定式化し・最適化するのか。そこを見極め、事業として高度なデータ分析が会社としての成長につながる構造を作りたいです。まだ私自身考えは完成していませんが、参考書籍としては、「AI技術を活かすためのスキル」や「評価指標入門〜データサイエンスとビジネスをつなぐ架け橋」が良いと思っています。単純に述べると、全ての意思決定の問題を①上げるべきKPIの決定②取りうるアクションの把握③アクションとKPIの影響推定④アクション最適化の4段階に分けて考えます。このように考え方を整理しながら実践し、社内に展開していきたいです。 ・A/Bテストを高速で回すための文化・プラットフォームを作る 具体内容: 上記③でアクションがKPIにどのように影響を与えるかを推定するとき、A/Bテストが最もコスパが良いと私は考えます*1。ですから、社内のデータサイエンティストがどんどん実験して、ナレッジを貯めていける仕組みが必要です。 ・自社内の実戦によって得られたナレッジを社内外にかかわらず事例を発表し、他社のデータドリブンの意思決定も成長させたい。またそこからFBを受けて自社も成長させてたい。 具体内容: 企業として知識の差異が利益の根源であることは理解していますが、データドリブンで科学的にビジネスを進めるということは、一社に限らず、社会全体として価値のあることだと信じています。ですから、お互いに実践を通じて得られたナレッジを交換し、互いにより良いデータドリブンな意思決定ができるようになればいいなあと感じています。 *1 相関ではなく因果関係が見たいので、A/Bテストや傾向マッチングなどの因果推論が必要になります。ただ、A/Bテスト以外の因果推論の手法は、分析の品質を担保することがかなり難しいという実感があります。

年収評価シート

プロジェクトカテゴリ
担当工程
経験した職種・役割
あなたが実際に使っていた技術
このプロジェクト詳細は公開されていません

プロジェクトカテゴリ
担当工程
経験した職種・役割
あなたが実際に使っていた技術
このプロジェクト詳細は公開されていません

プロジェクトカテゴリ
担当工程
経験した職種・役割
あなたが実際に使っていた技術
このプロジェクト詳細は公開されていません

プロジェクトカテゴリ
担当工程
経験した職種・役割
あなたが実際に使っていた技術
このプロジェクト詳細は公開されていません

プロジェクトカテゴリ
担当工程
経験した職種・役割
あなたが実際に使っていた技術
このプロジェクト詳細は公開されていません

2020年/1ヶ月以内

競馬予測システム

# 案件概要 趣味で競馬予測モデルを開発・運用していました。https://watanta.hatenablog.com/entry/2021/01/02/092913 # 上記の案件を進めていく中での課題と経験を積めたこと #### その1 課題:実行環境を簡単に再現したい 経験:インクリメンタルなDockerfile, Docker-compose作成 開発を進めていく中で、必要そうなものをポンポンと入れていくと環境が汚染されてしまい、なぜかライブラリが動かなくなる事態が発生しました。よって、セーブポイントとして少しずつDokerfileを構築していき、失敗したらいつでも元の環境が再現できるようにしました。 #### その2 課題:競馬データ取得をどうするのか 経験:Scrapyによるクロール&スクレイピングノウハウ netkeiba.comからデータを取得することに取り組みました。いくつかのノウハウを得ました。 ・Scrapyはクロールとスクレイピングを交互に行うのが用途であるが、クロールのみを行い、スクレイピングプログラムは別に走らせたほうが良い。スクレイピングでエラー吐いたときに途中で止まってしまう。 ・javascriptが動作する必要がある場合はseleniumと組み合わせてクロールする。 ・更新がないページ(レース結果)と更新があるページ(ある馬の出走履歴)がある。前者はcacheを補完しておけば一度クロール住むだけで済む。また、後者に関しては、毎週回す場合、その週に出走した馬の一覧を作るなどしておくと必要な分だけクロールできる。 #### その3 課題:データが正しく取得できたかわからない 経験:検証項目をテスト化する スクレイピングしただけでは正しくデータがとれたかどうかはわかりませんでした。例えば、全部の馬のデータを取ったつもりが、昔の分がうまく取れていなかったり、1:1で結びつくデータのはずなのにかなり落ちてしまったりしていました。よって、観点を挙げてそれをpythonでテスト化しました。 例を挙げると、レースのデータベースと競走馬のデータベースを正しく作成できたことを確かめるため、レースのデータベースに記録されている競走馬IDをすべて抜き出し、それらが競走馬データベースに含まれるかどうかをテストしています。(100%にはなんないんですよね。。。なぜか) #### その4 課題:機械学習パイプラインに手動運用コストがかかっている 経験:Jenkinsパイプラインによる自動化 競馬は毎週50レースほど走ります。また、確定オッズを学習につかっているため、出走直前にデータをとり、推論する必要があります。また、モデルも毎週更新します。これらを手でやるのは大変なのでJenkinsのパイプラインを使って実現しました。 #### その5 課題:モデルのデプロイ後の劣化検知をする必要がある。 経験:Dashによるダッシュボード作成 劣化も検知したかったのでDashによりダッシュボード作成ししました。簡易ですが、直感的でわかりやすいです。 # プロジェクトとしての成果 一つのプロジェクトでデータ収集・モデル学習・推論結果活用・モデル劣化検知まで一気貫通して行った経験はなかったため、良い経験になりました。しかし、肝心のモデルが回収率85%までしか達成できておらず、実運用はこれからの課題です。

マネージメント能力

このマネージメント能力は公開されていません

アピール項目


アウトプット

GitHub アカウント
あり
Qiita アカウント
あり
Zenn アカウント
未入力です
Speaker Deck アカウント
未入力です
SlideShare アカウント
未入力です
特にアピールしたいアウトプット
あり

今後、身につけなければいけないと思っている技術は何ですか?

コンテナ技術 Spark ライティングスキル MLOps 統計・機械学習 AWS/GCP/Azure チームビルディング DDD マイクロサービスアーキテクチャ DataMesh

あなたが一番パフォーマンスを出せるのはどんな環境ですか?

目指すことがチームで共有できていること 自身の業務が利益に貢献できると確信できること

キャラクター

直近で一番やりたいこと
サービスを作りたい
好きなスタイル
好きな規模
水とプログラミングどっちが大事?
自信を持って人より秀でていると言える点
学習能力 / 分析力 / 問題解決力
スキルのタイプ
得意なフェーズ
会社を選ぶ一番の基準
好きなプロダクトがある
やりたくない分野
SI
その他の特徴
使用言語にはこだわらない / 新しい技術はとりあえず試す / 起業/創業期のベンチャーにいた
その他のやりたいこと・やりたくないこと
未入力です

やりたい事

手を動かして設計してコードを書きたい
絶対やりたくない
あまりやりたくない
別に普通
やりたい
絶対やりたい
価値あるプロダクトを作り成長させたい
絶対やりたくない
あまりやりたくない
別に普通
やりたい
絶対やりたい
学び続けて技術力でプロダクトに貢献したい
絶対やりたくない
あまりやりたくない
別に普通
やりたい
絶対やりたい
意義があることや社会に貢献できる仕事がしたい
絶対やりたくない
あまりやりたくない
別に普通
やりたい
絶対やりたい
人や計画の調整・マネジメントをしたい
絶対やりたくない
あまりやりたくない
別に普通
やりたい
絶対やりたい
レガシーなシステムの保守・運用・改善をしたい
絶対やりたくない
あまりやりたくない
別に普通
やりたい
絶対やりたい
企画や仕様を考えるところから関わりたい
絶対やりたくない
あまりやりたくない
別に普通
やりたい
絶対やりたい
業務効率を改善して一緒に働く人のためになりたい
絶対やりたくない
あまりやりたくない
別に普通
やりたい
絶対やりたい
全社横断的な共通基盤作りや強化をしたい
絶対やりたくない
あまりやりたくない
別に普通
やりたい
絶対やりたい
組織や文化を作る・成長させる仕事をしたい
絶対やりたくない
あまりやりたくない
別に普通
やりたい
絶対やりたい

基本プロフィール

年齢
今年で30代前半
好きな Text Editor
VS code
希望勤務地
東京都 / 愛知県 / リモート勤務
集まる必要性がない場合は基本リモートが許可される環境が必要
希望年収
800万円
転職ドラフトに参加して
企業から指名を受け取ろう!
会員登録をして転職ドラフトに参加すると、参加企業から年収付きの指名を受け取ることができるようになります。
会員登録する
ご意見箱

要望、不具合報告、使いづらい点や感想など、お気軽にお寄せください。
いただいたご意見は、今後のサービス向上に活用させていただきます。

なお、このフォームは受付専用のため、返信を行っておりません。
返信を希望する場合はお問い合わせよりご連絡ください。

  • {{error}}
SIGN UPSIGN IN


転職ドラフトを友人や同僚に薦める可能性はどのくらいありますか?