【事業部の組織改善・SRE体制の構築】
本番障害が頻発し、プロダクトのEOLが放置されるなど、運用がほとんど機能していない状況に対し、抜本的な体制見直しを主導。
組織改善とSRE文化の浸透に向けた取り組みを推進し、持続的な安定運用基盤の整備を進行中。
・運用体制を全面的に見直し、障害対応・監視・保守フローを整備。属人化を解消し、安定運用に向けた基盤を構築
・SREチームを提案・立ち上げ、事業部全体のインフラ・運用改善を横断的に担う組織を新設
・SRE文化の浸透を推進し、IaC運用・アラート対応・モニタリングにおける運用改善サイクルの定着を目指して、継続的な改善に取り組んでいる
【インフラ側】
▪️SLA、非機能要件未達問題の解消
・マルチリージョンにおけるディザスタリカバリ(DR)戦略の検討・構築
・マルチAZ対応の検討・構築
▪️全社的インフラ改善・向上
・インフラコストの最適化を推進し、月額約800ドルの削減を実現。
・AWS SandBoxアカウントを新規に構築し、最新サービスの技術検証や運用検証を行える環境を整備。チーム全体の技術力向上と安定した開発・運用基盤の構築に貢献。
・デプロイパイプラインを構築し、SNSトピックおよびChatbotを用いた自動通知機能を導入。デプロイ作業の可視化と運用効率化を実現。
【アプリケーション側】
・Ruby on Railsバージョンアップ対応
・テストカバレッジツール導入