金融系のミッションクリティカル基盤において、マルチリージョンDR(災害復旧)の完全自動化を主導。また、CCoE(Cloud Center of Excellence)として全社のクラウドガバナンス・セキュリティ・FinOpsを推進し、技術選定から非機能要件定義、コスト最適化までを一貫して完遂。技術によるビジネス継続性の向上と大幅な運用コスト削減を実現しました。
【主な実績・業務内容】
1. SRE:マルチリージョンDR(災害復旧)完全自動化の完遂
課題: リージョン障害時の手動復旧手順が複雑でRTO(目標復旧時間)が不透明。
解決策: AWS ARC(Application Recovery Controller)およびStep Functionsを採用し、復旧ワークフローをオーケストレーション。Transit GatewayやVPC Peeringを含むネットワーク経路の切り替えをコード化。
成果: 「1クリックでのフェイルオーバー」を実現し、人為的ミスを完全に排除。非機能要件定義からPoC、本番導入までを独力で完遂し、PM/課長層への技術プレゼンを主導。
2. CCoE:クラウドガバナンス・セキュリティ・FinOpsの推進
セキュリティ: SecurityHubを用い、PCI DSS等の国際基準に準拠したセキュリティスコアの向上。AWS Config/SSM Automationを組み合わせ、非準拠リソースを自動検知・自動修復する「ガードレール」を構築。
コスト最適化(FinOps): アーキテクチャの見直し、未使用リソースの自動停止、ライトサイジングの主導により、継続的なコスト削減を達成。
標準化: CloudFormationによる標準テンプレート(IaC)を整備。プロジェクト全体の構築スピード向上と品質の均質化を実現。
3. 運用自動化(トイル削減):工数99%削減の達成
アクション: Python(Lambda)とGASを高度に連携。300以上のSSOユーザー、グループ、許可セットの整合性チェックを全自動化。
成果: 毎月3日間(24時間)要していた手動・目視確認作業を15分へ短縮(工数99%削減)。確認結果をスプレッドシートへリアルタイム可視化し、運用ミスゼロを達成。
4. 技術アドバイザリ・PMO業務
技術折衝: アプリ開発チームからのインフラ要求に対し、実現可能性の検討からスケジュール調整、コスト見積もりまでを一貫して対応。ログ分析によるアプリ側のエラー原因特定・解決策提示を行う「助言役」として機能。
マネジメント支援: 多忙なPMに代わり、定例会のファシリテーションやアプリ担当者との要件整理をリード。ドキュメント整備(構成図、パラメータシート、運用手順書)を徹底し、知識の属人化を排除。
【使用技術】
AWS: ARC, Step Functions, ECS, EC2, Aurora, VPC, Transit Gateway, Lambda, CloudFormation, Config, SSM, SecurityHub, EventBridge, CloudWatch, etc.
OS: Windows Server 2019, Linux
Automation/Tool: Python, GAS, GitHub, PowerShell