機能開発とシステム運用改善が両立できるエンジニアリング組織づくりができること
サービスの稼働状態を可視化しないまま新機能をリリースし続け、インシデントが多発してから一部のエンジニアが対応し疲弊する現場を何度か経験しました。 運用保守に関わる開発は優先順位の判断が難しく、SREチームに依存したりシステム障害が発生するまで開発工数を確保できない場合が多いように感じます。これはプロダクトオーナーや開発者にとってかけるべき工数の割合を判断する軸がないことが原因の一つだと考えています。 障害対応により日々の業務を圧迫されないためにも、システムメトリクスやSLI/SLOなど、指標をもとにコミュニケーションが取れるシステム運用をエンジニアリング文化として定着させられるようになりたいです。また、このような文化づくりを様々な組織に合わせて一緒にすすめることができるSREエンジニアのコミュニティをつくっていきたいと考えています。
要望、不具合報告、使いづらい点や感想など、お気軽にお寄せください。
いただいたご意見は、今後のサービス向上に活用させていただきます。
なお、このフォームは受付専用のため、返信を行っておりません。
返信を希望する場合はお問い合わせよりご連絡ください。