SREエンジニアを目指したい
現職ではSREという考え方は浸透していませんが、 O'Reilly の「SREサイトライアビリティエンジニアリング」を読んでから、自分なりのSREを実践してきました。 ー モニタリング環境の整備 新規ユーザー(案件)はprometheu+grafanaによるメトリクスモニタ導入 elasticsearch+kibanaによるアクセスログ可視化を導入 ー サーバ構築時の品質向上・作業効率化目的でAnsibleを使用 ー どうしても自動化できないトイルは細かく切り出し手順化して協力会社にやってもらう 監視追加、FWポリシー追加など ー できるだけ繰り返し作業・単純作業は自動化を考えたり、協力会社にやってもらい、 障害根本原因調査、設計、キャパシティプランニング、コーディングなど運用以外のことをやるようにする ー 障害対応→設計に活かす→障害対応→設計に活かす・・・サイクルをまわす 障害の切り分けで、下位レイヤからミドルウェアまでではなく、アプリがどういう処理になっているかも切り分けできたらと思うようになりました。 本格的に開発経験はありませんが、SREチームに所属し、運用効率化できるツール等開発に携わり、プログラムに関する知見も得られればと考えています。
要望、不具合報告、使いづらい点や感想など、お気軽にお寄せください。
いただいたご意見は、今後のサービス向上に活用させていただきます。
なお、このフォームは受付専用のため、返信を行っておりません。
返信を希望する場合はお問い合わせよりご連絡ください。