ID:83563さん

キャリアビジョン


SRE/Platform Engineerとして、開発者が自律的に動ける信頼性の高い基盤を設計・構築し、事業価値に直結するインフラ改善を技術で実現し続ける。

現職で800台規模のハイブリッドクラウド環境にて、監視基盤刷新(年間450万円コスト削減)、GitOps基盤構築(K3s+Argo CD)、IaC化と7チームへの展開など、「手動運用を仕組みに変える」ことを一貫して推進してきました。この経験を通じて、SRE/Platform Engineeringこそが自分の強みと情熱を最大限に発揮できる領域だと確信しています。今後はEKS/Terraform/Datadog/Goを軸に、より大規模なプロダクトの信頼性基盤を設計・構築する経験を積み、市場価値の高いPlatform Engineerとして成長していきたいと考えています。

プロジェクト経験

2025年/2年以内

広告配信基盤のインフラ運用・近代化

期間: 2025年4月〜現在(現場に約1年常駐) カテゴリ: 自社プロダクト 担当工程: 要件定義 / 設計 / コーディング / テスト / 運用・保守 職種・役割: インフラエンジニア(DevOps/FinOps推進) ■ チーム情報・役割 - **体制**: 7名(課長1名、インフラ5名、事務1名) - **役割**: 自動化・コスト最適化を**1人で主導**。課題特定から設計・実装・保守まで一気通貫で担当。 ■ 基盤環境 - **インフラ**: ハイブリッド(オンプレ約200台 + AWS EC2約600台 + GCP) - **プロダクト**: 広告配信システム(DSP) --- ### 開発・実装内容A: 監視基盤刷新(VictoriaMetrics) **【概要】Prometheusとの2重構成を解消し、単一基盤へリプレース。サーバー18台削減、年間約450万円を削減。** - **課題**: 前任者の離職により2重管理が常態化。リソース限界で手動の閾値・容量調整が頻発。 - **打ち手**: - VictoriaMetrics単一構成への移行を設計・主導(SaaSではなくコスト面からOSSを選択)。 - 不要ラベルのドロップによる**カーディナリティ最適化**を施し、ストレージ効率を大幅改善。 - Bitbucket Pipeline ➔ AWX APIによる**PRベースの自動デプロイ(CI/CD)**を構築。 - 監視対象管理を`dnsmasq`へ移行し、**煩雑なhostsファイル手動更新運用を完全撲滅**。 - **成果**: - **インフラ削減**: AWS EC2(t4g.xlarge)18台を削減、**年間約450万円のコストカット**。 - **運用工数半減**: 2重管理の解消、手動運用(hosts更新/閾値調整)からの脱却で保守工数を劇的削減。 【使用技術】 VictoriaMetrics, Prometheus, Grafana, AWS EC2, Bitbucket Pipeline, AWX API, systemd --- ### 開発・実装内容B: ログ基盤刷新・トレース導入(VictoriaLogs / Traces) **【概要】ELK StackからVictoriaLogsへ移行。同基盤にトレースも同居させ、可観測性3本柱を1製品群に統合。** - **課題**: 旧ELK(x86 3台)が不均一・いびつな構成で稼働。Elasticsearch独自APIによる運用が煩雑。 - **打ち手**: - VictoriaLogsへの移行および、**ARM 2台の対称クラスタリング構成**を設計。 - 同一基盤にVictoriaTracesを同居させ、**OpenTelemetry互換のトレース収集基盤**を構築。 - チームの認知負荷(K8s経験不足)を考慮し、あえて安定した**systemdネイティブ実装**を選択。 - **成果**: - **リソース効率化**: x86➔ARM移行とVictoriaの省電力性能により、インフラコストとJVM管理負荷を削減。 - **相関分析の実現**: メトリクス・ログ・トレースの**横断クエリ環境**をGrafana上で実現。 - **SLO計測の土台構築**: トレース活用により、**Datadog APM相当のSLOをOSS中心で計測可能**に。 【使用技術】 VictoriaLogs, VictoriaTraces, OpenTelemetry, Grafana, systemd, ARM, ELB, Ansible --- ### 開発・実装内容C: AWX GitOps基盤構築(K3s + Argo CD) **【概要】AWX 17(docker-compose)の最新化。K3s + Kustomize + Argo CDによるGitOps基盤へ刷新。** - **課題**: アーキテクチャ変更の難易度が高く**半年間停滞**。Redisが不安定でジョブ失敗・手動再実行が常態化。 - **打ち手**: - K3s + Kustomize + Argo CD構成を設計。**1日で全環境のコードベースを確立**し検証完了。 - 「**Gitのタグ書き換え ➔ push**」のみでバージョンアップが完結する宣言的運用を構築。 - DevContainer導入による開発環境の標準化、Ansible-lintによる自動品質チェックを整備。 - **成果**: - **ジョブ成功率の劇的向上**: Redisの挙動を安定化させ、突発的なジョブ失敗と手動再実行の手間を撲滅。 - **プロジェクトの膠着打破**: 停滞タスクを解消し、**1環境あたり半日で再現・構築可能**な状態へ。 - **ガバナンス強化**: ブラックボックス化していた設定をGit管理下に置き、属人化とリスクを排除。 【使用技術】 AWX, K3s, Argo CD, Kustomize, DevContainer, Ansible-lint, zRAM, External Secrets Operator --- ### 開発・実装内容D: Jenkins刷新・共通コード化(7チーム展開) **【概要】CentOS EOLに伴うJenkinsOS刷新とバージョンアップ。Ansible Role化し7チームへ水平展開。** - **課題**: 旧OSのままでは最新ランタイム(Node.js等)が導入不可。7チームが個別管理しており手動移行は事故リスク大。 - **打ち手**: - 互換性の高いOracle Linux 9を選定。各チームの構成差分を変数(variables)で吸収する**共通Ansible Roleを設計**。 - 手順をパッケージ化し、開発側が隙間時間で移行できる**「セルフサービス型」の移行体験**を確立。 - **成果**: - **安全な同時並行移行**: 共通コード化で環境差分リスクを排除。**1チームあたり実質1時間、事故ゼロ**で完結。 - **生産性向上**: 開発全体の最新ランタイム導入を可能にし、ビルド・テスト環境のモダン化に寄与。 - **プラットフォーム化**: インフラ側が抱え込まず、開発チームが自律運用できる仕組み(委譲)を実現。 【使用技術】 Jenkins, Ansible, Oracle Linux 9, JDK --- ### 開発・実装内容E: MFAサーバ構築(Go製RADIUSサーバ開発) **【概要】全社socks5プロキシへのMFA(MailOTP)導入。要件を満たすため、GoでRADIUSサーバを独自開発。** - **課題**: プロキシがLDAP単一認証でセキュリティに懸念。既存OSS(FreeRADIUS等)は相性問題で検証が難航。 - **打ち手**: - 導入負荷の低い「privacyIDEA(MailOTP)」を選定。構成をシンプルにするため、**Go言語でRADIUSサーバーをフルスクラッチ開発**。 - 自作したサーバーを別プロジェクト(可観測性基盤)のテストベンチとして扱い、分散トレース設計等も同時に検証。 - **成果**: - **セキュリティガバナンス強化**: 全社100名強が利用する基盤へのMFA導入を完了。 - **スピード構築**: 既存OSSの泥沼を回避し、自作を選択したことで**極めて軽量・シンプルな認証プロキシを短期間で実現**。 【使用技術】 privacyIDEA, Go, RADIUS, LDAP, OpenLDAP, IPA/Kerberos, systemd --- ### 開発・実装内容F: Grafana 8➔13 段階的アップグレード **【概要】数百台規模のGrafanaモニターインスタンスの段階的移行、およびGitOps管理への刷新。** - **課題**: リソース不足で長年放置され技術負債化。Legacy Alerting廃止等の影響で一足飛びの移行が不可。 - **打ち手**: - 安全性を担保した**段階的マイグレーション戦略(8 ➔ 10.4 ➔ 13)**の計画・Playbookを策定。 - **Grafana Git Syncを導入**。ダッシュボード管理をすべてGitベース(GitOps)に変更。 - 詳細な検証・展開プランを整備した上で、スキルアップを目的としてプロパー社員へ実務を委譲。 - **成果**: - **変更管理の近代化**: 「誰が・いつ・何を」の変更可視化と、**Git操作による即時ロールバック体制**を確立。 - **チームの自走化貢献**: 設計・手順をお膳立てして委譲したことで、プロパー社員のスキル底上げを牽引。 【使用技術】 Grafana, Ansible, Oracle Linux 9, ARM, Git Sync --- ■ 技術スタック(まとめ) AWS, GCP, Go, Terraform, Ansible, VictoriaMetrics, VictoriaLogs, VictoriaTraces, Datadog, Prometheus, Grafana, K3s, Argo CD, Kustomize, Helm, AWX, Jenkins, privacyIDEA, LDAP, ECS Fargate, ElastiCache, DevContainer, OpenTelemetry, Bitbucket Pipeline, GitHub Actions

2020年/2年以上

地方競馬の馬券売買を支える基幹システムのリプレース

期間: 2020年2月〜2025年3月(5年) カテゴリ: Webサービス / 受託開発 担当工程: 要件定義 / 設計 / コーディング / テスト / 運用・保守 職種・役割: インフラエンジニア / サブリーダー ■ チーム情報・役割 - **体制**: 最大20名(リーダー1名、サブリーダー2名(自分)、メンバー約15名) - **役割**: サブリーダーとして**チーム全体の設計レビューを主導**。自らもサーバー約30台を1人で全台構築し、品質担保を牽引。 - **形態**: 富士通Japanへの派遣参画(2次受け) ■ 基盤環境 - **インフラ**: オンプレミス基幹(RHEL、Windows Server、Hyper-V、KVM、PRIMECLUSTER) - **プロダクト**: 地方競馬の馬券売買・ポイント基幹システム --- ### 開発・実装内容A: メイン馬券システムリプレース(100台規模) **【概要】地方競馬の売買を支える大規模基盤の刷新。最大高負荷レースに耐えうる堅牢なインフラを再設計。** - **課題**: 旧システムの不備により最大高負荷時にシステムが停止。**数億円規模の機会損失**が発生しており、高トラフィックに耐える可用性の確保が急務。 - **打ち手**: - システム全体の**非機能要件定義、および高可用性(HA)設計**を担当。 - Hyper-VおよびWindows Server領域の**基本設計・詳細設計を主導**。 - 競馬場や場外売買所に配置される運用ワークステーションの調達、キッティング設計、展開スキームを確立。 - **成果**: - **高負荷に耐える堅牢性の確立**: 緻密な非機能要件定義により、数億円規模の停止リスクを排除した安定基盤を完遂。 - **大規模展開の標準化**: ワークステーションの展開手順をパッケージ化し、**現地展開時の作業事故ゼロ**を達成。 【使用技術】 Windows Server 2019, Hyper-V, RHEL, Acronis --- ### 開発・実装内容B: ポイントシステムリプレース(30台規模) **【概要】サブリーダーとして参画。マルチベンダー・大人数開発における環境差分を徹底排除。** - **課題**: 複数ベンダーによる継ぎ足し構築で、NW設計等のブレや環境差分(技術負債)が放置。2次/3次受けが混在する最大20名のチームで、設計品質の均一化と事故リスクの排除が急務。 - **打ち手**: - サブリーダーとして設計レビューを担い、**元請けSI標準プロセスに基づく品質管理**を徹底。 - 構成差分を完全に排除するため、Linux/Windows/PRIMECLUSTERからなる**サーバー約30台を自ら1人で全台構築**。 - NWのルート設定のブレを排除し、OS・ミドルウェアのインストールから性能チューニングまで一気通貫で実施。 - ミッションクリティカルなシステム特性を踏まえ、本番移行および綿密な**切り戻し(フォールバック)手順の検証を主導**。 - **成果**: - **環境差分・初期不良の根絶**: 1人での単独構築・チューニング徹底により、**複数人構築に起因する構成差分をゼロ化**。 - **高品質な移行の完遂**: 厳格な品質管理プロセスをクリアし、本番移行およびトラブル時の切り戻し検証を**無事故で完遂**。 【使用技術】 RHEL 8, Windows Server 2022, Hyper-V, PRIMECLUSTER, PostgreSQL, SQL Server, Systemwalker

マネージメント能力

アピール項目


アウトプット

GitHub アカウント
未入力です
Qiita アカウント
未入力です
Zenn アカウント
未入力です
Speaker Deck アカウント
未入力です
SlideShare アカウント
未入力です
特にアピールしたいアウトプット
未入力です

今後、身につけなければいけないと思っている技術は何ですか?

・EKS/Kubernetesの本番運用スキル(Argo CD、Helm、Karpenter) ・SREプラクティスの深化(SLI/SLO設計、エラーバジェット運用、ポストモーテム文化) ・Go言語でのプラットフォームツール開発 ・Datadogを活用したフルスタックオブザーバビリティ ・Platform Engineering(IDP構築、Golden Path設計、セルフサービス化)

あなたが一番パフォーマンスを出せるのはどんな環境ですか?

技術的な課題に対して裁量を持って提案・実行できる環境。「何を作るか」だけでなく「なぜ作るか」から関われること、改善の成果が定量的に見えること(コスト削減額、運用工数削減等)がモチベーションに直結します。また、チームメンバーと技術的な議論ができるフラットな文化があると最もパフォーマンスが出ます。

生成AIの活用状況

日常的な情報収集・業務活用
ChatGPTやGeminiなどのチャットツールを、情報収集、ドキュメント作成、翻訳に日常的に活用
業務でコード生成、コーディングエージェント系の生成AIを利用
コードレビュー、テストコード生成、デバッグに生成AIを活用

キャラクター

直近で一番やりたいこと
技術を極めたい
好きなスタイル
一人で黙々
どちらかといえば一人で黙々
どちらともいえない
どちらかといえばみんなでワイワイ
みんなでワイワイ
好きな規模
小さい会社
どちらかといえば小さい会社
どちらともいえない
どちらかといえば大きい会社
大きい会社
自信を持って人より秀でていると言える点
分析力 / 問題解決力 / 責任感
スキルのタイプ
ゼネラリスト
どちらかといえばゼネラリスト
どちらともいえない
どちらかといえばスペシャリスト
スペシャリスト
得意なフェーズ
0 → 1
どちらかといえば0 → 1
どちらともいえない
どちらかといえば10 → 100
10 → 100
会社を選ぶ一番の基準
年収が第一
やりたくない分野
未入力です
その他の特徴
レガシーな環境を改善できる / 新しい技術はとりあえず試す
その他のやりたいこと・やりたくないこと
未入力です

やりたい事

手を動かして設計してコードを書きたい
絶対やりたくない
あまりやりたくない
別に普通
やりたい
絶対やりたい
価値あるプロダクトを作り成長させたい
絶対やりたくない
あまりやりたくない
別に普通
やりたい
絶対やりたい
学び続けて技術力でプロダクトに貢献したい
絶対やりたくない
あまりやりたくない
別に普通
やりたい
絶対やりたい
意義があることや社会に貢献できる仕事がしたい
絶対やりたくない
あまりやりたくない
別に普通
やりたい
絶対やりたい
人や計画の調整・マネジメントをしたい
絶対やりたくない
あまりやりたくない
別に普通
やりたい
絶対やりたい
レガシーなシステムの保守・運用・改善をしたい
絶対やりたくない
あまりやりたくない
別に普通
やりたい
絶対やりたい
企画や仕様を考えるところから関わりたい
絶対やりたくない
あまりやりたくない
別に普通
やりたい
絶対やりたい
業務効率を改善して一緒に働く人のためになりたい
絶対やりたくない
あまりやりたくない
別に普通
やりたい
絶対やりたい
全社横断的な共通基盤作りや強化をしたい
絶対やりたくない
あまりやりたくない
別に普通
やりたい
絶対やりたい
組織や文化を作る・成長させる仕事をしたい
絶対やりたくない
あまりやりたくない
別に普通
やりたい
絶対やりたい

基本プロフィール

年齢
今年で30代中盤
好きなテキストエディタ
未入力です
希望勤務地
東京都 / 神奈川県
希望年収
800万円
ご意見箱

要望、不具合報告、使いづらい点や感想など、お気軽にお寄せください。
いただいたご意見は、今後のサービス向上に活用させていただきます。

なお、このフォームは受付専用のため、返信を行っておりません。
返信を希望する場合はお問い合わせよりご連絡ください。

  • {{error}}
転職ドラフトを友人や同僚に薦める可能性はどのくらいありますか?