メインコンテンツまでスキップ

「SREが向き合う大規模リアーキテクチャ 〜信頼性とアジリティの両立〜」を読んだ

· 約2分
yumechi
Software Engineer

数百万の法人をモニタリングするサービスにおいて、ユースケースの増加に伴い既存アーキテクチャの限界に直面し、データモデリングから再考したリアーキテクチャの取り組みについての資料です。

資料リンク

感想・学び

  • 数百万の法人をモニタリングする仕組みがあるサービスであるため、アラート条件や閾値の設定がシビアで、通知がノイズになる可能性も高い
  • ユースケースが増加、変化する中で既存アーキテクチャでは耐えられなくなった(複雑な条件など) → リアーキテクチャする、データモデリングから再考
  • 概念を切り離して運用をシームレスに移行することや、中間処理テーブルを用いて細かい検索条件を実現する
  • 複数言語の利用がつらいので、RubyやRailsに寄せる。バッチは sidekiq で
  • リハーサル、切り戻し、並行期間でのパフォーマンス測定、SLO定義

sidekiq は知らなかったので調べておきたい。並行期間とかは本来持たせたいところですね…。 リハーサル、切り戻ししやすくみたいなところもSREの領域だとすると、自分はすでにそこへ踏み込んだことがあるので、実はSREとしての活動をすでにしていたのだなと感じました。