検索
特集/連載

Googleがおススメするシステム運用管理手法「SRE」「SLO」のメリット「SRE Meetup Tokyo」レポート(1/2 ページ)

Googleが膨大なシステムを開発、提供する中で生み出したシステム管理手法「SRE」(サイトリライアビリティエンジニアリング)。本稿ではSREやそのメリット、SREと併せて取り入れたいSLOについて紹介する。

Share
Tweet
LINE
Hatena

 Google日本法人は2017年9月25日、書籍『SRE サイトライアビリティエンジニアリング 〜Googleの信頼性を支えるエンジニアリングチーム』の出版を記念し、「SRE Meetup Tokyo」を開催した。会場となったのは東京都内にある同社のオフィス。Googleで培われたシステム管理の新手法を学ぼうと、多くのエンジニアが参加し、席は埋め尽くされていた。本レポートを通じて、「SRE」(サイトリライアビリティエンジニアリング)とはどのようなものなのか、ユーザー企業が取り入れる際の肝はどこにあるのか、感じ取ってほしい。

開発者がシステム管理をするSRE、そのメリットとは

 SREとは、Googleが膨大なシステムを開発、提供してきた中で生み出したシステム管理手法だ。Google日本法人でDeveloper Advocateを務めるイアン・ルイス氏は、SREについて次のように説明する。「開発者がシステム管理をするというのがSREの基本的な考え方です。一般開発者はエンドユーザーが要求する機能を実現するために開発し、SREの開発はアプリケーションやシステムの信頼性を高めるために開発します」(ルイス氏)

イアン・ルイス氏
Google日本法人のイアン・ルイス氏

 サービスをスケールさせるには、運用をできるだけ自動化する必要がある。SREでは、そのために開発リソースを投じる。とはいえ、やり過ぎては意味がないとルイス氏は言う。SREに開発者を多く割けば、それだけアプリケーション開発のリソースを減らすことになるからだ。「SREはオプションの1つであり、開発リソースのトレードオフであることを忘れてはなりません」(ルイス氏)

 運用がうまくいっていれば、開発リソースを運用に当てるのは無駄に思えるかもしれない。しかしシステムが複雑になればなるほど運用も複雑化し、問題も発生しやすくなる。運用担当者だけで解決できない問題が発生すれば開発チームにリクエストがきて、開発者は予定にない作業に当たり、結局は運用に時間を割くことになる。そのような事態を避けるためのシステム管理手法がSREなのだ。

SLOを定義することによりさまざまなメリットが得られる

Copyright © ITmedia, Inc. All Rights Reserved.

       | 次のページへ
ページトップに戻る