新しい職種として最近、「サイト信頼性エンジニア」が存在感を高めている。クラウドエンジニアの「敵」ではなく「味方」だ。両者はどう違い、共存するにはどうすればいいのか。
「サイト信頼性エンジニアリング」(Site Reliability Engineering:SRE)とは、Googleが提唱した概念で、同社は「信頼性の高い本番環境システムを実行するための職務、マインドセット、エンジニアリング手法」だと定義する。SREはクラウドサービスをはじめ、企業が使うシステムの管理手法を変える力がある。
SREを担う人をサイト信頼性エンジニアと呼ぶ(以下、本稿のSREはサイト信頼性エンジニアを指す)。SREはシステムの可用性とパフォーマンス最適化を主なミッションとしている。それを実現するために、SREはシステム管理全般にはもちろん、ソフトウェアエンジニアリングの手法にも精通する必要がある。スキルの一例としては、コードによるシステム管理が挙げられる。
SREは、クラウドサービスの運用管理を担当する「クラウドエンジニア」に取って代わる職種ではない。むしろ、クラウドエンジニアの部隊を「補う」と考えた方がいいだろう。SREはクラウドエンジニアにツールや戦略立案といった新たなノウハウを与え、クラウドサービスの信頼性を高めるための手助けをする。
SREの仕事の対象になるシステムはクラウドサービスだけではない。SREはオンプレミスのインフラも含め、あらゆる種類のシステムの信頼性を管理する「オールマイティー」の人材だ。近年、大半の企業がクラウドサービスを採用しているため、クラウドサービスの信頼性管理はSREの仕事の重要な部分になっている。
とはいえ、SREとクラウドエンジニアはそれぞれ職務内容が違う。両者を比較し、違いを明確にしよう。
クラウドエンジニアもソフトウェアエンジニアリング手法を利用することがある。これには、クラウドサービスを使ったシステムの開発工程でコードを管理する手法「IaC」(Infrastructure as Code)も含まれる。ただし、ソフトウェアエンジニアリング手法の利用はクラウドエンジニアにとって主要な職務内容ではない。言語に例えると、SREはソフトウェアエンジニアリングの「母語話者」でそれを常に使う。一方でクラウドエンジニアはソフトウェアエンジニアリングが「第三や第四の言語」となり、それを時々使う程度だ。
信頼性の維持・向上がSREにとって唯一の優先事項だ。SREは、いかにダウンタイム(システムの停止時間)を回避し、パフォーマンス最適化を実現するかが腕の見せ所になる。クラウドエンジニアも信頼性に気を配るが、信頼性はあくまで、幾つかある優先事項の中の一つだ。クラウドエンジニアはクラウドサービスの費用対効果やセキュリティの確保にも力を注ぐ。
前述の通り、クラウドはSREが管理するシステムの一つにすぎない。SREは企業が保有する全てのシステムを管理する。それとは対照的に、クラウドエンジニアが管理するのはクラウドサービスのみだ。
後編は、SREとクラウドエンジニアの組み合わせによるメリットを紹介する。
米国TechTargetの豊富な記事の中から、さまざまな業種や職種に関する動向やビジネスノウハウなどを厳選してお届けします。
フォルクスワーゲンがGoogleとタッグ 生成AI「Gemini」搭載で、何ができる?
Volkswagen of AmericaはGoogleと提携し、Googleの生成AI機能を専用アプリ「myVW」に導入...
JAROに寄せられた「広告への苦情」は50年分でどれくらい? 業種別、媒体別の傾向は?
設立50周年を迎えた日本広告審査機構(JARO)が、これまでに寄せられた苦情を取りまとめ...
データサイエンティストの認知率は米国6割、インド8割 さて、日本は?
データサイエンティスト協会は、日本と米国、インド、ドイツの4カ国で、データサイエンテ...