「システムのお守りをあまりしないインフラ部隊」が必要な理由Googleが実践するSREに学ぶ

ITインフラ運用部門は新しいことに挑戦する予算も人員も限られている。それでもよりよい状況を求めるならばAIの力が必要だ。運用業務をGoogle並みに高める方法を探る。

2018年06月29日 10時00分 公開
[ITmedia]

 企業ITシステムは、高度かつ複雑化したことで、既に人による運用管理が限界に達しつつある。しかしIT運用の現場は、既存インフラの管理で忙殺されており、古い運用から脱せないのが現状だ。

 こうした中、注目を集めるのが、Googleが提唱する「SRE(Site Reliability Engineering:サイト信頼性エンジニアリング)」だ。SREは、ソフトウェアエンジニアリングによって自動化を突き詰め、サービスの信頼性向上――パフォーマンスや可用性、耐障害性を高める取り組みを指す。

 顧客視点を貫き、運用面からその企業の価値を押し上げていくSREは、Web系の「とがった」企業のみならず、一般企業の運用管理においても改善のヒントを数多く提供する。例えば、Googleには「運用管理にかかる人数がリニアに必要となるサービスは失敗する」という経験則がある。作業量が増えても、増員ではなく自動化でカバーするのがSREの思想だ。

 では、一般企業の運用環境でSREの取り組みを推進し、属人的な運用を脱して自動化を進めるにはどうすればいいか。カギはAI(人工知能)を使ったインフラ運用チーム復権のシナリオにある。本稿では2018年6月8日に開催されたセミナー「『SRE』のエンタープライズ適用を考える」のセッションから、そのヒントを探る。


提供:日本ヒューレット・パッカード株式会社
アイティメディア営業企画/制作:TechTargetジャパン編集部