AWSで障害が起きてもシステムを止めない、自動化の方法AWSで起きたことは自分たちにも起こり得る

組織のIT業務を自動化するに当たっては、1つのことを何度も何度も繰り返す機能を見つけることが出発点になる。だがそれは終着点ではない。自動化には入念なプランニングが必要だ。

2017年07月13日 05時00分 公開
[Clive LongbottomTechTarget]

 コンピュータは1つのタスクを繰り返し行い、毎回同じ内容を出力する。だがどうすべきかをコンピュータに指示するのは人間だ。2017年2月に起きた「Amazon Web Services」(AWS)の障害では、そのマイナス面が特に大きな脚光を浴びた。システム管理者が手違いで予定よりも多くのサーバをダウンさせ、ドミノ効果を発生させて、AWSのインフラの相当部分がダウンした。

 この問題は人間の手違いから始まった。だがインテリジェントなIT自動化技術の欠如によって事態は悪化した。プラットフォームは問題を認識できず、プログラミングされた通りのことを繰り返した。AWSで起きたことは、自分たちにも起こり得る。IT自動化で最悪の事態とは、間違った処理が自動的に広がり制御不能になることだ。この事態を防ぐため、チェックを行う必要がある。

自動化の入念なプランニング

 ITチームがシステムをプログラミングすれば、1回のタスクを1回だけ自動化することもできる。自動化するにせよしないにせよ、最初はそのタスクを実行するスクリプトやコードを書くところから始まる。自動化しても、システム管理者が実行ボタンを押すことに変わりはない。ITシステムの自動化は、1つのタスクが1つのシステムに対して、あるいは複数のシステムに対して、違う時間に繰り返し実行される場面で効果を発揮する。

 システムのパッチや更新プログラムはIT自動化のメリットを示す典型的な実例といえる。最初のテスト用にOSパッチをシステムに導入する。システム管理者はテスト用のシステムに手動でパッチを適用し、悪影響がないかどうかを見極めた後に、本番環境に行き渡るよう配信する。

 IT部門がテストを行う際は、実際の業務で使うのと同じツールを最初から使わなければならない。これはシステム管理者とIT自動化プラットフォームの分裂を防ぐ助けになる。もしシステム管理者が同じ動作を行って、それが後にスクリプト化された欠陥になった場合、これで予想外の問題は防止できる。

 加えて、この均一性を保つことで管理者は、IT自動化プラットフォームが以後に取る一切の動作を検証できる。例えばこのツールがパッチを導入して、そのパッチが機能しない場合は、是正のために必要な措置もプログラミングできる。

高度なIT自動化技術

 高度なIT自動化は、トレンドの筆頭に浮上している。多くのベーシックスクリプトシステムに使われているダンプの自動化は、何もかもダウンさせかねない。

ITmedia マーケティング新着記事

news171.png

2024年のGW予算は横ばい 賃上げよりも物価高と円安の影響が勝る?――インテージ調査
インテージが全国の15歳から79歳の男女を対象に実施したゴールデンウイークに関する調査...

news148.jpg

CNN幹部が語る、メディアビジネスにとってのAIのリスクと機会
生成AIがコンテンツを量産し、真偽の明らかでない情報があふれかえる中、メディアの価値...

news016.png

「サイト内検索」&「ライブチャット」売れ筋TOP5(2024年4月)
今週は、サイト内検索ツールとライブチャットの国内売れ筋TOP5をそれぞれ紹介します。