検索
特集/連載

「XML」と「YAML」の違いとは? 意外と身近なデータシリアライズ言語XMLとYAMLの基礎【前編】

異なるアプリケーション間でデータを転送する際は、「XML」や「YAML」のような「データシリアライズ言語」が役に立つ。それぞれにはどのような特徴があり、どのような場面で活用できるのか。

Share
Tweet
LINE
Hatena

関連キーワード

XML | データ


 データセンターを効率的に管理するには、「XML」(Extensible Markup Language)や「YAML」(YAML Ain't Markup Language)といった「データシリアライズ言語」が鍵になる。データシリアライズ言語は、さまざまな形式のデータを、機械が理解できる形式に変換(シリアライズ)するための言語だ。データシリアライズ言語を活用することで、IT管理者はデータの自動処理や構造化に関するメリットを享受できる。

 XMLとYAMLの違いを知ることは、システム設定作業に適したツール選択の近道になるはずだ。本連載はXMLとYAMLの違いや用例を解説し、アプリケーション開発における自動化の可能性を広げる。

XMLとYAMLの違い

実はあれにも使われている「XML」とは

 XMLは、データの構造を人にも機械にも読みやすい形式で整理し、異なるシステムやアプリケーションがデータを扱えるようにするものだ。特定の情報を識別するための「タグ」を使用することで構造を表現する。ニーズに合わせてIT管理者が独自のタグを定義することも可能だ。XMLの標準規格を読み取れるプログラミング言語であれば、XMLデータのデータ構造を解釈できる。ファイルの拡張子は「.xml」だ。

 「Microsoft Word」「Microsoft Excel」など、MicrosoftのオフィスアプリケーションはXMLを活用している。これらのアプリケーションは、XMLを使用してファイルの構造を定義している。Microsoftのオフィスアプリケーションの文書ファイルのうち、「.docx」のように拡張子の末尾に「x」が付いているものは、XMLを使用していることを表す。

 ツリー(木)構造は、XMLファイルがデータを表現する際に用いるデータ構造だ。構造の最上位にあるルート(根)要素と、そこから枝分かれする1つ以上の子要素から構成されている。XMLファイルのツリー構造は、ファイルの構造、要素、属性(要素に付随する情報)を定義する「DTD」(Document Type Declaration:文書型定義)に基づいている。DTDはXMLファイル中の「<!DOCTYPE>」タグの後に配置される。DTDの中身は、タグを使うことでも、別のファイルを参照する形でも定義可能だ。XMLファイルのコメントは「<!--」と「-->」の間に記述する。

 OS「Linux」向けのアプリケーション開発者は、構造化された情報をアプリケーション間で受け渡すためにXMLを使う。データセンター管理者にとっては、データソースへの接続や、「Ansible」のような構成管理ツールでXMLファイルを扱う機会がある。

構成管理ツールに欠かせない「YAML」とは

 YAMLは、設定ファイルにおいて設定内容を記述するためのデータシリアライズ言語だ。 “人にとってより読みやすいファイル構造”を目指して設計されており、XMLとは異なる構造と構文を使用している。YAMLの主な機能はデータ構造を示すことではなく、データを受け渡すことにある。

 YAMLの特徴は、構文が厳密かつシンプルなことだ。XMLではタグや要素名、属性といった複数の記号を使わなければならないが、YAMLは、タブ文字ではなくスペースを使って階層構造や入れ子構造を定義するため、読みやすく理解しやすい。

 YAMLはデータセンター管理の観点でも有用だ。Ansible、「Docker Compose」「Terraform」「AWS CloudFormation」などの構成管理ツールは、YAMLを使ってさまざまな物理サーバや仮想マシン(VM)の設定を定義、管理している。

 一部の構成管理ツールは、一貫性、再現性、容易な変更といった自動化のメリットを得るための設定ファイルフォーマットとしてYAMLを採用している。例えばDocker Composeは、YAMLファイルを使ってサービスやアプリケーションの構成を定義する。コンテナ管理ツール「Kubernetes」も、システムリソースやコンテナクラスタの構成をYAMLファイルで定義可能だ。Linuxマシンを管理する際も、YAMLを利用する構成管理ツールの出番がある。YAMLのシンプルな文法は、YAMLファイルを読んだIT管理者がファイル構造やシステム構成を把握しやすくすることに一役買っている。

 YAMLファイルは3つのダッシュ(---)で始まり、3つのドット(...)で終わる。YAMLファイルは階層構造であり、1つのセクションを「マップ」と呼ぶ。1つのマップには、1つ以上のキー(属性名)と、それに対応する値を記述する。例えば「eagle」「chicken」「hawk」という3つの値を持つ「birds」というキーは、YAMLファイルでは以下のように定義する。

---
birds:
- eagle
- chicken
- hawk
...

 以下はAnsibleのサンプルプレイブック(タスクを定義したYAMLファイル)だ。このファイルを実行すると、ホストマシンとの接続を確認して、接続できた場合は「Hello world」というメッセージをログファイルに出力する。

name: My first play
hosts: myhosts
tasks:
  name: Ping my hosts
  ansible.builtin.ping:
  name: Print message
  ansible.builtin.debug:
    msg: Hello world

 次回は、XMLおよびYAMLファイルを作成、管理する際のポイントを紹介する。

TechTarget発 エンジニア虎の巻

米国TechTargetの豊富な記事の中から、開発のノウハウや技術知識など、ITエンジニアの問題解決に役立つ情報を厳選してお届けします。

Copyright © ITmedia, Inc. All Rights Reserved.

ページトップに戻る