ローズピンクが好きな「ゆー」です。AMBLでインフラエンジニアをしています。
様々なお客様のサーバーやネットワーク、セキュリティの監視・保守案件を担当しています。
現在あるプロジェクトで使用している監視ツールの移行を検討しており、その際に比較した監視ツールの特徴をまとめたものをご紹介します。監視ツールの選定する際のご参考になると幸いです。
1.監視の目的
サーバー監視の目的は正常性の確認と障害の早期発見です。システムを安定稼働させるには停止させない、停止させても最小限に抑えることにあります。それらを確認・監視(検知)するのが監視の役割です。
2.監視ツールとは
監視ツールとは、監視の目的で書いた正常性の確認と障害の早期発見を行うことができるツールです。サーバやアプリケーションのメトリクスやログなどを対象に監視することができます。
2-1.プル型・プッシュ型
監視ツールには、プル型とプッシュ型があります。それぞれの特徴として以下があります。
・プル型
監視を行うサーバが監視対象のサーバからデータを集める。
監視対象を全て把握しているためサーバに異常があった時に素早く検知できる。
OSSもあるのでコスト的な観点で安く済む。
監視対象のサーバが増えた場合に監視サーバ本体の設定変更が必要であるため、
監視対象のサーバの増加が見込まれないシステムで使用する。
・プッシュ型
監視対象のサーバにソフトウェアをインストールし、監視を行うサーバへデータを
送信する。
SaaSが多いのでコストがかかる。
使いやすいようにUIや機能などがカスタマイズされている。
サーバの増加が見込まれるシステムについてはプッシュ型のツールを用いることで
監視構築コストが軽減される。
2-2.無料・有料ツールのメリット・デメリット
監視ツールには無料で使用できるものと有料のものがあります。それぞれのメリット・デメリットとして以下が挙げられます。
・無料ツール
メリット…利用料金がかからない。
デメリット…一定の知識、技術力が必要。
・有料ツール
メリット…ベンダーによるサポートが受けられる。UIが優れている。設定が容易である
デメリット…利用料金がかかる。最低契約台数が指定されている場合がある。
3.各ツールの特徴
今回は弊社がサーバを監視する上で最も使用されるCloudWatchと、サーバ監視を行う上で比較的多く利用されるその他5種類の計6種類を比較していきます。
3-1.CloudWatch
公式サイト:https://aws.amazon.com/jp/cloudwatch/
基本的な監視項目はAWSで標準装備されているため、設定や導入作業などを必要とせず、すぐに監視を始めることができます。また、サーバにCloudWatch Agentをインストールすることで、より詳細にメトリクスの設定をすることが可能です。
3-2.Zabbix
公式サイト:https://www.zabbix.com/
OSS(オープンソースソフトウェア)なので無料で利用できますが、環境の準備、監視サーバの構築、設定等をする必要があるため、コストと時間がかかります。
また、コンテナのPod単位などのオートスケールには対応していないため、それらを監視する場合は他のツールを使用する必要があります。
しかし、書籍や日本Zabbixユーザー会、ブログ記事等が充実しているおり、情報が得やすく、簡単な監視であれば、設定がしやすいです。有料のサポートもあります。
3-3.Prometheus
公式サイト:https://prometheus.io/
コンテナ等のオートスケールに対応していて、様々なツールと組み合わせて使うことができます。
Prometheusにはプル型のデメリット(監視対象サーバが増えた際に監視サーバの設定の変更が必要)を補ってくれる機能があります。しかし、公式サイト・サポート共に英語である点、ドキュメントや日本語記事が同じOSSのZabbixより少ないこと、Grafana等のサードパーティーツールの利用が前提で構築コストが高いです。
また、データの長期保存を前提としていないのでメトリクスの保存期間によってはインスタンスのメモリサイズを大きく取る必要があります。
3-4.Hinemos
公式サイト:https://www.hinemos.info/
システムのステータス情報やイベント情報を集中・集約管理できます。
Hinemosで収集した過去データから、将来の予測値や変化値を用いた異常検知・可視化ができます。
また、幅広い仮想化・クラウド環境に対応しているため、統合運等管理もHinemos1つで実現できます。国産の監視ツールなので日本語ドキュメント、サポートが充実しています。
3-5.Mackerel
公式サイト:https://ja.mackerel.io/
こちらはプッシュ型ツールのため、サーバにエージェントをインストールすることで監視が始められます。
複数のクラウド環境やコンテナを一元管理できます。しかし、電話によるサポートとVMWareに対応していないので、利用を考えている場合は注意が必要です。
3-6.Datadog
公式サイト:https://www.datadoghq.com/ja/
こちらはプッシュ型ツールのため、サーバにエージェントをインストールすることで監視が始められます。500以上のインテグレーションを組み込むことができ、全てのシステム、アプリケーション、サービスを横断して監視ができます。
また、アプリケーションのパフォーマンス監視も可能で、電子メール、Slack、Pagerduty等に通知を送ることができます。
4. おわりに
今回は6種類の監視ツールを比較しましたが、この他にも様々なツールがあります。
無料のツールだと設定が複雑な分、知識や技術が必要になってきます。
有料のツールでも一定期間無料で使えるものもあるので、ぜひ利用して使用感を確かめてみてください。
利用するシステムの規模や構成等から適切な監視ツールを選択し、運用監視を行っていきましょう。
次回の記事では、EC2やEKSを使用したインフラ構成の場合は、どの監視ツールを使用すればいいのか?等の「監視ツールの選定ポイント」をご紹介します。
あなたも一緒にAMBLで働いてみませんか?
AMBLは事業拡大に伴い、一緒に働く仲間を通年で募集しています。
データサイエンティスト、Webアプリケーションエンジニア、AWSエンジニア、ITコンサルタント、サービス運用エンジニアなどさまざまな職種とポジションで、自分の色を出してくださる方をお待ちしています。ご興味のある方は、採用サイトもご覧ください。
●AMBL採用ページ
-メンバーインタビュー (1日の仕事の流れ/やりがい/仕事内容)
-プロジェクトストーリー (プロジェクトでの実績/苦労エピソード)
●募集ページ
プリセールス/ エンジニア/ クリエイター/ データサイエンティスト /営業・コンサルタント /コーポレート /サービス企画 /教育担当