はじめに
こんにちは、@kouzyunJa(原)です。私は普段の業務ではITシステムの監視にCloudWatchを利用していますが、最近ではDatadogなど、他の監視ツールも多く使われているのを見かけます。Datadogは、インフラやアプリケーション、ログ、セキュリティなどのデータを一元的に管理できるSaaS型の監視ツールです。
そこで今回は、”Datadog使ってみたい!!”という思いから、今回はDatadogの概要について調べて、実際にAmazon EC2(以下、EC2)をDatadogで監視できるようになるまでを記事に書いてみたいと思います。
Datadog概要
Datadogとはインフラ、アプリケーション、ログ、セキュリティなど、多岐にわたるデータを集約し、システム全体の監視・管理を行うSaas型の監視ツールです。リアルタイムでシステムの状況を把握し、異常が発生した際にはすぐに検知し対処できるようにするためのツールとして使用します。
機能の例としては以下のものがあります。
- 監視(モニタリング)
インフラ全体やアプリケーションの監視の機能です。
CPUやメモリ使用率、レスポンス時間、エラーレートなどのメトリクス(パフォーマンス指標)を収集し、システム状態を詳しく把握できます。 - アラート機能
設定したメトリクスが基準値を超えた場合、Datadogが自動でアラートを送信します。これにより、異常が発生してもすぐに気づき対応できるようになります。 - ログ管理
Datadogでは、アプリケーションやインフラからログデータを収集・分析し、ログデータから問題の特定や傾向の把握が行えます。フィルタ機能を使ったりして、特定のエラーやイベントに絞ったトラブルシューティングも行えます。 - ダッシュボード作成
Datadog上に集約したデータから、システムごとにダッシュボードをカスタマイズしてまとめて視覚化できます。これにより、システムごとに設定している監視要件や状況に合わせてた監視が行いやすくなります。
これらの機能を使い、システムの現状を「一元管理」することで、システム全体の状況を一目で把握できるようにします。DatadogはAWSに加えAzureやGoogle Cloud、オンプレミスのシステムも監視できるため、様々な環境を一元管理できるのも大きな特徴です。
EC2をDatadogで監視できるように設定する
それでは、実際にDatadogのコンソールを見ながらEC2の状況を監視できるようにしてみたいと思います。今回監視するAWS環境としてはPublic SubnetにEC2(Amazon Linux 2023)が一台あるようなシンプルな構成とします。Datadog AgentをEC2にインストールして、Datadogにて監視できるようにしていきます。
前提として、AWS環境は構築済みでセッションマネージャー経由にてEC2コンソールにログインできる状態であること、Datadogのアカウントを登録済みであることとして進めていきます。
①Datadogでの事前作業: API Key作成
EC2にエージェントをインストールする際の事前作業として、DatadogのAPI Keyの作成が必要なのでまずはそちらを作成していきます。Datadogのコンソールにアクセスして、[Settings]>[API Keys]を選択します。
キャプチャでは以前作成した分のAPI Keyがありますが、今回は新規で作成することとします。
[New Key]を選択して、任意のKey Nameを入力後に[Create Key]を選択すると新規でAPI Keyが作成されます。
API Keyが作成されたらEC2へのDatadog Agentのインストールの準備を行うため、左ペインから[Integrations]を選択してのメニュー画面に遷移します。
Integrationsのページに遷移した後、[Agent]>[Amazon Linux]を選択します。
この設定画面で先ほど作成したAPI Keyが必要になります。[Select API Key]から、作成済みのAPI Keyを指定して[Use API Key]を選択します。
そうすると、”Agent Installation Command”なるものが表示されています。これをコピーすれば事前準備は完了です!!
②EC2コンソールでのDatadog Agentのインストール
EC2のコンソールにセッションマネージャー経由でログイン後、先ほどコピーしたコマンドをペーストして実行します。
1 2 3 |
DD_API_KEY=’YOUR_API_KEY’ \ DD_SITE="ap1.datadoghq.com" \ bash -c "$(curl -L https://install.datadoghq.com/scripts/install_script_agent7.sh)" |
コマンドを実行すると、インストールが開始されるのでしばらく待機します。インストール完了後はDatadog Agentが自動で起動されます。実際にAgentが起動されているか、以下のコマンド入力して確認します。
1 |
# systemctl status datadog-agent |
コマンド入力後に、active(runnning)
と表示されていれば、無事にAgentの起動も出来ておりインストール作業は完了です。
③Datadogでの確認
エージェントのインストールが完了したので、Datadogのコンソールに戻って監視できるようになっているか確認します。左ペインの[Infrastructure]を選択して画面遷移します。
そうすると、”Host List”に先ほどAgentをインストールしたEC2が表示されており、ホストを選択すればメトリクスなどが確認できるようなっています。これによってDatadogにてEC2の監視ができるようになりました!
まとめ
今回は、Datadogの概要と基本機能、そしてEC2での監視設定の流れを記事にしてみました。Datadogは、メトリクスやログを一元管理し、リアルタイムでシステムの異常を検知・対応できるため、運用効率やシステムの安定性向上に繋がります。今回調べてみた内容をもとに、様々なことができるDatadogについて更に理解を深められたらと思います!次回はアラート周りのTerraform化をブログします!
1995年の駆け出しSRE。未経験からエンジニアへキャリアチェンジしエンジニア歴としては4年目となる。SESにて様々なAWS案件に携わる。SRE領域の知識を身につけるためTechBullコミュニティへ参画。元運用監視オペレーターという立場からAWSエンジニアやSREへキャリアアップした経験やクラウド関連の記事を執筆しつつ、コミュニティの1on1を実施している。