• /
  • ログイン
  • 無料アカウント

本書は、お客様のご参考のために原文の英語版を機械翻訳したものです。

英語版と齟齬がある場合、英語版の定めが優先するものとします。より詳しい情報については、本リンクをご参照ください。

問題を作成する

適用されたインテリジェンスによるプロアクティブな検出

アプライドインテリジェンスのプロアクティブな検出により、APMで監視されているアプリケーションからの異常が、アクティビティストリームと異常フィードに自動的に表示されます。各異常をクリックすると、自動分析が表示されます。

異常の通知はSlackで配信できます。または、必要なときにメッセージを配信するようにWebhookを設定できます。これらのイベントは、クエリ、カスタムダッシュボードの作成、およびアラートに使用できます。プロアクティブな検出構成(関心のあるアプリのグループ)を設定した後、この構成をソースとして追加できます。次に、異常はインシデントインテリジェンスを介して他のデータソースと自動的に関連付けられます。

異常現象の発生場所、異常現象を利用してインシデントになる前に潜在的な問題を把握する方法、異常現象からアラートを作成する方法については、こちらのショートビデオをご覧ください(約4分15秒)。

要件

プロアクティブな検出を使用するには、次のものがあることを確認してください。

データ制限については、 Data limits を参照してください。

重要な理由

プロアクティブな検出により、適用されたインテリジェンスは、異常の自動分析とともに、本番システムの異常に関する洞察を提供します。追加費用なしで自動的に有効になります。異常が検出されると、適用されたインテリジェンス異常フィードでそれを表示できます。または、SlackチャネルまたはWebhookに直接通知を送信します。

使い方

プロアクティブ検出では、次の方法を使用してアプリデータの異常を検出します。

  1. プロアクティブな検出は、APMエージェントによって報告されたメトリックデータを監視し、典型的なアプリケーションダイナミクスのモデルを構築し、スループット、応答時間、エラーなどの主要なゴールデンシグナルに焦点を当てます。
  2. これらのゴールデンシグナルの一つが異常な動作を示した場合、システムはそれにフラグを立て、正常な動作への回復を追跡します。
  3. お客様のデータの変化に適応し、新しいデータに基づいてモデルを継続的に更新していきます。

自動オン:デフォルトでは、プロアクティブ検出はすべてのAPMアプリケーションを監視し、アクションは必要ありません。異常が検出されると、さまざまなアクティビティストリームに自動的に表示され、適用されたインテリジェンス異常がフィードされ、NRQLを介してクエリを実行できるようになります。

Receiving notifications: スループット、エラーレート、または応答時間の異常な変化を検出したときに、通知を送信します。通知は、選択したSlackチャンネルに送信されるか、webhookで送信されます。異常が正常に戻ったときには、回復メッセージが送信されます。通知を受け取りたくない場合でも、 NRQLクエリ を通じてデータにアクセスすることができます。

異常分析:異常ごとに、Slackで異常分析ページへのリンクを提供します。このページは、異常に対する自動洞察を生成します。このページは、最近の異常を一覧表示する[異常]タブからも利用できます。このページでは、既存のAPMとプロアクティブな検出データを使用して、異常の原因について説明します。

アクティビティ ストリーム: New Relic One ホームページ、APM サマリー ページ、Lookout、Explorer などの様々なアクティビティ ストリームの中には、APM で監視しているアプリケーションからの関連する異常イベントが表示されます。アクティビティ ストリーム内の異常イベントをクリックすると、その異常の分析ページが表示されます。

アプリケーションは常に異常を発生させるわけではないので、検出されないのが普通の場合もあります。

プロアクティブな検出のための通知を設定する

プロアクティブな検出は、追加費用なしで自動的に有効になります。通知を受信したり、インシデントインテリジェンスのソースとして追加できる構成(アプリのグループ)を作成したりするには、プロアクティブな検出構成を作成する必要があります。プロアクティブ検出UIで構成を作成できます。

  1. From one.newrelic.com , click Alerts& AI.

  2. [プロアクティブ検出]で、[設定]をクリックします。

  3. クリック Add a configuration.

  4. 以下の情報をフォームに入力してください。

    • アカウント内の他の構成と簡単に区別できるように、構成の名前を決めてください。
    • アカウントを選択します。
    • 最大1,000個のアプリケーションを選択します。スループットが低い特定のアプリケーションは、少量のデータ変動に対してより敏感になる可能性があるため、プロアクティブな検出には適さない場合があることに注意してください。
  5. オプション:異常を監視したいゴールデンシグナルを選択します。

  6. オプション:インシデントインテリジェンスに接続します。

通知のミュート(Slackのみ)

Slackでは、特定のアプリケーションからの検出音を一時的または恒久的にミュートすることができます。また、チャンネル全体を一時的にミュートにすることもできます。この機能は、インシデントが発生した場合や、チャンネルを中断させたくない場合に便利です。

Slackでミュートにするには、 Mute this app's warnings または Mute all warnings を選択し、期間を選択します。ミュートの期間が終了すると、検出された場合の通知の送信が再開されます。

アプリケーションをミュートすると、そのアプリケーションは構成から完全に削除されます。再度追加するには、 one.newrelic.comにアクセスし、上部のナビゲーションで[ Alerts&AI ]をクリックし、[ Proactive Detection ]をクリックして、編集する構成を選択します。

プロアクティブな検出通知をミュートしても、アラートには影響しません。

プロアクティブな検出Slackメッセージを使用する

それぞれの異常メッセージには、問題の詳細を把握し、トラブルシューティングを開始するために使用できるいくつかの重要な情報が含まれています。

  • アプリケーション名と、New Relic One での詳細情報へのリンクです。
  • 異常が発生しているメトリックと、New Relic Oneでの詳細へのリンクです。
  • メトリクスの経時変化をグラフ化し、異常の挙動や程度を視覚的に理解することができます。
  • 適用されたインテリジェンスの分析ページに移動する[分析]ボタン。異常、上流または下流で検出された異常、およびその他の関連する信号に固有の主要な属性を識別します。

異常が正常に戻った時点で、フィードバックを提供するためのオプションを含む回復通知を送信します。お客様からのフィードバックは、開発チームが検出品質を向上させるための情報となります。スループットの異常に関するフィードバックの場合、より適切なモデルに適合させるために、フィードバックに基づいて毎時間評価が実行されます。私たちがお手伝いした場合は、 はい または いいえ を選択してください。

異常の概要を見る

Slackやwebhookを介して情報を提供する異常の通知に加えて、 Alerts& AI OverviewページAnomaliesタブ を介して、自分の環境の異常に関する詳細な情報を見ることができます。そのタブには、選択されたアカウントのすべての構成からの最近のすべての異常のリストが表示され、異常を選択して詳細な分析を行うことができます。

異常の可視化設定

異常は、さまざまなNewRelicアクティビティストリームと適用されたインテリジェンス異常フィードに表示されます。異常の可視性設定を使用して表示内容をカスタマイズできます(たとえば、アクティビティストリームでスループットの異常を非表示にし、異常フィードに保持します)。

これらの設定を見つけるには:[アラートとAI ]の[プロアクティブ検出]で、[設定]をクリックします。

これらの設定を使用する際の注意点

  • これらの設定は、ユーザーレベルで適用されます。あなたが行った変更は、あなたの組織内の他のユーザーには影響しません。
  • これらの設定にかかわらず、異常値は報告され、 NRQL クエリで利用可能です。

これらのUIセクションの詳細。

  • AI overview and anomalies tab: AI overview and anomalies tab の設定で、異常値を非表示にします。また、これらのビューに固有のフィルターも使用できますのでご注意ください。
  • グローバル アクティビティ ストリーム: グローバル アクティビティ ストリーム セクションを使用して、New Relic One ホームページ、APM Summary、Lookout など、さまざまな New Relic アクティビティ ストリームに表示する異常をカスタマイズします。
  • Anomaly types: 特定のタイプの異常を隠すには、ここのチェックボックスを使用します。例えば、 WebスループットNon-Webスループット 異常のチェックを外すと、これらのタイプの異常は、アクティビティストリームとAI概要および異常タブの両方から非表示になります。(ただし、これらの異常はレポートされ、クエリで利用可能です。)

アノマリーデータの照会

NRQLを使用して、 NrAiAnomalyイベントを使用してプロアクティブな検出データをクエリおよびグラフ化できます。例えば:

FROM NrAiAnomaly SELECT *

重要

このデータは、以前にProactiveDetectionイベントに添付されています。このイベントは2021年4月7日に非推奨になります。カスタムグラフでProactiveDetectionを使用する場合は、それらのクエリをNrAiAnomalyを使用するように変換する必要があります。

このイベントに付随する重要な属性は以下の通りです。

属性

説明

closeTime
タイムスタンプ

異常が終了した時刻。例: 1615304100000

configurationType
ストリング

イベントを監視する構成のタイプ。少なくとも1つの構成がエンティティを監視している場合、これはconfigurationに設定されます。それ以外の場合は、 automaticに設定されます。

entity.accountId
番号

エンティティが所属するNew RelicアカウントID。

entity.domain
番号

エンティティのドメイン(現在はAPMのみですが、将来の機能で変更されます)。

entity.guid
ストリング

エンティティのGUID。これは、NerdGraphを介してエンティティに関するデータを識別および取得するために使用されます。 entityGuidと同じです。

entityGuid
ストリング

エンティティのGUID。これは、NerdGraphを介してエンティティに関するデータを識別および取得するために使用されます。 entity.guidと同じです。

entity.name
ストリング

データが異常であると判断されたエンティティの名前。 entityNameと同じです。例: Laura's coffee service

entityName
ストリング

データが異常であると判断されたエンティティの名前。 entity.nameと同じです。

entity.type
ストリング

エンティティのタイプ(現在はAPPLICATIONのみですが、将来の機能で変更されます)。

evaluationType
ストリング

これは常にanomalyです。

event
ストリング

異常データの始まり( open )か終わり( close )かを示します。

openTime
タイムスタンプ

異常が開いた時間。例: 1615303740000

signalType
ストリング

分析されたデータのタイプ。たとえば、 error_rateまたはresponse_time.non_web

timestamp
タイムスタンプ

イベントが書き込まれた時間です。

title
ストリング

異常の説明。例: Error rate was much higher than normal

インシデントインテリジェンスのソースとして異常を追加する

インシデントインテリジェンスをプロアクティブな検出異常と統合することで、コンテキストと相関関係を取得できます。インシデントインテリジェンスでこれを行う方法については、 ソースの構成を参照してください。

構成内から[インシデントインテリジェンスに接続]を選択することもできます。

Webhookのペイロードと例

プロアクティブ検出は、HTTPSPOSTを介してJSON形式でイベント本文を送信します。システムは、エンドポイントが成功したHTTPコード(2xx)を返すことを期待しています。 Webhookを使用してプロアクティブ検出を構成する場合は、Webhook本体形式とJSONスキーマのこれらの例を使用してください。

属性

説明

category
列挙型

分析対象となったデータのカテゴリー。

カテゴリーには、ウェブ・スループット、非ウェブ・スループット、ウェブ・トランザクション、非ウェブ・トランザクション、エラー・クラスがあります。

data
リスト

検知に至るまでの時系列データです。

data[].timestamp
番号

データポイントのタイムスタンプ(Unix エポックからの ミリ秒) 。例:1584366819000

data[].unit
ストリング

データポイントの値を表す単位。

データ単位には、 countmilliseconds 、およびerror_rateが含まれます。

data[].value
番号

データポイントの値です。例:1.52

detectionType
列挙型

分析されたデータのタイプ。タイプには、 latencythroughput 、およびerror_rateが含まれます。

entity
物体

異常なデータを報告した企業。

entity.accountId
番号

エンティティのアカウントのIDです。

entity.domain
列挙型

エンティティのドメインです。例APMです。

entity.domainId
ストリング

ドメイン内のエンティティを一意に識別するためのID。

entity.guid
ストリング

すべての製品においてエンティティを一意に識別するために使用されるguidです。

entity.name
ストリング

エンティティの名前。例: Laura’s coffee service

entity.link
ストリング

エンティティを表示するためのリンクです。例

https://rpm.newrelic.com/accounts/YOUR_ACCOUNT_ID/applications/987654321”

severity
列挙型

NORMALWARNING 、またはCRITICALを含む、異常な変更がどのように発生したかの説明。

version
ストリング

提供されるデータを説明するために使用されるバージョン。

例:v1

viewChartImageUrl
ストリング

異常データのチャートを示す画像。

anomalyzerUrl
ストリング

NewRelicOneの異常を分析するために開くことができるURL。

データ制限

要件 に加えて、データ制限があります。

  • 監視対象のAPMアプリケーション:構成ごとに1,000個まで
  • Slackの設定:1アカウントにつき200個まで
  • Webhook構成:1アカウントにつき200個まで
  • 通知のない設定:1アカウントにつき200件まで
問題を作成する
Copyright © 2022 New Relic Inc.