適用されたインテリジェンスによるプロアクティブな検出

アプライドインテリジェンスのプロアクティブな検出により、APMで監視されているアプリケーションからの異常が、アクティビティストリームと異常フィードに自動的に表示されます。各異常をクリックすると、自動分析が表示されます。

異常の通知はSlackで配信できます。または、必要なときにメッセージを配信するようにWebhookを設定できます。これらのイベントは、クエリ、カスタムダッシュボードの作成、およびアラートに使用できます。プロアクティブな検出構成（関心のあるアプリのグループ）を設定した後、この構成をソースとして追加できます。次に、異常はインシデントインテリジェンスを介して他のデータソースと自動的に関連付けられます。

異常現象の発生場所、異常現象を利用してインシデントになる前に潜在的な問題を把握する方法、異常現象からアラートを作成する方法については、こちらのショートビデオをご覧ください（約4分15秒）。

要件

プロアクティブな検出を使用するには、次のものがあることを確認してください。

少なくとも1つのアプリケーションにAPMエージェントがインストールされていること。
Slackで通知を受け取るためには、IT管理者に依頼して、SlackのワークスペースにNew Relicのアプリケーションをインストールしてもらう必要があります。

データ制限については、 Data limits を参照してください。

重要な理由

プロアクティブな検出により、適用されたインテリジェンスは、異常の自動分析とともに、本番システムの異常に関する洞察を提供します。追加費用なしで自動的に有効になります。異常が検出されると、適用されたインテリジェンス異常フィードでそれを表示できます。または、SlackチャネルまたはWebhookに直接通知を送信します。

使い方

プロアクティブ検出では、次の方法を使用してアプリデータの異常を検出します。

プロアクティブな検出は、APMエージェントによって報告されたメトリックデータを監視し、典型的なアプリケーションダイナミクスのモデルを構築し、スループット、応答時間、エラーなどの主要なゴールデンシグナルに焦点を当てます。
これらのゴールデンシグナルの一つが異常な動作を示した場合、システムはそれにフラグを立て、正常な動作への回復を追跡します。
お客様のデータの変化に適応し、新しいデータに基づいてモデルを継続的に更新していきます。

自動オン：デフォルトでは、プロアクティブ検出はすべてのAPMアプリケーションを監視し、アクションは必要ありません。異常が検出されると、さまざまなアクティビティストリームに自動的に表示され、適用されたインテリジェンス異常がフィードされ、NRQLを介してクエリを実行できるようになります。

Receiving notifications: スループット、エラーレート、または応答時間の異常な変化を検出したときに、通知を送信します。通知は、選択したSlackチャンネルに送信されるか、webhookで送信されます。異常が正常に戻ったときには、回復メッセージが送信されます。通知を受け取りたくない場合でも、 NRQLクエリを通じてデータにアクセスすることができます。

異常分析：異常ごとに、Slackで異常分析ページへのリンクを提供します。このページは、異常に対する自動洞察を生成します。このページは、最近の異常を一覧表示する[異常]タブからも利用できます。このページでは、既存のAPMとプロアクティブな検出データを使用して、異常の原因について説明します。

アクティビティストリーム: New Relic One ホームページ、APM サマリーページ、Lookout、Explorer などの様々なアクティビティストリームの中には、APM で監視しているアプリケーションからの関連する異常イベントが表示されます。アクティビティストリーム内の異常イベントをクリックすると、その異常の分析ページが表示されます。

アプリケーションは常に異常を発生させるわけではないので、検出されないのが普通の場合もあります。

プロアクティブな検出のための通知を設定する

プロアクティブな検出は、追加費用なしで自動的に有効になります。通知を受信したり、インシデントインテリジェンスのソースとして追加できる構成（アプリのグループ）を作成したりするには、プロアクティブな検出構成を作成する必要があります。プロアクティブ検出UIで構成を作成できます。

From one.newrelic.com , click Alerts& AI.
[プロアクティブ検出]で、[設定]をクリックします。
クリック Add a configuration.
以下の情報をフォームに入力してください。
- アカウント内の他の構成と簡単に区別できるように、構成の名前を決めてください。
- アカウントを選択します。
- 最大1,000個のアプリケーションを選択します。スループットが低い特定のアプリケーションは、少量のデータ変動に対してより敏感になる可能性があるため、プロアクティブな検出には適さない場合があることに注意してください。
オプション：異常を監視したいゴールデンシグナルを選択します。
オプション：インシデントインテリジェンスに接続します。

Slackでプロアクティブな検出を使用するには：

Select Slack.
通知を受信するSlackチャネルを選択します。既存のパブリックチャネルまたはプライベートチャネルを選択できます。これにより、ワークフローは、適用されたインテリジェンスSlackアプリケーションを選択したチャネルに追加するように求められます。新しいチャネルを作成するには、最初にSlackで直接作成します。
ヒント
Slackチャネルの割り当て中にエラーが発生した場合は、New RelicAISlackアプリケーションがSlackワークスペースに追加されていることを確認してください。
設定を保存します。
各構成のアプリケーションは、構成表で構成を選択することで、いつでも変更することができます。

Webhookでプロアクティブな検出を使用するには：

Webhook を選択します。
以下の情報をフォームに入力してください。
- WebhookのURLを入力してください。
- オプションでカスタムヘッダーを用意
- カスタムペイロードを編集するか、デフォルトのペイロードを使用するかを選択します。
設定を保存します。
各構成のアプリケーションは、構成表で構成を選択することで、いつでも変更することができます。

通知のミュート（Slackのみ）

Slackでは、特定のアプリケーションからの検出音を一時的または恒久的にミュートすることができます。また、チャンネル全体を一時的にミュートにすることもできます。この機能は、インシデントが発生した場合や、チャンネルを中断させたくない場合に便利です。

Slackでミュートにするには、 Mute this app's warnings または Mute all warnings を選択し、期間を選択します。ミュートの期間が終了すると、検出された場合の通知の送信が再開されます。

アプリケーションをミュートすると、そのアプリケーションは構成から完全に削除されます。再度追加するには、 one.newrelic.comにアクセスし、上部のナビゲーションで[ Alerts＆AI ]をクリックし、[ Proactive Detection ]をクリックして、編集する構成を選択します。

プロアクティブな検出通知をミュートしても、アラートには影響しません。

プロアクティブな検出Slackメッセージを使用する

それぞれの異常メッセージには、問題の詳細を把握し、トラブルシューティングを開始するために使用できるいくつかの重要な情報が含まれています。

アプリケーション名と、New Relic One での詳細情報へのリンクです。
異常が発生しているメトリックと、New Relic Oneでの詳細へのリンクです。
メトリクスの経時変化をグラフ化し、異常の挙動や程度を視覚的に理解することができます。
適用されたインテリジェンスの分析ページに移動する[分析]ボタン。異常、上流または下流で検出された異常、およびその他の関連する信号に固有の主要な属性を識別します。

異常が正常に戻った時点で、フィードバックを提供するためのオプションを含む回復通知を送信します。お客様からのフィードバックは、開発チームが検出品質を向上させるための情報となります。スループットの異常に関するフィードバックの場合、より適切なモデルに適合させるために、フィードバックに基づいて毎時間評価が実行されます。私たちがお手伝いした場合は、はいまたは いいえ を選択してください。

異常の概要を見る

Slackやwebhookを介して情報を提供する異常の通知に加えて、 Alerts& AI Overviewページの Anomaliesタブを介して、自分の環境の異常に関する詳細な情報を見ることができます。そのタブには、選択されたアカウントのすべての構成からの最近のすべての異常のリストが表示され、異常を選択して詳細な分析を行うことができます。

異常の可視化設定

異常は、さまざまなNewRelicアクティビティストリームと適用されたインテリジェンス異常フィードに表示されます。異常の可視性設定を使用して表示内容をカスタマイズできます（たとえば、アクティビティストリームでスループットの異常を非表示にし、異常フィードに保持します）。

これらの設定を見つけるには：[アラートとAI ]の[プロアクティブ検出]で、[設定]をクリックします。

これらの設定を使用する際の注意点

これらの設定は、ユーザーレベルで適用されます。あなたが行った変更は、あなたの組織内の他のユーザーには影響しません。
これらの設定にかかわらず、異常値は報告され、 NRQL クエリで利用可能です。。

これらのUIセクションの詳細。

AI overview and anomalies tab: AI overview and anomalies tab の設定で、異常値を非表示にします。また、これらのビューに固有のフィルターも使用できますのでご注意ください。
グローバルアクティビティストリーム: グローバルアクティビティストリームセクションを使用して、New Relic One ホームページ、APM Summary、Lookout など、さまざまな New Relic アクティビティストリームに表示する異常をカスタマイズします。
Anomaly types: 特定のタイプの異常を隠すには、ここのチェックボックスを使用します。例えば、 Webスループット と Non-Webスループット 異常のチェックを外すと、これらのタイプの異常は、アクティビティストリームとAI概要および異常タブの両方から非表示になります。(ただし、これらの異常はレポートされ、クエリで利用可能です。)

アノマリーデータの照会

NRQLを使用して、 NrAiAnomalyイベントを使用してプロアクティブな検出データをクエリおよびグラフ化できます。例えば：

FROM NrAiAnomaly SELECT *

重要

このデータは、以前にProactiveDetectionイベントに添付されています。このイベントは2021年4月7日に非推奨になります。カスタムグラフでProactiveDetectionを使用する場合は、それらのクエリをNrAiAnomalyを使用するように変換する必要があります。

このイベントに付随する重要な属性は以下の通りです。

属性	説明
`closeTime` タイムスタンプ	異常が終了した時刻。例： `1615304100000` 。
`configurationType` ストリング	イベントを監視する構成のタイプ。少なくとも1つの構成がエンティティを監視している場合、これは`configuration`に設定されます。それ以外の場合は、 `automatic`に設定されます。
`entity.accountId` 番号	エンティティが所属するNew RelicアカウントID。
`entity.domain` 番号	エンティティのドメイン（現在は`APM`のみですが、将来の機能で変更されます）。
`entity.guid` ストリング	エンティティのGUID。これは、NerdGraphを介してエンティティに関するデータを識別および取得するために使用されます。 `entityGuid`と同じです。
`entityGuid` ストリング	エンティティのGUID。これは、NerdGraphを介してエンティティに関するデータを識別および取得するために使用されます。 `entity.guid`と同じです。
`entity.name` ストリング	データが異常であると判断されたエンティティの名前。 `entityName`と同じです。例： `Laura's coffee service` 。
`entityName` ストリング	データが異常であると判断されたエンティティの名前。 `entity.name`と同じです。
`entity.type` ストリング	エンティティのタイプ（現在は`APPLICATION`のみですが、将来の機能で変更されます）。
`evaluationType` ストリング	これは常に`anomaly`です。
`event` ストリング	異常データの始まり（ `open` ）か終わり（ `close` ）かを示します。
`openTime` タイムスタンプ	異常が開いた時間。例： `1615303740000` 。
`signalType` ストリング	分析されたデータのタイプ。たとえば、 `error_rate`または`response_time.non_web` 。
`timestamp` タイムスタンプ	イベントが書き込まれた時間です。
`title` ストリング	異常の説明。例： `Error rate was much higher than normal` 。

インシデントインテリジェンスのソースとして異常を追加する

インシデントインテリジェンスをプロアクティブな検出異常と統合することで、コンテキストと相関関係を取得できます。インシデントインテリジェンスでこれを行う方法については、ソースの構成を参照してください。

構成内から[インシデントインテリジェンスに接続]を選択することもできます。

Webhookのペイロードと例

プロアクティブ検出は、HTTPSPOSTを介してJSON形式でイベント本文を送信します。システムは、エンドポイントが成功したHTTPコード（2xx）を返すことを期待しています。 Webhookを使用してプロアクティブ検出を構成する場合は、Webhook本体形式とJSONスキーマのこれらの例を使用してください。

属性	説明
`category` 列挙型	分析対象となったデータのカテゴリー。カテゴリーには、ウェブ・スループット、非ウェブ・スループット、ウェブ・トランザクション、非ウェブ・トランザクション、エラー・クラスがあります。
`data` リスト	検知に至るまでの時系列データです。
`data[].timestamp` 番号	データポイントのタイムスタンプ（Unix エポックからのミリ秒）。例：1584366819000
`data[].unit` ストリング	データポイントの値を表す単位。データ単位には、 `count` 、 `milliseconds` 、および`error_rate`が含まれます。
`data[].value` 番号	データポイントの値です。例：1.52
`detectionType` 列挙型	分析されたデータのタイプ。タイプには、 `latency` 、 `throughput` 、および`error_rate`が含まれます。
`entity` 物体	異常なデータを報告した企業。
`entity.accountId` 番号	エンティティのアカウントのIDです。
`entity.domain` 列挙型	エンティティのドメインです。例APMです。
`entity.domainId` ストリング	ドメイン内のエンティティを一意に識別するためのID。
`entity.guid` ストリング	すべての製品においてエンティティを一意に識別するために使用されるguidです。
`entity.name` ストリング	エンティティの名前。例： `Laura’s coffee service`
`entity.link` ストリング	エンティティを表示するためのリンクです。例 `https://rpm.newrelic.com/accounts/YOUR_ACCOUNT_ID/applications/987654321”`
`severity` 列挙型	`NORMAL` 、 `WARNING` 、または`CRITICAL`を含む、異常な変更がどのように発生したかの説明。
`version` ストリング	提供されるデータを説明するために使用されるバージョン。例：v1
`viewChartImageUrl` ストリング	異常データのチャートを示す画像。
`anomalyzerUrl` ストリング	NewRelicOneの異常を分析するために開くことができるURL。

適用されたインテリジェンスは、HTTPSPOSTを介してJSON形式でイベント本文を送信します。システムは、エンドポイントが成功したHTTPコード（2xx）を返すことを期待しています。

テンプレートです。

{
  "version": "{{version}}", 
  "entity": {
    "type": "{{entity.type}}",
    "name": "{{entity.name}}",
    "link": "{{entity.link}}",
    "entityGuid": "{{entity.entityGuid}}",
    "domainId": "{{entity.domainId}}",
    "domain": "{{entity.domain}}",
    "accountId": {{entity.accountId}}
  },
  "detectionType": "{{detectionType}}",
  "category": "{{category}}",
  "data": [{{#each data}}
    {
      "value": {{value}},
      "unit": "{{unit}}",
      "timestamp": {{timestamp}}
    }
    {{#unless @last}},{{/unless}}
  {{/each}}],
  "viewChartImageUrl": "{{viewChartImageUrl}}",  
  "anomalyzerUrl": "{{anomalyzerUrl}}"
}

サンプルペイロード。

{
  "version": "v1",
  "entity": {
    "type": "APPLICATION",
    "name": "My Application",
    "link": "https://rpm.newrelic.com/accounts/ACCOUNT_ID/applications/123",
    "entityGuid": "foo",
    "domainId": "123",
    "domain": "APM",
    "accountId": YOUR_ACCOUNT_ID
  },
  "detectionType": "metric",
  "category": "web throughput",
  "data": [ {
    "value": "100",
    "unit": "count",
    "timestamp": 1637260259819
  }, {
    "value": "99",
    "unit": "count",
    "timestamp": 1637260319819
  }, {
    "value": "0",
    "unit": "count",
    "timestamp": 1637260379819
  } ],
  "viewChartImageUrl": "https://www.example.com/image/8353cf2c-945c-48e8-99de-e903f033a881?height=200&width=400&show_timezone=true",
  "anomalyzerUrl": "https://www.example.com/anomalyzerUrlExample"
}

データ制限

要件に加えて、データ制限があります。

監視対象のAPMアプリケーション：構成ごとに1,000個まで
Slackの設定：1アカウントにつき200個まで
Webhook構成：1アカウントにつき200個まで
通知のない設定：1アカウントにつき200件まで

本書は、お客様のご参考のために原文の英語版を機械翻訳したものです。