こんにちは!
ディップに入社して2年目になりましたが、相変わらずインフラにどっぷり浸っているインフラエンジニアの大賀(おおが)です。
2025年5月13日に開催された「New Relic Now Live Tokyo 2025」に参加してきたので、会場で見聞きしたオブザーバビリティについての内容や気になったNew Relicの機能をまとめます!
基調講演:New Relicの「今」と「これから」
プログラムの最初にあった基調講演では、New Relicの現状と今後の展望についての講演がありました。
New Relicの「今」:進化し続けるオブザーバビリティプラットフォーム
オブザーバビリティプラットフォームについて、New Relicは以下のような過程で進化をカテゴライズしていました。
引用:講演資料スライド27
- Observability 1.0: APM、Hosts、Logs、Browser、Mobile、K8s、AIOpsといった個別機能の提供 (As-a-Service)。
- Observability 2.0: Insights Cloud、Intelligence Engine、Data Cloudを統合したAll-in-Oneプラットフォームへ進化。
- Observability 3.0へ:システムが複雑化しデータも膨大になる中で、AIによる問題の検知・予測・対応の自動化を促進し、オブザーバビリティの民主化を拡大
New Relicの「これから」:Intelligent Observabilityへ
2025年のオブザーバビリティ市場は、「未だ成長過程にあるマーケット」「エンジニアのためだけのツールではない(購入決定者の拡大)」「AIシステムの管理とAIの活用の両輪」 がトレンドとのことです。
これを踏まえて、New RelicはObservability 3.0への進化を主導すべく、Intelligent Observabilityというビジョンを提唱し、その実現を目指して以下3点を主軸に掲げていました。
引用:講演資料スライド29
- Intelligent Insights: ビジネスに影響のある全ての領域(ビジネスアップタイム、開発者の生産性、コスト管理、セキュリティ管理、顧客体験、サービスアーキテクチャ)にオブザーバビリティを活用。
- Intelligent Actions: 高度な予測や障害発生回避、運用のオーケストレーションの強化(Agentic Orchestrator、Predictions)。New Relic AI (Generative AIアシスタント)、AI Monitoring (ユーザー所有AIシステムの観測)、将来的にはAgentic AIの活用。
- Intelligent Data: MELT (Metrics, Events, Logs, Traces) を超え、Pricing, Configuration, User Behavior, Retros, Identity, Threatsといった多様化・増加するデータに対応 (eAPM, Fleet Control, Agent Control)。
思ったこと:dipでもNew Relicを利用していますが、共感できる点が多いです。オブザーバビリティプラットフォームは今やビジネス層でも大いに活用できると思いますし、インフラチームとしてもSLI/SLOの導入を皮切りに企画レイヤーの社員と一丸になってNew Relicを活用していく取り組みを始めていたりします。こういったプラットフォームも正しい自我を持ってくれればさまざまな方面でより無駄が減っていくのではと思います。
New Relic機能セッション
基調講演の後に各社のNew Relic利用事例のセッションがあり(大人の事情で内容は割愛します)、その後はNew Relic社員の方々より3パートに分かれてオブザーバビリティの活用におけるプラクティスや新機能の紹介がありました。
講演1:ユーザーのデジタル体験を先回りして改善
DEM(デジタル体験モニタリング)の重要性と、New Relicを活用した改善アプローチが紹介されていました。
ビジネスにおけるデジタル体験の重要性とDEM
引用:講演資料スライド10
- 「Amazon Found Every 100ms of Latency Cost them 1% in Sales (2006)」(Amazonでは100ミリ秒の遅延が1%の売上損失に繋がる)という事例からもわかるように、パフォーマンスはビジネスに直結していることから、遅延は新たな障害と捉えるべき。
- DEM(Digital Experience Monitoring)は、エンドユーザー体験目線の可用性、パフォーマンス、品質を監視するもので、リアルユーザーモニタリング(RUM)と外形監視(Synthetic Monitoring)がコア機能。
- ウェブトラッキング市場の実態調査(2024年10月、Kasperskyによる)では、New Relicが5位にランクインしており、これはAPM Agentと連携してBrowser Agentが自動セットアップされる手軽さも要因の一つと考えられる。
ユーザー体験と向き合う4ステップと関連するNew Relicの機能
その上でユーザ(デジタル)体験と向き合い先回りして改善するためのステップと、それぞれに利活用できるNew Relicの機能群を以下のようにご紹介いただきました。
引用:講演資料スライド16
- 症状を把握: SLM、SLI(Error Budget Policy)、Errors Inbox、各種Alerts
- 原因を特定: Streaming Video & Ads, Transaction 360, Queues & Streams, Database Performance, Engagement Intelligence, Logs in Context, Custom Attribute, Distributed Tracing
- 改善のため理解: APM Transaction Traces, Logs
- 再発を防止: Service Architecture Intelligence (Teams, Catalogue), Workloads, Dashboards
注目機能ピックアップ
この観点で使えるNew Relicの機能をご紹介いただきました。
Session Replay [GA]: ブラウザ上のユーザー操作を記録・再生し、問題発生前後の画面操作やAPI呼び出しを詳細に把握。エラー発生30秒前からの操作記録も可能。
引用:講演資料スライド23
Engagement Intelligence [GA]: レイジークリックのようなユーザー体験低下のサインを自動収集し、UX改善箇所を発見。AIによるEvent Trailの要約で体験を迅速に把握。
引用:講演資料スライド24
Streaming Video & Ads [GA]: 動画プレイヤーからサーバーサイドまで一貫管理し、バッファリング率や再生エラー、広告視聴完了率などをリアルタイムに分析。
引用:講演資料スライド26
Transaction 360 [Public Preview]: トランザクション中心にデータ分析。関連エンティティ情報を自動集約し、アノマリーにより影響箇所を示唆。
引用:講演資料スライド29
Queues & Streams [Public Preview]: Kafkaクラスターの主要メトリクスとパフォーマンスをリアルタイム監視。キュー前後のAPMサービスとの可観測性を向上。
引用:講演資料スライド32
Database Performance [Public Preview]: APM不要でスロークエリを収集し、DBパフォーマンスを管理・分析。(MySQL, PostgreSQL, MS SQL対応)
引用:講演資料スライド34
Service Architecture Intelligence [Public Preview]: チームが管理する複数サービスのアラート、SL、ビジネスKPIを簡潔に把握。
引用:講演資料スライド36
思ったこと:私はTransaction 360、Database Performance辺りが気になってます。Webトランザクションベースでのサマリが出せるのでSLOの運用にあたってダッシュボード化しても面白そうです。Database PerformanceについてもAPMレスでスロークエリの収集ができる点はパフォーマンスチューニングで重宝しそうです。
講演2:ビジネスの成長を支えるモダンインフラの実現
複雑化するITシステムに対応し、ビジネス成長を支えるためのモダンインフラストラクチャとオブザーバビリティの役割についての解説がありました。
ITシステムの進化と課題
引用:講演資料スライド5
メインフレームからクラウド、コンテナ・サーバレスへと技術は進化したことで開発・構築は高速化した一方、システム構成が複雑化したため問題発生時の原因調査が高度化・長期化している現状で、監視ツールやデータのサイロ化、スキル不足、属人化の加速などを課題として挙げらていました。
CCoEと運用テンプレートの重要性
引用:講演資料スライド10
そこで登場するのがCloud Center of Excellence (CCoE) で、CCoEはDX実現のための組織横断的な取り組みをするための考え方です。クラウド利用促進だけでなく、定量的効果測定や文化醸成も目的としています。重要なのは、インフラ構築をテンプレート化するだけでなく、オブザーバビリティの実現や運用プラクティスもテンプレートとして整備することだと仰っていました。
サービス成長フェーズ別の課題とNew Relicによる解決策
CCoEのフェーズごとにプラクティスをテンプレート化するにあたってNew Relicで利用できる機能を以下のように紹介いただきました。
初期フェーズ(課題:何をどうやって始めるかがわからない)
- eAPM (eBPF base lite APM) [Public Preview]: eBPFを利用し、クラスタにエージェントを追加するだけでゼロコードでアプリケーションパフォーマンスを計測可能。
引用:講演資料スライド17
- eAPM (eBPF base lite APM) [Public Preview]: eBPFを利用し、クラスタにエージェントを追加するだけでゼロコードでアプリケーションパフォーマンスを計測可能。
拡大期フェーズ(課題:構成管理の負担増、コスト肥大化)
- Fleet Control [Public Preview]: Kubernetes環境のエージェント(Infra, OpenTelemetry, 統合機能, EBPFなど)のライフサイクル(インストール、アップグレード)を集中管理し、監視構成を一元化。
引用:講演資料スライド18
- Cloud Cost Intelligence [Limited Preview]: AWS CURとNRDBのリソース使用状況からリアルタイムコストを予測・可視化し、コスト最適化の判断を迅速化。
引用:講演資料スライド19
- Pipeline Control [GA]: テレメトリーデータをパイプライン処理し、柔軟にフィルタ・変換・加工することで、データ利用価値の最大化とデータコストの適正化を両立。
引用:講演資料スライド20
- Fleet Control [Public Preview]: Kubernetes環境のエージェント(Infra, OpenTelemetry, 統合機能, EBPFなど)のライフサイクル(インストール、アップグレード)を集中管理し、監視構成を一元化。
安定期フェーズ(課題:セキュリティ、情報共有)
思ったこと:今回、私の所属インフラチームのメンバーから5名参加したのですが、Pipeline ControlとPublic Dashboardsについては皆口を揃えて「激アツ!!!」と言っていました。 個人的にもPipeline Controlはテレメトリデータのコントロールがめちゃくちゃしやすくなる上コスト最適化もできるし、Public Dashboardsはアカウント数/種別でも課金されるNew Relicではコスト面で重宝するので激アツだなぁ、と感じてます。ただ、Security RxでEoLの検知までできたら最高なのでそこだけ惜しいポイントでした。
講演3:AIがもたらす次世代の開発・運用
AI技術が開発・運用プロセスをどのように変革していくのか、New RelicのAI戦略と共に紹介されました。
New Relicが解釈する生成AIのトレンドと課題
引用:講演資料スライド6
生成AIは2023年より爆発的に普及し、2024年は実用化と成熟、エンタープライズ領域での導入が進むと予測され、実際に大きく導入が進む一方で、パフォーマンスチューニング、品質管理(バイアス、ハルシネーション)、コスト管理、セキュリティ、コンプライアンスといった課題も存在するとの見解を示されていました。
New RelicのAI戦略:AIを使う & AIを組み込む
引用:講演資料スライド14
New Relicは、「AIを活用してNew Relicの機能と体験を強化する(AIを使う)」ことと、「AI/LLM搭載アプリケーションのための包括的なフルスタックオブザーバビリティソリューションを提供する(AIを組み込む)」2つの側面からAIに取り組まれているとのことです。
AIを活用したNew Relicの機能強化
New Relic AI (Grok): 生成AIオブザーバビリティアシスタント。チャット形式で計装支援、根本原因の切り分け、自然言語によるクエリ生成・理解、コードのデバッグ支援(エラー詳細説明、テストコード生成、修正コード案提示)、システムヘルスレポート作成、アカウント管理業務などをサポート。
引用:講演資料スライド16
CodeStreamとの連携: IDE上でメソッドレベルのメトリクス表示、NRQLクエリ実行(すごい!)、関連サービス情報の可視化。VSCodeのCopilot Chatから
@newrelic
で質問することも可能。引用:講演資料スライド18
AI/LLMアプリケーションのためのオブザーバビリティ
- New Relic AI Monitoring (AIM) [GA]: 業界初のAIアプリケーション向けAPM。
- アプリケーションからインフラ、AIレイヤー(LLM、ベクトルDB、フレームワークなど)まで、AIアプリケーションのスタック全体をE2Eで可視化。
- プロンプトからレスポンスまでのライフサイクルを追跡し、性能(レイテンシ)、品質(応答内容)、コストを最適化。
- Amazon Bedrock, OpenAI, LangChainなど50以上のAIエコシステムとの統合をサポートし、モデルの使用状況、パフォーマンス、品質、コストを単一ビューで追跡し、最適なモデル選択を支援。
- カスタム属性を活用し、ユーザー毎の利用傾向や応答内容の確認も可能。
引用:講演資料スライド22
2025年以降の展望:Agentic AIとIntelligent Observabilityの深化
Gartnerは2025年のトレンドとして「エージェント型AI」を挙げています。Observabilityも3.0時代を迎え、テレメトリーデータの爆増や対応プロセスの複雑化が進んでいる中、New Relicはこれらの課題に対応するため、AIによるインテリジェントなオブザーバビリティ進化させるべく以下の新機能を紹介していました。
Predictions [Public Preview]: 過去のテレメトリーデータを学習し、将来の傾向(季節パターンなど)を予測。アラートやダッシュボードで活用し、データドリブンな判断を自動化。アラートやダッシュボードでネクストアクションをAIがデータに基づいてレコメンドしてくれるそうです。
引用:講演資料スライド32
Response Intelligence [Public Preview]: インシデント発生時、テレメトリーデータ、過去インシデント、ランブックなどを統合し、AIが影響範囲、過去の類似事象、推奨される対処法を自動的に収集・提示。インシデント対応を効率化。
引用:講演資料スライド33
Agentic Integrations [Public Preview]: ITSM/SDLCツール(ServiceNow, Amazon Q Business, Gemini Code Assist, GitHub Copilotなど)の生成AI内でNew Relicのテレメトリーデータに関するインサイトを取得。AIエージェントが複雑なタスクを自律的に管理し、生産性を向上。
引用:講演資料スライド37
AI時代において、オブザーバビリティはシステム全体の情報を集約する「核」となり、GitHub、AWS、ServiceNow、Microsoft、Google (Gemini) といったエコシステムとの連携がますます重要になると話されていました。
思ったこと:以降もAgentic AI系のサービスとの連携だったり、プラットフォームとの連携が高精度になっていきそうで、いい流れだなぁと遠い目をしながら思っています。CodeStreamの連携でVSCodeでNRQL実行できるのは監視構築ですごく役に立ちそうだなと思ってます。TerraformでAlert Condition作りながら同時検証すれば効率的だなと思います。
まとめ
私自身、結構久しぶりにテックイベントに参加したこともあり、いい刺激になりました。それと共にオブザーバビリティの概念だったり実践についての進化を肌で強く感じ、現状に危機感を感じています。dipのような自社サービスを内製している企業では特にデジタル体験(ユーザ目線)での計測、可視化、向上が重要だと思うので、今後もプラットフォーマーとしてサービス品質を上げていくにあたって、今回得た内容を積極的に実践していかなければと感じました。
Appendix:会場の様子
会場の雰囲気はこちらの記事でご紹介していますので、ぜひご覧いただければ嬉しいです! 講演会場の外ではコンサルタントの方に直接質問できたり、New Relicの社員の皆様のようなイケてる写真を撮ってくれるフォトブースがあったり、終了後はBeer Bash形式の交流会があったり、楽しかったです。