Menu

How to set up instrumentation with OpenTelemetry

可观测性对于理解和优化 Next.js 应用程序的行为和性能至关重要。

随着应用程序变得越来越复杂,识别和诊断可能出现的问题变得日益困难。通过利用可观测性工具,如日志记录和指标,开发人员可以深入了解其应用程序的行为并识别需要优化的区域。借助可观测性,开发人员可以在问题变成重大问题之前主动解决它们,并提供更好的用户体验。因此,强烈建议在你的 Next.js 应用程序中使用可观测性来提升性能、优化资源并增强用户体验。

我们建议使用 OpenTelemetry 对你的应用程序进行监测。 这是一种与平台无关的应用程序监测方式,允许你更改可观测性提供商而无需更改代码。 阅读官方 OpenTelemetry 文档以获取有关 OpenTelemetry 及其工作原理的更多信息。

本文档使用_Span_、TraceExporter 等术语,所有这些都可以在 OpenTelemetry 可观测性入门中找到。

Next.js 支持开箱即用的 OpenTelemetry 监测,这意味着我们已经对 Next.js 本身进行了监测。

入门指南

OpenTelemetry 具有可扩展性,但正确设置它可能相当繁琐。 这就是为什么我们准备了 @vercel/otel 包来帮助你快速入门。

使用 @vercel/otel

首先,安装以下包:

Terminal
npm install @vercel/otel @opentelemetry/sdk-logs @opentelemetry/api-logs @opentelemetry/instrumentation

接下来,在项目的根目录(或者如果使用 src 文件夹,则在其中)创建一个自定义的 instrumentation.ts(或 .js)文件:

your-project/instrumentation.ts
TypeScript
import { registerOTel } from '@vercel/otel'
 
export function register() {
  registerOTel({ serviceName: 'next-app' })
}

查看 @vercel/otel 文档获取更多配置选项。

值得注意的是

  • instrumentation 文件应该在项目的根目录中,而不是在 apppages 目录内。如果你使用 src 文件夹,则将文件放在 src 中,与 pagesapp 并列。
  • 如果你使用 pageExtensions 配置选项添加后缀,你还需要更新 instrumentation 文件名以匹配。
  • 我们创建了一个基本的 with-opentelemetry 示例供你使用。

手动配置 OpenTelemetry

@vercel/otel 包提供了许多配置选项,并且应该能够满足大多数常见用例的需求。但如果它不适合你的需求,你可以手动配置 OpenTelemetry。

首先,你需要安装 OpenTelemetry 包:

Terminal
npm install @opentelemetry/sdk-node @opentelemetry/resources @opentelemetry/semantic-conventions @opentelemetry/sdk-trace-node @opentelemetry/exporter-trace-otlp-http

现在你可以在 instrumentation.ts 中初始化 NodeSDK。 与 @vercel/otel 不同,NodeSDK 与 edge runtime 不兼容,所以你需要确保只有在 process.env.NEXT_RUNTIME === 'nodejs' 时才导入它们。我们建议创建一个新文件 instrumentation.node.ts,只有在使用 node 时才有条件地导入:

instrumentation.ts
TypeScript
export async function register() {
  if (process.env.NEXT_RUNTIME === 'nodejs') {
    await import('./instrumentation.node.ts')
  }
}
instrumentation.node.ts
TypeScript
import { OTLPTraceExporter } from '@opentelemetry/exporter-trace-otlp-http'
import { Resource } from '@opentelemetry/resources'
import { NodeSDK } from '@opentelemetry/sdk-node'
import { SimpleSpanProcessor } from '@opentelemetry/sdk-trace-node'
import { ATTR_SERVICE_NAME } from '@opentelemetry/semantic-conventions'
 
const sdk = new NodeSDK({
  resource: new Resource({
    [ATTR_SERVICE_NAME]: 'next-app',
  }),
  spanProcessor: new SimpleSpanProcessor(new OTLPTraceExporter()),
})
sdk.start()

这样做相当于使用 @vercel/otel,但可以修改和扩展一些 @vercel/otel 未公开的功能。如果需要 edge runtime 支持,你将必须使用 @vercel/otel

测试你的监测

你需要一个带有兼容后端的 OpenTelemetry 收集器来在本地测试 OpenTelemetry 追踪。 我们建议使用我们的 OpenTelemetry 开发环境

如果一切正常,你应该能够看到标记为 GET /requested/pathname 的根服务器 span。 该特定追踪的所有其他 span 将嵌套在其下。

Next.js 跟踪的 span 比默认发出的要多。 要查看更多 span,你必须设置 NEXT_OTEL_VERBOSE=1

部署

使用 OpenTelemetry Collector

当你使用 OpenTelemetry Collector 部署时,你可以使用 @vercel/otel。 它在 Vercel 上和自托管时都能正常工作。

在 Vercel 上部署

我们确保 OpenTelemetry 在 Vercel 上开箱即用。

遵循 Vercel 文档将你的项目连接到可观测性提供商。

自托管

部署到其他平台也很简单。你需要启动自己的 OpenTelemetry Collector 来接收和处理来自 Next.js 应用程序的遥测数据。

要做到这一点,请遵循 OpenTelemetry Collector 入门指南,它将指导你设置收集器并配置它以接收来自 Next.js 应用程序的数据。

一旦你的收集器启动并运行,你可以按照各自的部署指南将 Next.js 应用程序部署到你选择的平台。

自定义导出器

OpenTelemetry Collector 不是必需的。你可以将自定义 OpenTelemetry 导出器与 @vercel/otel手动 OpenTelemetry 配置一起使用。

自定义 Span

你可以使用 OpenTelemetry API 添加自定义 span。

Terminal
npm install @opentelemetry/api

以下示例演示了一个获取 GitHub 星星数并添加自定义 fetchGithubStars span 来跟踪获取请求结果的函数:

import { trace } from '@opentelemetry/api'
 
export async function fetchGithubStars() {
  return await trace
    .getTracer('nextjs-example')
    .startActiveSpan('fetchGithubStars', async (span) => {
      try {
        return await getValue()
      } finally {
        span.end()
      }
    })
}

register 函数将在你的代码在新环境中运行之前执行。 你可以开始创建新的 span,它们应该被正确地添加到导出的追踪中。

Next.js 中的默认 Span

Next.js 自动为你检测多个 span,以提供对应用程序性能的有用洞察。

span 上的属性遵循 OpenTelemetry 语义约定。我们还在 next 命名空间下添加了一些自定义属性:

  • next.span_name - 复制 span 名称
  • next.span_type - 每个 span 类型都有一个唯一标识符
  • next.route - 请求的路由模式(例如 /[param]/user
  • next.rsc(true/false)- 请求是否为 RSC 请求,例如预取
  • next.page
    • 这是 app router 使用的内部值
    • 你可以将它视为特殊文件的路由(如 page.tslayout.tsloading.ts 等)
    • 它只有在与 next.route 配对时才能用作唯一标识符,因为 /layout 可以用于标识 /(groupA)/layout.ts/(groupB)/layout.ts

[http.method] [next.route]

  • next.span_typeBaseServer.handleRequest

此 span 表示进入 Next.js 应用程序的每个传入请求的根 span。它跟踪请求的 HTTP 方法、路由、目标和状态码。

属性:

render route (app) [next.route]

  • next.span_typeAppRender.getBodyResult

此 span 表示在 app router 中渲染路由的过程。

属性:

  • next.span_name
  • next.span_type
  • next.route

fetch [http.method] [http.url]

  • next.span_typeAppRender.fetch

此 span 表示在你的代码中执行的 fetch 请求。

属性:

可以通过在环境中设置 NEXT_OTEL_FETCH_DISABLED=1 来关闭此 span。当你想使用自定义 fetch 监测库时,这很有用。

executing api route (app) [next.route]

  • next.span_typeAppRouteRouteHandlers.runHandler

此 span 表示在 app router 中执行 API 路由处理程序。

属性:

  • next.span_name
  • next.span_type
  • next.route

getServerSideProps [next.route]

  • next.span_typeRender.getServerSideProps

此 span 表示为特定路由执行 getServerSideProps

属性:

  • next.span_name
  • next.span_type
  • next.route

getStaticProps [next.route]

  • next.span_typeRender.getStaticProps

此 span 表示为特定路由执行 getStaticProps

属性:

  • next.span_name
  • next.span_type
  • next.route

render route (pages) [next.route]

  • next.span_typeRender.renderDocument

此 span 表示为特定路由渲染文档的过程。

属性:

  • next.span_name
  • next.span_type
  • next.route

generateMetadata [next.page]

  • next.span_typeResolveMetadata.generateMetadata

此 span 表示为特定页面生成元数据的过程(单个路由可以有多个这样的 span)。

属性:

  • next.span_name
  • next.span_type
  • next.page

resolve page components

  • next.span_typeNextNodeServer.findPageComponents

此 span 表示为特定页面解析页面组件的过程。

属性:

  • next.span_name
  • next.span_type
  • next.route

resolve segment modules

  • next.span_typeNextNodeServer.getLayoutOrPageModule

此 span 表示加载布局或页面的代码模块。

属性:

  • next.span_name
  • next.span_type
  • next.segment

start response

  • next.span_typeNextNodeServer.startResponse

这个零长度 span 表示响应中发送第一个字节的时间。