Kotlin

A concise multiplatform language developed by JetBrains

访问 Kotlin 网站

AI Ecosystem Kotlin

推出 Tracy：适用于 Kotlin 的 AI 可观测性库

Sue

Read this post in other languages:

English

Tracy 是一款开源 Kotlin 库，可以在几分钟内为 AI 赋能的应用程序添加生产级可观测性。它可以帮助您调试故障、测算执行时间，并跟踪模型调用、工具调用和您的自定义应用程序逻辑中的 LLM 使用情况。归根结底，全面的可观测性确保您可以获取了解真实应用程序行为的准确数据，从宏观趋势到细粒度跟踪分析性能，为全面的在线和离线评估提供支持。

Tracy 与常用的 Kotlin/LLM 技术栈（包括 OkHttp 和 Ktor 客户端，以及 OpenAI、Anthropic 和 Gemini 服务）无缝协作，它的底层基于 OpenTelemetry 构建。此架构可以确保开发者全面灵活掌控跟踪数据，支持以标准形式将数据导出至任何兼容的后端（如 Jaeger、Zipkin 或 Grafana），并直接与 Langfuse 和 W&B Weave 这类专用 LLM 工程平台集成。

尽管 Spring AI 或 Koog 等成熟的 AI 框架提供内置可观测性，但 LLM 调用必须完全通过其框架发起才能实现跟踪，并且这类框架无法通过简易的方式跟踪内部应用程序流。相比之下，Tracy 可以通过 API 或 HTTP 客户端插桩的方式来监测 LLM 使用情况。它还通过为 Kotlin 函数或代码块添加注解的方式帮助您理清 AI 组件或内部 AI 智能体状态的时序与因果关系。

我们已开放 Tracy 的源代码，诚邀您帮助我们扩展其功能 – 无论是请求新增 AI 后端或 API 客户端集成，还是提交拉取请求实现相应功能。

AI 可观测性的组件和 Tracy 的解决方案

作为工程师，无论是为现有应用程序添加可观测性，还是从头开始构建新应用程序，我们都想要跟踪、存储和分析以下内容：

LLM 调用元数据，包括被调用的 API、模型及其参数。我们可以选择在开发过程中跟踪 LLM 输入和输出，以进行调试，同时确保生产环境中不会跟踪这些数据。
引发和响应 LLM 调用的应用程序逻辑流 – 即某次调用的发起位置及涉及的工具。

想象一个非常简单的问候用户的 LLM 聊天应用程序，通过部署工具让问候更具个性化。利用 OpenAI 客户端，应用程序代码可能是这样的：

/** Interface for LLM tool */
interface Tool {
   /** Tool call */
   fun execute(): T
}

/** Gets the current user's name from the system */
class GetUserName() : Tool { ... }

/** Gets the current date and time */
class GetCurrentDateTime() : Tool { ... }

fun main() {
   // Create OpenAI-client using environment variables
   val client: OpenAIClient = OpenAIOkHttpClient.fromEnv()
   ...
   val params = ResponseCreateParams.builder()
       .model(ChatModel.GPT_4O_MINI)
       .maxOutputTokens(2048)
       .addTool(GetUserName::class.java)
       .addTool(GetCurrentDateTime::class.java)
       .input(ResponseCreateParams.Input.ofResponse(inputs))
       .build()

   // Get the response. 
   // In a real application, it would use a loop to process tool calls.
   val response: Response = client.responses().create(params)
   ...
   println(finalGreeting)
}

此时，需要跟踪的重要内容为：

问候智能体被调用的情况。
LLM 调用。
工具执行。

我们可以使用基本的 OpenTelemetry SDK，但这样便需要手动添加插桩代码，且这会导致工具调用跟踪的代码重复。

在理想场景下，我们将能够通过配置一次工具跟踪对所有实现进行自动跟踪，从而确保绝不会出现新增工具未被跟踪的问题。Tracy 让理想场景变为现实。

通过 Tracy 添加可观测性

Tracy 提供的三个高级 API 可以帮助我们全面跟踪聊天应用程序。

限定作用域的 span

withSpan API 可用于创建限定作用域的 span。这些 span 会自动在块开始时激活，在块结束时终止，从而确保正确的嵌套和时序。

fun main() {
   // Encapsulation into withSpan ensures that all nested events will be
   // traced as part of the greeting agent’s work.  
   withSpan("Greeting agent") {
       ...
   }  
}

LLM 客户端插桩

LLM 调用是任意 AI 智能体的重要组成部分。它们决定了应用程序的成本、延迟和效率，是出现问题时首先要排查的对象。因此，为 LLM 客户端增加可观测性应简单易行，并尽量减少对代码库的更改。例如，为 OpenAI 客户端添加插桩就非常简单，只需完成以下步骤：

val client = OpenAIOkHttpClient.fromEnv()
// All calls made with the instrumented client are traced.
instrument(client)

默认情况下，客户端插桩仅会跟踪元数据。要跟踪可能包含敏感数据的 LLM 输入和输出，必须以编程方式明确启用此功能，代码为：

TracingManager.traceSensitiveContent()

也可以在运行时启用跟踪，将环境变量 TRACY_CAPTURE_INPUT 和 TRACY_CAPTURE_OUTPUT 设为 true 即可。

工具调用和函数跟踪

LLM 高度依赖工具：各类工具可以帮助 LLM 高效完成确定性任务、节省 token，还能与其运行环境进行交互。作为开发者，我们同样重视工具，但为代码库中的 LLM 工具逐一添加可观测性是一项繁琐且极易遗漏的任务。

虽然 Python 框架中通过装饰器很好地解决了这类问题，但 Kotlin 开发者此前只能投以羡慕的目光。Tracy 彻底改变了这一现状。借助基于注解的跟踪，开发者只需为接口方法添加 @Trace 注解，便可在所有实现类中实现跟踪。如果只是想跟踪某个隔离的方法，操作也同样简单。@Trace 注解同样适用于个别方法或函数。

/** Interface for LLM tool */
interface Tool {
   // All tool calls are now traced
   @Trace(name = "Tool Call")
   fun execute(): T
}

总结

捕获应用程序遥测数据只是第一步。后续还需要将这些数据路由至合适的后端进行存储和分析。尽管我们强烈建议开发者使用专为 LLM 跟踪设计的可观测性解决方案，并直接提供对 Langfuse 和 W&B Weave 的支持，但 Tracy 也提供便捷的方式，可将跟踪发送至任何兼容 OpenTelemetry 的后端、文件或控制台。仓库中包含大量示例，如需获取本文示例的完整代码，请点击此处。

借助 Tracy，只需几秒即可配置向 Langfuse 的遥测数据导出。最后，您会得到捕获了 LLM 和工具调用的层级化应用程序跟踪。

未来计划

我们坚信，无论未来几年 LLM 如何发展，可观测性始终是高效、可靠 AI 工程的核心。无论底层 LLM 的性能变得多么强大，开发阶段和生产环境中仍需对使用 LLM 的应用程序进行调试和评估。Tracy 正是为了满足这一需求而创建的，即为 Kotlin 生态系统引入生产级 AI 可观测性。

这只是一个开端！您可以通过提交问题、提交拉取请求，或在项目中试用 Tracy 并分享反馈，为Kotlin AI 生态系统的发展做出贡献。让我们共同开启跟踪之旅！

本博文英文原作者：

Anton Bragin

ACP 智能体注册表已上线：在 JetBrains IDE 中查找并连接 AI 编码智能体

Discover more

JetBrains 将 Kotlin 视为现代后端开发的坚实基础，这不仅是因为它的技术优势，还因为它能够帮助开发者更高效地构建可靠、可维护的系统。我们一直在努力使 Kotlin 成为专业服务器端工作的首选，为此，我们荣幸宣布 JetBrains 与 Spring 团队将进一步加深合作。这一战略合作伙伴关系涵盖多个关键领域，将使 Kotlin 成为构建 Spring 应用程序更自然、更强大的选择。 Spring Framework 联合创始人兼项目负责人 Juergen Hoeller 和 Spring 核心提交者兼 Kotlin 支持负责人 Sébastien Deleuze 表示： “多…

几年前，我们萌生了创建 Kotlin Multiplatform IDE 的想法，希望以此推动 KMP 应用程序的发展。我们以 Fleet 平台为基础开始了这项冒险，并打算将其作为独立 IDE 发布。在此期间，我们收到了客户的反馈，特别是使用 KMP 的客户，他们希望在 IntelliJ Platform 上看到类似的功能和对 KMP 的支持，换句话说，也就是在 IntelliJ IDEA 和 Android Studio 中。随着 Google 在 Android 上正式支持 KMP，这些请求也越来越多。在过去的一年里，我们还观察到应用程序开发方式的重大进展，这也是 JetBrain…

在 Kotlin 2.0.0 版本临近发布之际，K2 编译器现已可供试用！在这篇博文中，我们将探讨 K2 编译器在各种项目中的性能，并为您提供收集性能统计信息的工具。 K2 编译器经过很长时间才达到稳定版。决定从头重写编译器后，我们添加了新的类型推断算法、新的 JVM 和 JS IR（中间表示）后端，以及新的前端。前端经过根本性更改，开始使用包含更多语义信息的统一数据结构。这项更改让编译更高效，也让 IntelliJ IDEA 可以更好地分析您的 Kotlin 代码。这一举措的目标是加快新语言功能的开发、统一 Kotlin 支持的所有平台，以及为 Kotlin 开发者提高性能。要…

Data Analysis with Kotlin DataFrame: A Step-by-Step Guide

简介我们将利用一个教程系列介绍如何使用 Kotlin DataFrame 和 Kandy 库轻松操作和直观呈现数据，这是系列的第一部分。教程面向普通 Kotlin 开发者，因此您不需要具备数据分析或类似框架（如 pandas 或 Apache Spark）的经验。不过，您应该熟悉 Kotlin 语言，并且已经在 IntelliJ IDEA 中创建过基于 Kotlin 的项目。在本教程中，您将学习：如何从 CSV 文件创建 DataFrame。如何执行常见操作。如何显示或导出结果。您将在 Kotlin Notebook 中工作，既方便又能访问 Kandy 绘…

Kotlin

推出 Tracy：适用于 Kotlin 的 AI 可观测性库

AI 可观测性的组件和 Tracy 的解决方案

通过 Tracy 添加可观测性

限定作用域的 span

LLM 客户端插桩

工具调用和函数跟踪

总结

未来计划

Anton Bragin

Discover more

加强后端开发中的 Kotlin：与 Spring 建立战略合作伙伴关系

Kotlin Multiplatform 工具 – 改变方向

K2 编译器性能基准以及如何在项目中测量性能

使用 Kotlin DataFrame 执行数据分析的分步指南

Kotlin

推出 Tracy：适用于 Kotlin 的 AI 可观测性库

AI 可观测性的组件和 Tracy 的解决方案

通过 Tracy 添加可观测性

限定作用域的 span

LLM 客户端插桩

工具调用和函数跟踪

总结

未来计划

Anton Bragin

Subscribe to Kotlin Blog updates

Discover more

加强后端开发中的 Kotlin：与 Spring 建立战略合作伙伴关系

Kotlin Multiplatform 工具 – 改变方向

K2 编译器性能基准以及如何在项目中测量性能

使用 Kotlin DataFrame 执行数据分析的分步指南