265 Views
August 19, 25
スライド概要
Langfuse Night #3 で使用した資料です。
Slides are just my own.
開発/運用者にやさしい LLMアプリの基盤 - Langfuse & Kong Gateway - Shuhei Kawamura / Kong K.K. © Kong Inc.
自己紹介 川村 修平 / Shuhei Kawamura 所属: Kong 株式会社 - Senior Field Engineer 趣味: サウナ / ゴルフ / スノーボード ひとこと: 筋トレ始めました @shukawam 発売予定です! © Kong Inc.
LLMアプリにおけるよくある関心ごと © Kong Inc.
Langfuse + Kong Gatewayという選択肢 © Kong Inc.
Kong GatewayのAI関連プラグイン LLMアプリケーションの開発 LLMアプリケーションを安全に使わせる トークン量削減、その他 © Kong Inc.
トレースをちゃんと繋げたい Langfuse SDK v3 は、OpenTelemetryクライアントの薄いラッパー Kong Gatewayは、OpenTelemetry互換の計装が含まれている = プラグイン呼び出し含めてきちんとトレースが繋がると素敵な世界になりそう プラグイン呼び出し含めきちんとトレースが 繋がれば、開発・運用時の恩恵を受けつつ しっかりオブザーバビリティを高めることが可能! © Kong Inc.
Langfuse SDK v3のSpanProcessor実装 通常、 OTel Collectorが期待する形式 (<collector-endpoint>/v1/traces) とは、異なるので少し工夫が必要 参考: https://github.com/langfuse/langfuse-python/blob/main/langfuse/_client/span_processor.py#L32-L106 © Kong Inc.
解決例 1. OpenTelemetry Collector - OTLP ReceiverのURLパスを修正する ○ 他コンポーネントの出力先も調整する必要がある 2. OpenLIT/OpenLLMetryのような GenAI Instrumentationライブラリを利用する ○ 他コンポーネントに影響を与えずに統合できるので、個人的にはこっち推し © Kong Inc.
トレースの一例 プラグインを用いた恩恵を受けつつも、 オブザーバビリティはしっかりと 確保することが可能 © Kong Inc.
まとめ + 若干の注意事項 まとめ: ● LLMアプリケーションの関心ごとも API Gatewayにオフロードすることで楽に実装可能 ● オフロードしたとしても、継続的改善のためのオブザーバビリティは重要 ● Langfuse + Kong Gatewayの場合 ○ OpenTelemetry Collector(OTLP Receiver)のURLパスをLangfuseの形式に合わせる or ○ OpenLIT/OpenLLMetryなどのGenAI Instrumentationライブラリを使用する 若干の注意事項: ● Langfuse(OSS)でOpenTelemetryエンドポイントを使う - v3.22.0+が必要 ● OpenTelemetryエンドポイントは、 gRPCがサポートされていないので HTTP/protobufを使う © Kong Inc.
Thank you! © Kong Inc.