Goで挑む大規模データ処理

1.1K Views

October 31, 25

スライド概要

mrasu

@mrasu

スライド一覧

Webプログラマー。サーバーサイド、DevOps周りが守備範囲。

またはPlayer版

埋め込む »CMSなどでJSが使えない場合

ダウンロード

関連スライド

猫でも分かるUnreal Engineの学び方 - 超初心者向け編 - 2023 v1.0

ue4 ue5 ue-beginner

エピックゲームズジャパン 1.6M

Unreal Engine5 Lumenの仕組みと肝心なところ

ue5 ue-rendering ue-lumen

エピックゲームズジャパン 1.4M

Meta XR SDK(V66-74)でQuestアプリを開発

spatial anchor unity quest pro shaperecognizeractivatestate oculus integration transformfeaturestateprovider building blocks transformrecognizeractivestate ovrsemanticclassification jointdeltaprovider ovrscenemanager jointvelocityactivestate オクルージョン sequenceactivestate scene manager ambisonic depth api metaxraudiosource playerlocomotor meta xr sdk quest3 ovrplayercontroller マルチモーダル meta haptics studio direct touch ui meta xr haptics sdk ovrspatialanchor ovrtrackedkeyboard hapticclipplayer fingerfeaturestateprovider hapticclip ワイドモーションモード wmm mruk mr utility kit voice sdk jointrotationactivestate meta horizon os ui set asw application spacewarp ovr metrics tool unityscene manager colocation discovery コロケーション mx ink passthrough camera api hand tracking microgestures webcamtexturemanager passthroughcamerautils cameraviewermanager hand pose selector recorder

あうぜん 1.1M

UE5レンダリングフロー総おさらい(2024) 基礎編！[CEDEC+KYUSHU 2024]

ue5 unreal engine ue-rendering

エピックゲームズジャパン 1.1M

猫でも分かる UE5.0, 5.1 におけるアニメーションの新機能について【CEDEC+KYUSHU 2022】

ue5 cedec+kyushu ue-animation ue-optimize ue-bp ue-physics ue-sequencer

エピックゲームズジャパン 1M

各ページのテキスト

hatena.go #2 Goで挑む大規模データ処理 2025.10.31 ja.mackerel.io

オブザーバビリティプラットフォームやってます 2

名前は Mackerel 3

出会った問題と対策、話します 4

自己紹介杉中宏亮（id:mrasu / @m_rasu） ● Mackerelのアプリケーションエンジニア ● Web ~ DevOps あたりが興味範囲 ● 最近の興味は、Apache Paimon, Vortex 5

目次 1. はじめに 2. 問題 3. 調査 4. 統計画面を高速化 5. 検索画面を高速化 6. 終わりに 6

目次 1. はじめに 2. 問題 3. 調査 4. 統計画面を高速化 5. 検索画面を高速化 6. 終わりに 7

はじめに ※ 注意今日話す内容は、話者が経験したことを基にしたものです。各種資料は発表のために再現したものです。極力再現していますが、実際とは違うデータです。 8

本日の主役 - APM APMとは、レイテンシーやトレースなど見れるもの 9

10.

本日の主役 - APM APMは、OpenTelemetryから来るトレースをAthenaで検索している AWS 検索 S3 Athena サーバー簡略図 10

11.

オブザーバビリティプラットフォームのデータ量 (参考) Pinterest (Goku): 毎日4.5兆のデータポイント > Goku was ingesting 4.5 trillion datapoints daily and serving 15K queries per second with a p99 latency of 100 millisecond Goku: A Schemaless Time Series Database for Large Scale Monitoring at Pinterest AbemaTV: 165万スパン / 秒 > ピーク時165万スパン/秒に立ち向かえ！オブザーバビリティコストを効率化する ABEMA におけるトレースサンプリングの実践的事例 Observability Conference Tokyo 2025 11

12.

目次 1. はじめに 2. 問題 3. 調査 4. 統計画面を高速化 5. 検索画面を高速化 6. 終わりに 12

13.

問題 APMが正式リリーストレースの保存期間が増加 (3日 -> 14日) 表示できる期間が増えた 13

14.

遅い長期間を表示しようとすると、ローディングが終わらないテナント(オーガニゼーション)を発見 14

15.

目次 1. はじめに 2. 問題 3. 調査 4. 統計画面を高速化 5. 検索画面を高速化 6. 終わりに 15

16.

調査開始 Athenaのクエリが遅いと判明「30秒近くかかってる」確かに大規模で回すと何十分もかかることはある。けど、そんな使い方はしていない。 16

17.

調査 - Explain まずは、explain Athenaには挙動がわかるものがいくつかある ● 「Execution details」ボタン ● Explain ● Explain Analyze 例:「Execution details」の結果 17

18.

調査 - Explain 1番好きなのは「explain analyze verbose」「explain analyze」はクエリを実行して動作を教えてくれる「verbose」をつけるとCPUなどの実行時間や回数がわかる 18

19.

調査 - Explain Analyze Verbose explain analyze verbose してみる (注: ダミーデータです) 19

20.

調査 - Explain Analyze Verbose explain analyze verbose してみる 24万！！！ (注: ダミーデータです) 20

21.

調査 - small ﬁles problem 24万ファイルスキャンしているのはおかしいファイルが多すぎる、いわゆる「small ﬁles problem」 S3でも503 (SlowDown: Please reduce your request rate) エラーが発生 21

22.

「ファイル数減らすぞ！」 22

23.

変更対象遅いクエリを出している画面は2種類ある ● 統計画面 ● トレース検索画面それぞれ対応することに 23

24.

目次 1. はじめに 2. 問題 3. 調査 4. 統計画面を高速化 5. 検索画面を高速化 6. 終わりに 24

25.

統計画面 MackerelはDBやHTTPの統計を出せる 25

26.

統計画面を高速化 DB画面ではSQLごとの合計時間やP95などを出している 26

27.

統計画面を高速化期間を広げるとずっと出なかった 27

28.

統計「統計、毎回計算する必要ある？」 28

29.

事前集計事前に計算しておけば、被っている部分の計算を省略できる集計範囲集計済み期間事前集計部分からはみ出した期間集計前の期間 29

30.

事前集計合計値や平均は事前に計算しておくのは簡単ただし、パーセンタイルを出すためにはソートがいるそんな時に使えるのが、t-digest (パーセンタイルの近似値) これらを事前に計算しておく 30

31.

事前集計 - 定期実行 EventBridge を起点に、定期的に集計集計 Athena 定期実行 EventBridge 保存 S3 31

32.

事前集計 - 定期実行 Athenaの結果を取得する時は、iter.Seqを利用し、結果をs3に保存 (イメージ) 32

33.

事前集計 - できた 2週間を表示できるようになった HTTP画面 33

34.

目次 1. はじめに 2. 問題 3. 調査 4. 統計画面を高速化 5. 検索画面を高速化 6. 終わりに 34

35.

検索 Mackerelのトレース検索画面 35

36.

検索実行時間分布も出る 36

37.

検索期間が長いとずっと出なかった 37

38.

検索 - 柔軟性が必要トレースは色々な条件で検索したい ● 実行時間 ● HTTPステータス ● SQL ● etc.. だから、事前に計算するのは難しい 38

39.

検索 - 理由遅い理由は「ファイル数が多かったから」と同じ (2x万ファイル) データ量が同じでもファイル数が減れば速くなるダミーデータで計測したら 30秒 -> 2秒 39

40.

検索「ファイル、まとめよう」 40

41.

検索 - ファイルファイルはParquetフォーマットで保存している Parquetは変更は苦手 Parquet 愚直にやると、メモリを大量に使う (CPUも使う) 41

42.

検索 - ファイルをまとめるけれど、ParquetはRowGroup単位で分けられている → RowGroupごとにまとめると省メモリ 42

43.

検索 - ファイルをまとめるまとめる処理は ● 定期処理 ● 負荷が高い -> AWS Lambdaで実行 43

44.

検索 - ファイルをまとめる S3には「削除と同時に追加」という原子的な操作はできないつまり、クエリ実行すると重複が起きる可能性がある重複を起こさないために、複数テーブルにして合算小さいファイル用のテーブル (まとめる前) まとめたファイル用のテーブル 44

45.

検索 - 速くなった 2週間でもでるようになった 45

46.

目次 1. はじめに 2. 問題 3. 調査 4. 統計画面を高速化 5. 検索画面を高速化 6. 終わりに 46

47.

終わりにこれで、終わらないローディングが終わるようになった色々対策考えたけれど、無難な方法に落とし込めてよかった 47

48.

終わりに以上。ご清聴、ありがとうございました。 48