PG-Stromの性能評価レポート～ Star Schema Benchmark を例に～

842 Views

March 18, 24

#PG-Strom #GPU #PostgreSQL #Star Schema Benchmark #ビッグデータ分析

スライド概要

2024年3月15日に東京・大崎で開催した『「GPUを活用したビッグデータ分析基盤を構築しよう」PG-Strom v5リリース記念』イベントでの表記発表資料です。

イベントURL:
https://bakusokudb.connpass.com/event/311268/

sakaik

@sakaik

スライド一覧

最近はココ and/or Speaker deck ( https://speakerdeck.com/sakaik ) に資料を公開しています。

またはPlayer版

埋め込む »CMSなどでJSが使えない場合

ダウンロード

関連スライド

来たぞ登記所備付XMLデータ(1)～～ sakaik がこれまでに知った範囲の情報と見てきたファイルフォーマットについて解説する回

gis moj map xml

sakaik 11.1K

周辺知識から理解するMySQL の GIS機能～ClubMySQL #4

opensource gis mysql rdbms spatial geohash myna 座標系三角点 clubmysql 標高

sakaik 8.9K

『登記所備付地図XMLデータ』に触れてみよう〜法務省が公開した大規模オープンデータとは一体何なのか〜

moj map xml gis opensquare

sakaik 5.1K

MySQL8.0の「地理情報」を理解しよう入門～いまからはじめるGIS

open source database gis mysql spatial osc

sakaik 2.5K

MySQLで扱う空間情報のきほん～MySQL Cafe #6

gis mysql myna technology cafe

sakaik 1.6K

MySQL 5.7 認定試験を受けてみたと傾向と対策～MyNA会2019年8月

oracle mysql certification passed myna オラクル合格認定試験 mysql administrator mysqlユーザ会

sakaik 1.6K

各ページのテキスト

「GPUを活用したビッグデータ分析基盤を構築しよう」 PG-Strom v5リリース記念イベント PG-Stromの性能評価レポート～ Star Schema Benchmark を例に～ 2024/03/15 有限会社アートライ坂井恵

3 PG-Strom(イメージ)

自己紹介 • 坂井恵（さかいけい） • 有限会社アートライ • 日本仮想化技術株式会社「爆速DB Powered by PG-Strom 」チームに参画中爆速DBのアイキャッチ欲しいよね「データベース」で「爆速」なイメージで、そうそう「PostgreSQL」のエクステンションなのでぞうさんも！ by Sak-AI 「爆速DBイメージキャラクタ－(非公認)」

この時間のお話 PG-Strom基礎知識スタースキーマベンチマーク(ssb) ssbの理解 PG-Strom使用時のssb計測結果紹介

PG-Strom基礎知識(キーポイント) 概要は、この前のセッションで宮原さんが詳細は、この後のセッションで海外さんが説明してくれるので、私からはざっくりと説明すると： • 数千コアを持つGPUの能力を活用した並列処理による高速化 • 内部のデータ転送バスを効率よく活用しての高速化 • Apache Arrowファイルを使用可能 • 地理空間情報(GIS)データの検索も高速

PG-Stromを使ってほしい人（私見） • 大量のデータを持っていて、集計処理等をしたい人 • データ件数数億件～ • データサイズ GBの後半からTB級～ • 特に統計家の人にマッチしていると考えています

ベンチマーク実施の紹介

Star Schema Benchmark 概要 • OLAPでのDBMS性能測定ベンチマーク(DWH) • 売上データを中心として、周辺テーブルと結合するクエリを実施 • 数億件単位からのデータ量で測定実施される事が多い印象(私見)

Star Schema Benchmarkのテーブル • lineorderテーブルを中心としたスタースキーマ型のテーブル群 • 5つのテーブルからなる

10.

11.

Star Schema Benchmarkのクエリ • Q1～Q4 の4パート、計13個のクエリ • 各パートの特徴(一部) • Q1ではグルーピングなしで2テーブル結合での抽出 • Q2からQ4は4~5テーブル結合で、様々なグルーピング

12.

Star Schema Benchmark のクエリ(参考)

13.

データ件数 (参考)ssbデータ生成時の与パラメタと件数の対応 TABLE s10 s20 300,000 600,000 1,500,000 2,556 2,556 part 800,000 supplier 100,000 customer date1 lineorder s50 s100 s200 s400 3,000,000 6,000,000 12,000,000 2,556 2,556 2,556 2,556 1,000,000 1,200,000 1,400,000 1,600,000 1,800,000 200,000 500,000 1,000,000 2,000,000 4,000,000 59,986,052 119,994,608 300,005,811 600,037,902 1,200,018,434 2,400,012,063 lineorder生成時間約30分約65分 lineorderサイズ(¥d+) 175GB 350GB

14.

15.

Star Schema Benchmark 概要まとめ • lineorderテーブルを中心とする 5つのテーブル • Q1_1 から Q4_3 までの13個のクエリ • データ生成時のパラメタで件数を調整できるが、今回は、lineorderが24億件のデータセットで実施

16.

今回の Star Schema Benchmark実施条件 • CPU: AMD EPYC 7443 24-Core Processor (24 cores/48 Processsors) • OS : Red Hat Enterprise Linux release 8.8 (Ootpa) • Memory : 131,330,728 kB • GPU : NVIDIA A100 80GB PCIe (6,912 Cuda cores) • CUDA Version : 12.3 • PostgreSQL Version : 16.1

17.

Star Schema Benchmark実施結果 (s=400) PG-Strom async=18 (sec) ssbm処理時間 s=400 CPU(青) vs GPU(橙) (async=18) 90 x3.30 x3.29 x3.28 x3.15 x2.54 x2.89 x2.31 x3.25 x3.26 x3.22 x4.62 x3.49 Q4_1 Q4_2 x3.71 80 70 60 50 40 30 20 10 0 Q1_1 Q1_2 Q1_3 Q2_1 Q2_2 Q2_3 Q3_1 Q3_2 Q3_3 Q3_4 Q4_3

18.

Star Schema Benchmark • 前のページの結果はPG-Stromのpg_strom.max_async_task パラメタの値を "18" に設定して実施したもの（これが最適値だった） • pg_strom.max_async_task パラメタ値により速度は変化(環境に依存) • 例として pg_strom.max_async_task = 12 で実施した結果を次ページに示す

19.

Star Schema Benchmark実施結果 (s=400) PG-Strom async=12 (sec) ssbm s=400 90 x2.39 x2.40 x2.40 x2.18 x1.93 x2.15 x2.15 x2.26 x2.38 x2.38 x3.27 x2.86 x2.89 80 70 60 50 40 30 20 10 0 Q1_1 Q1_2 Q1_3 Q2_1 Q2_2 Q2_3 Q3_1 CPU GPU avg. avg. Q3_2 Q3_3 Q3_4 Q4_1 Q4_2 Q4_3

20.

再掲 Star Schema Benchmark実施結果 (s=400) (sec) PG-Strom async=18 90 ssbm s=400 CPU vs GPU(async=18) x3.30 x3.29 x3.28 x3.15 x2.54 x2.89 x2.31 x3.25 x3.26 x3.22 x4.62 x3.49 x3.71 80 70 60 50 40 30 20 10 0 Q1_1 Q1_2 Q1_3 Q2_1 Q2_2 Q2_3 Q3_1 Q3_2 Q3_3 Q3_4 Q4_1 Q4_2 Q4_3

21.

(参考) s10～s400 results (処理時間) (unit. ms) ssbm on Shachi s=10 4,000 3,000 ssbm on Shachi s=20 5,000 12,000 4,000 10,000 8,000 3,000 2,000 6,000 2,000 1,000 4,000 1,000 0 2,000 0 CPU GPU avg. avg. 0 ssbm on Shachi s=100 20,000 15,000 10,000 5,000 0 ssbm on Shachi s=50 CPU GPU CPU GPU avg. avg. avg. avg. ssbm on Shachi s=200 ssbm on Shachi s=400 50,000 100,000 40,000 80,000 30,000 60,000 20,000 40,000 10,000 20,000 0 0 CPU GPU CPU GPU CPU GPU avg. avg. avg. avg. avg. avg.

22.

件数増大に伴うCPU/GPU処理時間変化 s=10での実施結果を 1.0 とした場合の処理時間の比率データサイズごとの処理時間比（CPU） (sec) (横軸：sパラメタ値）データサイズごとの処理時間比（GPU） (sec) 70 45 40 60 35 50 30 40 25 30 20 15 20 10 10 0 5 0 50 100 150 200 250 300 350 Q1_1 Q1_2 Q1_3 Q2_1 Q2_2 Q2_3 Q3_2 Q3_3 Q3_4 Q4_1 Q4_2 Q4_3 400 Q3_1 450 0 0 50 100 150 200 250 300 350 Q1_1 Q1_2 Q1_3 Q2_1 Q2_2 Q2_3 Q3_2 Q3_3 Q3_4 Q4_1 Q4_2 Q4_3 400 Q3_1 → ssb計測に於いて、PG-Strom(GPU)では、件数の増大に伴う処理時間がリニアとなる 450

23.

(付録)PG-Stromパッケージを使用したssb実施方法 • PG-Stromのソースコードを取得 • https://github.com/heterodb/pg-strom • pg-strom/test/ssbm に移動し、データ生成ツールを make • → dbgen-ssbm ツールの実行ファイルが生成される • PostgreSQL上に ssb DBとテーブル群を作成 • $ createdb -Upostgres ssb --tablespace=XXXX • $ psql -Upostgres ssb -f ./ssbm-ddl.sql • データを生成 time time time time time echo echo echo echo echo "¥¥copy "¥¥copy "¥¥copy "¥¥copy "¥¥copy customer date1 part supplier lineorder • ベンチマーク実行 FROM FROM FROM FROM FROM PROGRAM PROGRAM PROGRAM PROGRAM PROGRAM './dbgen-ssbm './dbgen-ssbm './dbgen-ssbm './dbgen-ssbm './dbgen-ssbm -Tc -Td -Tp -Ts -Tl -X -X -X -X -X -s -s -s -s -s 100' 100' 100' 100' 100' DELIMITER DELIMITER DELIMITER DELIMITER DELIMITER '|';" '|';" '|';" '|';" '|';" | | | | | psql psql psql psql psql -Upostgres -Upostgres -Upostgres -Upostgres -Upostgres ssb ssb ssb ssb ssb • $ ./run-ssbm.sh ssb またはユーザ名を指定する場合は、 • $ ./run-ssbm.sh "-Upostgres ssb" • 結果ログ確認 • ~/ssbm-logs/ に出力されたログを確認する • explain の結果とクエリ実施結果が出力されますログファイル例: log_strom_*_20240315a.txt log_strom_*_20240315b.txt log_strom_*_20240315c.txt log_pgsql_*_20240315a.txt log_pgsql_*_20240315b.txt log_pgsql_*_20240315c.txt

https://github.com/heterodb/pg-strom

24.

今日のおはなし（まとめ） • PG-Stromの概要概要を紹介しました。GPU＋内部転送速度 • ベンチマーク手法のひとつである Star Schema Benchmark(ssb) がどのようなものかを紹介しました • PG-Stromを用いたssbベンチマーク結果を紹介しました • PG-Stromを用いたssbベンチマーク実施方法を紹介しました

25.

お問い合わせ先メールにて [email protected] 評価したい等々、お気軽にお問い合わせください