PostgreSQLの基本構造とチューニング

19.1K Views

July 06, 23

#postgresql #データベース #sqlチューニング #PostgreSQL #Database #SQL #Tuning #Query

スライド概要

mariko nakai

@7828477796

スライド一覧

またはPlayer版

埋め込む »CMSなどでJSが使えない場合

（ダウンロード不可）

関連スライド

猫でも分かるUnreal Engineの学び方 - 超初心者向け編 - 2023 v1.0

ue4 ue5 ue-beginner

エピックゲームズジャパン 1.7M

Unreal Engine5 Lumenの仕組みと肝心なところ

ue5 ue-rendering ue-lumen

エピックゲームズジャパン 1.5M

UE5レンダリングフロー総おさらい(2024) 基礎編！[CEDEC+KYUSHU 2024]

ue5 unreal engine ue-rendering

エピックゲームズジャパン 1.3M

Meta XR SDK(V66-74)でQuestアプリを開発

spatial anchor unity quest pro shaperecognizeractivatestate oculus integration transformfeaturestateprovider building blocks transformrecognizeractivestate ovrsemanticclassification jointdeltaprovider ovrscenemanager jointvelocityactivestate オクルージョン sequenceactivestate scene manager ambisonic depth api metaxraudiosource playerlocomotor meta xr sdk quest3 ovrplayercontroller マルチモーダル meta haptics studio direct touch ui meta xr haptics sdk ovrspatialanchor ovrtrackedkeyboard hapticclipplayer fingerfeaturestateprovider hapticclip ワイドモーションモード wmm mruk mr utility kit voice sdk jointrotationactivestate meta horizon os ui set asw application spacewarp ovr metrics tool unityscene manager colocation discovery コロケーション mx ink passthrough camera api hand tracking microgestures webcamtexturemanager passthroughcamerautils cameraviewermanager hand pose selector recorder

あうぜん 1.2M

猫でも分かる UE5.0, 5.1 におけるアニメーションの新機能について【CEDEC+KYUSHU 2022】

ue5 cedec+kyushu ue-animation ue-optimize ue-bp ue-physics ue-sequencer

エピックゲームズジャパン 1M

【DeNA】新卒エンジニア向け会社説明資料

DeNA新卒採用 1M

各ページのテキスト

PostgreSQLの基本構造とチューニング対応バージョン 11 Mariko Nakai

進行について • PostgreSQLの基本について約30分通しで説明 • 15分の質問タイム • SQLのチューニングについて約30分通しで説明 • 15分の質問タイム全体を通し、トータル1時間半を予定しています。途中でのご質問は控えていただき、質問タイムにまとめてご質問ください。その際、該当のページ番号をお知らせください。ページ番号は各ページ右下にあります。 2

わかるようになる事 PostgreSQLデータベースの基本構造遅いSQLの見つけ方 SQLの実行計画、実行時間の取得と見方 SQLのチューニング方法 3

PostgreSQLの基本構造

PostgreSQL？それ何？何がいいの？いつもこれを使うの？データベースです。用途を問わず無料で利用可能。いいえ。ポストグレエスキューエル、ポストグレス、ポスグレ、などと呼ばれます。標準的なSQL文が利用可能。良さはありますが、他のRDBMSにも他の良さがあります。世の中に何個かある、リレーショナルデータベース管理システム＝ RDBMSの一つです。それらを比較し、そのシステムに最も合うと判断されたものを使用するのが通常です。同じようなRDBMSには、Oracle、 MySql、SQLserverなどがあります。 5

" 少し考えてみましょう。アプリからデータベースに対し、データを登録しました。このデータはデータベースの中にあり、取り出すこともできます。では、データベースの中にデータがあるってどういうことなんでしょうか？ 6

データベースはファイル群 PostgreSQLのデータベースの集合体をデータベースクラスタと呼び、実体はファイル群 $PGDATA base 16384 16386 pg_wal Postgresql.conf 12345 12345_vm データベースクラスタ＄PGDATAはデータベースクラスタの最上位ディレクトリでインストール時に用意される変数、特定のパスが設定されているこの配下にデータベースのデータがすべて存在しているよという場所 8

スキーマ、テーブル、インデックスの保存先 $PGDATA base 16384 16386 12345 12345_vm pg_wal Postgresql.conf TABLEname: company OID: 12345 DBname: admin DBname: east_india_company OID: 16384 OID: 16386 9

10.

データベースクラスタ内の各ディレクトリやファイルの用途名称用途 $PGDATA データベースクラスタの最上位ディレクトリ base/数字テーブルなどのオブジェクトを格納するディレクトリ base/数字/数字テーブルなどのオブジェクトのファイル global データベース内の定義情報（ユーザー、オブジェクトなど）を格納するディレクトリ pg_hba.conf 認証設定ファイル pg_wal WALファイル（変更履歴記録ファイル）を格納するディレクトリ postgres.conf postgres.auto.conf データベースクラスタ起動時に読み込まれる設定ファイル postmaster.pid 起動に作成されるPIDファイル実際にサーバ内でディレクトリやファイルを確認することができる。 10

11.

PostgreSQLのプロセス PostgreSQLを起動すると複数のプロセスが連携して動作し、RDBMSとしての機能が使える状態となります。ここではそれらのプロセスを役割毎に3つに分類して紹介します。プロセス＝メモリ内で実行されるプログラム postmaster プロセス PostgreSQLのメインプログラムのそのもので、全体を管理するためのプロセス。コントローラーのような役割で、接続要求をうけて別のプロセスに引き継いだり、バックグランドプロセスを管理したりする。バックエンドプロセスクライアントからの接続要求を受け、SQL処理を行うプロセス。複数のクライアントから接続がある場合、その数のプロセスが実行される。バックグラウンドプロセス SQL処理とは別に、データベースの内部動作を実行するプロセス。メモリ上にあるデータをファイルに書き込むプロセス、ログファイルの書き出しプロセス、VACUUMの処理の実行プロセスなどいくつかプロセスがある。 11

12.

PostgreSQLのメモリ領域 PostgreSQLが使用するメモリも役割によって、領域を分けて使用されます。メモリ＝プログラムを実行する作業スペースバッファ＝メモリの一部で一時保存場所共有バッファデータベースクラスタで共有 SQL実行に必要なデータをディスクから読み込み保管する領域。共有バッファにすでにデータがあればディスクアクセス不要となるためその分高速になる。SQL実行後もバッファ上にデータは残される。 WALバッファ UPDATE/INSERT/DELETEなどの変更履歴を保管する領域。蓄積された変更履歴は主にSQL実行のコミット時にWALファイルに永続化される。ワークメモリ一つのバックエンドプロセス毎に割り当てられ、ソート処理やハッシュ処理に使用される。同じようにバックグラウンドプロセス毎にメンテナンスワークメモリ、自動VACUUMワークメモリも割り当てられる。 12

13.

接続毎に実行されるバックエンドプロセス PostgreSQL インストールサーバ postmaster プロセス ① 共有バッファ WALバッファ ② 接続開始 ③ バックエンド-1 プロセスバックグラウンドプロセスワークメモリディスク内バックグラウンドプロセス $PGDATA base pg_wal ※このページの解説は次ページにあり。 13

14.

接続毎に実行されるバックエンドプロセス解説 ①クライアントが何等かの方法でPostgreSQLへの接続要求をし、メインプロセスがそれ受ける。 ②メインプロセスはその接続要求に対して、一つバックエンドプロセスが実行する。 ③以降はこの接続は専用のバックエンドプロセスによってSQL実行等の操作が可能になる。 14

15.

SQL実行必要データをディスクから共有バッファに読み込み PostgreSQL インストールサーバ共有バッファ postmaster プロセス WALバッファ ④ SELECT実行 ① バックエンド-1 プロセスワークメモリバックグラウンドプロセス ③ ディスク内 ② バックグラウンドプロセス $PGDATA base pg_wal ※このページの解説は次ページにあり。 15

16.

SQL実行必要データをディスクから共有バッファに読み込み解説 ①クライアントはSQLの実行を行う。 ②必要なデータをディスクにあるファイルから取得。 ③共有バッファに一時読み込み。 ④以降は、すでに共有バッファにあるデータを参照するようになり、ディスクへのアクセスが不必要になる分早く処理できるようになる。バックエンドプロセス毎に、ワークメモリという作業スペースが用意され、共有バッファから取得したデータにソートなどのさらなる加工が必要な場合はこのメモリスペースを使用する。 16

17.

SQL実行変更履歴をWALバッファへ→コミット→WALファイルとして永続化 PostgreSQL インストールサーバ共有バッファ postmaster プロセス WALバッファ ③ ② INSERT実行 ① バックエンド-1 プロセスバックグラウンドプロセスワークメモリディスク内 $PGDATA base バックグラウンドプロセス ④ pg_wal ※このページの解説は次ページにあり。 17

18.

SQL実行変更履歴をWALバッファへ→コミット→WALファイルとして永続化解説 ①クライアントがSQLの実行を行う。 ②このSQL実行により、データの変更が行われた。 ③この時行われた変更についてはWALバッファに変更履歴を一時保管する。 ④クライアントからSQL実行に対してのコミットがあった段階で、専用のバックグランドプロセスによりWALバッファの変更履歴はディスクのWALファイルに永続化され、WALバッファで一時保管されていたデータはなくなる。 18

19.

接続毎に実行されるバックエンドプロセス共有バッファのデータは共有 PostgreSQL インストールサーバ共有バッファ postmaster プロセスバックエンド-1 プロセスワークメモリ SELECT実行バックグラウンドプロセス ② ディスク内 ① バックエンド-2 プロセスワークメモリ WALバッファバックグラウンドプロセス $PGDATA base pg_wal ※このページの解説は次ページにあり。 19

20.

接続毎に実行されるバックエンドプロセス共有バッファのデータは共有解説新たなクライアントから接続要求があり、この接続に対しても新しくバックエンドプロセスと専用のワークメモリが用意される。 ①新たなクライアントがSQL実行を行う。 ②すでに必要なデータが共有バッファにあればディスクへのアクセスは必要なく共有バッファのデータを使用できる。 20

21.

SQL実行不足があれば必要データをディスクから共有バッファに読み込み PostgreSQL インストールサーバ共有バッファ postmaster プロセスバックエンド-1 プロセスワークメモリバックグラウンドプロセス ④ SELECT実行ディスク内 ① バックエンド-2 プロセス WALバッファ $PGDATA base ワークメモリバックグラウンドプロセス ③ pg_wal ② ※このページの解説は次ページにあり。 21

22.

SQL実行不足があれば必要データをディスクから共有バッファに読み込み解説 ①クライアントがSQL実行を行う。 ②SQL実行で共有バッファにない別のデータが必要な場合、同じようにディスクから必要なデータを取得。 ③共有バッファに読み込む。 ④以降は共有バッファのデータを使用する。 22

23.

接続終了するとその接続用のバックエンドプロセスは実行終了 PostgreSQL インストールサーバ postmaster プロセス共有バッファ WALバッファ接続終了バックグラウンドプロセスディスク内バックエンド-2 プロセスワークメモリバックグラウンドプロセス $PGDATA base pg_wal ※このページの解説は次ページにあり。 23

24.

接続終了するとその接続用のバックエンドプロセスは実行終了解説 ①クライアントが、接続を終了とする。 ②クローズされた接続のためにあったバックエンドプロセスと、ワークメモリはなくなる。 24

25.

接続が何もなければバックエンドプロセスとワークメモリは一つもない状態となる PostgreSQL インストールサーバ postmaster プロセス共有バッファ WALバッファバックグラウンドプロセス接続終了ディスク内バックグラウンドプロセス $PGDATA base pg_wal ※このページの解説は次ページにあり。 25

26.

接続が何もなければバックエンドプロセスとワークメモリは一つもない状態となる解説 ①クライアントが、接続を終了とする。 ②クローズされた接続のためにあったバックエンドプロセスと、ワークメモリはなくなる。 ③クライアントがいなければバックエンドプロセスとワークメモリは一つもない状態となる。 26

27.

共有バッファのデータはバックグラウンドプロセスによってディスクに永続化される PostgreSQL インストールサーバ postmaster プロセス共有バッファ WALバッファバックグラウンドプロセスディスク内バックグラウンドプロセス $PGDATA base pg_wal ※このページの解説は次ページにあり。 27

28.

共有バッファのデータはバックグラウンドプロセスによってディスクに永続化される共有バッファに一時保管されたデータは、変更のあったデータは定期的に、または、共有バッファを空けるために削除になったタイミングで専用のバックグランドプロセスによりディスクのファイルに永続化される。 28

29.

共有バッファのデータは利用頻度が低いものから削除されていく PostgreSQL インストールサーバ postmaster プロセス共有バッファ WALバッファバックグラウンドプロセスディスク内バックグラウンドプロセス $PGDATA base pg_wal ※このページの解説は次ページにあり。 29

30.

共有バッファのデータは利用頻度が低いものから削除されていく解説共有バッファに一時保管されたデータは利用頻度が低いものから削除されていき、その分スペースが空けられる。 30

31.

追記型アーキテクチャ PostgreSQLでは追記型アーキテクチャという特徴的な仕組みが採用されています。削除・更新の動作を不要フラグによるマーク付けによって行っており、ロールバックやトランザクション分離を実現するために利用されています。削除の場合削除対象の行に対し、不要フラグを立てる。実際の行削除は行わない。更新の場合更新対象の行に不要フラグを立て、更新された値を持つ新しい行を挿入する。実際の行削除は行わない。 31

32.

追記型アーキテクチャにはいくつか特徴があり、以下の特徴はいずれもデメリットのようなものです。カラムの更新でも新規行が挿入されていく特定カラムのみの更新をする場合でも、前頁の更新の場合の動作が実施され、新規行が挿入される。更新後の検索結果の並び順が変わるソート順を指定しないSELECTを実行した場合、基本的には物理的なデータの並び順で表示される。更新した行は新規行になるため、検索結果の一番下となり、並び順が変わったような印象を受ける。オブジェクトファイルが肥大化していく不要フラグでマーク付けされた行は実際には削除されていないため、ディスク領域も使用したまま。更新を繰り返すと、新規行の挿入によってオブジェクトファイルがどんどん大きくなっていく。結果的に、ディスクの圧迫やデータアクセスパフォーマンスの低下といった問題の原因となる。 32

33.

追記型アーキテクチャのイメージ削除不要フラグ不要フラグ ✔ ID 支社名所在地 101 イギリス本社イギリスロンドン 102 ダッカ支社インドダッカ 103 ムンバイ支社インドムンバイ 104 ボストン支社アメリカボストン ID 支社名 DELETE FROM 支社 WHERE ID = 104; 所在地 101 イギリス本社イギリスロンドン 102 ダッカ支社インドダッカ 103 ムンバイ支社インドムンバイ 104 ボストン支社アメリカボストン 33

34.

追記型アーキテクチャのイメージ削除ロールバック不要フラグ ✔ 不要フラグ ID 支社名所在地 101 イギリス本社イギリスロンドン 102 ダッカ支社インドダッカ 103 ムンバイ支社インドムンバイ 104 ボストン支社アメリカボストン ID 支社名 ROLLBACK; 所在地 101 イギリス本社イギリスロンドン 102 ダッカ支社インドダッカ 103 ムンバイ支社インドムンバイ 104 ボストン支社アメリカボストン 34

35.

追記型アーキテクチャのイメージ更新不要フラグ不要フラグ ✔ ID 支社名所在地 101 イギリス本社イギリスロンドン 102 ダッカ支社インドダッカ 103 ムンバイ支社インドムンバイ 104 ボストン支社アメリカボストン ID 支社名 UPDATE 支社 SET 所在地 = ‘バングラディシュダッカ’ WHERE ID = 102; 所在地 101 イギリス本社イギリスロンドン 102 ダッカ支社インドダッカ 103 ムンバイ支社インドムンバイ 104 ボストン支社アメリカボストン 102 ダッカ支社バングラディシュダッカ 35

36.

追記型アーキテクチャのイメージ削除・更新多発すると不要フラグ ID 支社名所在地 UPDATE 支社 SET 所在地 ={国名入れるのやめよ}; ✔ 101 イギリス本社イギリスロンドン ✔ 102 ダッカ支社インドダッカ ✔ 103 ムンバイ支社インドムンバイ ✔ 104 ボストン支社アメリカボストン ✔ 101 イギリス本社ロンドン ✔ 102 ダッカ支社ダッカ ✔ 103 ムンバイ支社ムンバイ ✔ 104 ボストン支社枠外は全部ただのごみとなったボストン 101 イギリス本社イギリスロンドン DELETE FROM 支社 WHERE ID = 104; 102 ダッカ支社インドダッカ COMMIT; 103 ムンバイ支社インドムンバイ 104 ボストン支社アメリカボストン ✔ COMMIT; UPDATE 支社 SET 所在地 ={やっぱり国名入れることにしよ}; 36

37.

VACUUM VACUUMは不要になった領域を再利用可能な領域にする処理のことで、テーブル毎に実行されます。追記型アーキテクチャのデメリットをクリアするための処理です。行が再利用可能にはなりますが、スペースはそのまま存在するためファイルサイズもそのままとなります。 VACUUM処理の動作は以下の「Visibillty Map」の内容を元に行われ、再利用可能になった行は「Free Space Map」に記載されます。 Visibillity Map (可視化マップファイル) 不要フラグの付いた行がどれかという情報を記録しており、VACCUM処理時はこのファイルを使用する。 Free Space Map (空き領域マップファイル) VACCUM処理によって再利用可能になった行の情報が格納されている。挿入や更新時に、このファイルがチェックされ、使用可能な行があれば再利用される。 37

38.

VACUUM処理のイメージ VACUUM 支社; 不要フラグ ✔ ✔ 不要フラグ ID 支社名所在地 101 イギリス本社イギリスロンドン 102 ダッカ支社インドダッカ 103 ムンバイ支社インドムンバイ 104 ボストン支社アメリカボストン 102 ダッカ支社バングラディシュダッカ ID 101 支社名イギリス本社 ①不要フラグの付いた行を確認し Visibillity Map 実体： $PGDATA/base/数字/数字_vm 所在地イギリスロンドン ②再利用可能な行として記録する Free Space Map 103 102 ムンバイ支社ダッカ支社インドムンバイバングラディシュダッカ実体： $PGDATA/base/数字/数字_fsm 38

39.

VACUUM処理後行の再利用不要フラグ不要フラグ ID 支社名所在地 101 イギリス本社イギリスロンドン 103 ムンバイ支社インドムンバイ 102 ダッカ支社バングラディシュダッカ ID 支社名所在地 101 イギリス本社イギリスロンドン 105 チェンナイ支社インドチェンナイ 103 ムンバイ支社インドムンバイ 102 ダッカ支社 INSERT INTO 支社 (ID,支社名,所在地) VALUES (105, ’チェンナイ支社’, ’’); バングラディシュダッカ再利用可能な行があればそこに挿入 Free Space Map 実体： $PGDATA/base/数字/数字_fsm 39

40.

自動VACUUM VACUUMは特定のテーブルに対し、任意のタイミングでコマンドを実行し行うこともできますが、実施目的は不要になった領域の再利用なので、頻繁に更新や削除のあるテーブルであればあるほど、頻繁に行う必要があります。自動的にVACUUMを実行する機能があり、よほどの理由がない場合は、この自動CACUUMを利用するのがよいとされています。自動VACUUMの使用自動VACUUMの設定が有効の場合に、各表毎に設定された閾値を超えた場合に自動的にVACUUM が行われるようになる。一緒にANALYZEも行われる自動VACUUMではVACUUMのほかANALYZEが行われる。 ANALYZE＝統計情報の再取得。統計情報＝データベース内の表や索引、シーケンスなどのオブジェクトに関する詳細情報データの集合体 40

41.

SQLチューニング

42.

速度改善チューニング一般的にチューニングを行う場合、SQLチューニング、それでだめならデータベースチューニングの順番で実施します。 SQLチューニング主にこちらの説明スロークエリとなっているSQLの書き方を変更したり、INDEXを付与するなどしてよりよい実行計画を得られるよう、SQL、または統計情報を変更されるようにする。データベースチューニングメモリ領域、VACCUM処理、ファイルアクセスなどに関連にした設定パラメータの調整を行い、速度改善を行う。 42

43.

" 「おかしい！この画面の表示にすごく時間がかかる。」そのような報告があり、調べてみると、サーバからのレスポンスに大幅に時間がかかっていることがわかりました。こういった場合に実行に時間のかかるSQLがあるのではないかと疑います。さて、そのSQLどうやってみつけたらいいでしょう？ 43

44.

45.

遅いSQLの見つけ方まず、レスポンスが遅いのか？レンダリングが遅いのか？画面の表示が遅いという場合にまず気にするべき箇所で各ブラウザの開発者ツールなどで確認可能。以下で切り分けをする。レスポンスが遅い場合は、SQLの実行を含むアプリのサーバサイドの処理が遅い。レンダリングが遅い場合は、サーバからのレスポンスを得てからフロントサイドの処理が遅い。SQLが原因でない可能性が高く別視点からレンダリングの遅延原因を探った方がよい。 PostgreSQLのスロークエリログ上にて、実行に時間のかかっているSQLはあるか？実行に指定時間以上かかったSQLがあればその情報をログファイルに記録する設定が可能。ログファイルの作成場所も設定によって指定されている。ログファイルに特定のSQLの記録がないかを確認する。 pg_stat_statementsビューにて、実行に時間のかかっているSQLはあるか？実行されたSQL情報を内部的に記録し、pg_stat_statementsビューを通して確認できるようにする設定が可能。ビューのカラムから実行時間や、ディスク読み込みが多発するSQLがないかを確認する。 45

46.

サーバからのレスポンスを受けるまでの時間の確認方法この値が多ければ多いほど、サーバサイドの処理で何かしら時間がかかっているという意味。例、・SQL以外のロジックを通る時間・SQLの実行時間・ファイルへのアクセス・sleep 可能性はサーバサイドで行う処理のすべてにあるが、これまで問題がなかったのに遅くなったということであればSQLの実行時間が原因で遅くなった可能性が高い。レスポンスを受けるまでの時間 46

47.

スロークエリログの確認方法スロークエリが書き出されるログファイルを確認し、特定のSQLの記録がないかを確認する。ログファイルの有無、場所、内容、どれだけの実行時間の場合にスロークエリと判断するかは設定により異なる。実行にかかった時間そのときのSQL 47

48.

ログに関する設定パラメータ名称用途設定例反映タイミング logging_collector ログを収集するか否か on postmaster log_directory ログ出力先ディレクトリ名 log sighup log_filename ログファイル名 postgresql-%Y-%m%d_%H%M%S.log sighup log_line_prefix ログの各行に付与するプレフィックス %m [%p][%e]DB_name:%d sighup log_min_messages ログに記録するメッセージレベル warning superuser log_min_duration_stat ement ログに出力対象とするSQL実行時間の閾値 3000 superuser postmaster 再起動要 sighup リロード要 superuser SQLで動的変更が可能 48

49.

設定の確認方法1：設定されているパラメータの値を個別に確認 show {パラメータ名称}; 例、 show logging_collector; 方法2：設定パラメータ一覧をpg_settingsビューにて確認 SELECT * FROM pg_settings; 例、 SELECT name, setting, unit, context FROM pg_settings WHERE name LIKE '%log%'; 49

50.

設定の変更方法1：設定ファイルを編集する $PGDATA/postgres.conf を開き設定パラメータの値を編集する例、 logging_collector = on 方法2：ALTER SYSTEM文を適用する ALTER SYSTEM SET {パラメータ名} TO {値}; 例、 ALTER SYSTEM SET logging_collector TO 'on'; ※パラメータ毎の反映タイミングにより、再起動やリロードが必要となる。 ※基本の設定がpostgres.conf、それに上書きするのがALTER SYSTEM適用のイメージ。実際に設定値として扱われる値は前頁の確認方法で表示されるものとなる。 50

51.

pg_stat_statementsビューの確認方法 pg_stat_statementsビューから実行時間に時間のかかっているSQL情報を取得する SELECT * FROM pg_stat_statements ORDER BY total_time DESC LIMIT 1; 例、 SELECT query, calls,rows,total_time,shared_blks_hit,shared_blks_read FROM pg_stat_statements ORDER BY total_time DESC LIMIT 5; 実行回数 SQLテキスト実行時間(ｍｓ) 影響行数ディスクからの読み込み数メモリ上のヒット数 51

52.

pg_stat_statementsビューの使用設定方法 pg_stat_statementsビューを使用するにはデータベース毎に以下の使用設定が必要、未設定の場合ビューが表示されない１、 pg_stat_statementsモジュールを読み込むように設定パラメータに追加する $PGDATA/postgres.conf を開き設定パラメータの値を編集する、再起動要 shared_preload_libraries = 'pg_stat_statements' ２、対象のデータベースに対しエクステンションの作成を行う CREATE EXTENSION pg_stat_statements; 対象のデータベースですでに使用可能なエクステンションは以下で確認可能 \dx 52

53.

遅いSQLが見つからない確かにサーバからのレスポンスが遅い。だからログもみた。pg_stat_statementsビューもみた。だけど遅いSQLが見つからない。そんな時は以下を疑い、アプリコードを順に読み解き調査するとよい。アプリのロジックで特定の条件にはまると執拗に繰り返し実行されるSQLはあるか？一つのSQLの実行時間は短いが、そのSQLを繰り返し実行してしまっていないか？例えばユーザーに紐づく別情報の取得を紐づくレコード数分実行してしまうなど。ユーザーに紐づく特定の別情報が2万件＊一回の実行時間が0.2秒の場合、4000秒＝66分かかる。このようなケースはそのSQLをそんなに実行する以外の方法がないのか？を検討する SQL以外のコードで遅い処理があるか？ SQLとの関連はなくロジック自体に時間がかかるものがあるのかもしれない。できるなら、各要所の通過時の時間を記録するようなログを出すようにし、「どこが？」の特定をする。 53

54.

SQLの処理ステップ１、構文解析パーサ適用されたSQLが正しい構文かチェックする。２、書き換えリライタオブジェクトの存在を確認し、オブジェクト名を内部の識別子に書き換える。３、実行計画生成プランナ SQLと統計情報を元に実行計画を作成する。この時、あらゆる組み合わせを考慮し最もコストの低いものを選択する。統計情報＝データベース内の表や索引、シーケンスなどのオブジェクトに関する詳細情報データの集合体４、実行エグゼキュート実行計画に従い、処理を実行する。 54

55.

SQLの実行計画の取得生成された実行計画を確認することができ、所要時間や計画を詳しく見ることができる３、実行計画生成プランナ SQLと統計情報を元に実行計画を作成する。この時、あらゆる組み合わせを考慮し最もコストの低いものを選択する。統計情報＝データベース内の表や索引、シーケンスなどのオブジェクトに関する詳細情報データの集合体 55

56.

実行計画の取得方法実行時に何から順にデータを取得し、どの作業でどれくらい対象があって、どれくらい時間がかかる。その計画書みたいなものが実行計画です。実行計画は、統計情報を利用して作成されます。自動VACUUMが有効であれば定期的にANALYZE が行われているのでさほど気にする必要はありませんが、無効にしているような場合はANALYZEを行ってから実行計画の取得を行うようにするとよいです。 EXPLAIN を実行する SQLを実行することなく、生成された実行計画を確認できる。実行計画だけを確認したい場合に使うとよい。しかしこちらは実行をしないため、実行時間の計測は不可。 EXPLAIN ANALYZE を実行する実際にSQLを実行して得られた結果も表示する。実行計画のほか、処理時間と処理行数が確認できる。スロークエリの特定や、チューニング後の改善に対し効果測定でもよく使用する。 56

57.

EXPLAIN を実行する実行計画を取得する EXPLAIN {実行SQL}; 例、 EXPLAIN SELECT * FROM company.department WHERE department.closed = false; 取得結果実行計画 57

58.

EXPLAIN ANALYZE を実行する実行計画と実行時間を取得する EXPLAIN ANALYZE {実行SQL}; 例、 EXPLAIN ANALYZE SELECT * FROM company.department WHERE department.closed = false; 取得結果実行計画実行にかかった時間 58

59.

実行計画の見方実行計画を見たらSQLの実行にかかる時間がわかる、どこで時間がかかっているのかわかるらしい！そうなのですが、、、実行計画は初見殺し。見た感想は「で、どこから見たらいいですか？」となります。 59

60.

参考：実行SQL EXPLAIN ANALYZE SELECT employee.id, employee.name, department.name, branch.name FROM employee.employee INNER JOIN employee.history_employee_x_department ON employee.id = history_employee_x_department.employee_id INNER JOIN employee.latest_employee_x_department ON history_employee_x_department.id = latest_employee_x_department.employee_x_department_id INNER JOIN company.department ON history_employee_x_department.department_id = department.id INNER JOIN company.branch ON department.branch_id = branch.id; 60

61.

どうやってみたらいいですか？実行にかかっている時間を知りたい実行にかかった時間 61

62.

どうやってみたらいいですか？どこに時間がかかっているのか知りたいインデントが下がっているものが先に実行された計画タイプ矢印一つが一つの計画タイプ actual time= {処理開始時間}..{終了時間} {終了時間} - {処理開始時間}が所要時間となり、所要時間が多い箇所の処理に時間がかかっていると判断する。 loop={繰り返した回数} 1以外の場合は、所要時間＊loopの値が実際にかかった時間となる。 62

63.

どうやってみたらいいですか？どうして時間がかかっているのか知りたい結合の方法結合の条件スキャンの方法と対象テーブル結合の方法、スキャンの方法が、対象にするデータに合わずに時間がかかることがある。どのような計画にしたいか、直接指定することはできないため、データに合った結合方法や、スキャン方法になるようにSQLを変更しながら、現状のデータ取得にあった計画にさせる必要がある。 63

64.

代表的な計画タイプ主なスキャン方法実行計画上の記載有効な使用シーン内容 Seq Scan ・表のほとんどにアクセスする必要がある・小さい表にアクセスする場合・テーブルを最初から最後までアクセスする Index Scan ・表の一部のデータにアクセスする場合・インデックスを利用して必要データにピンポイントでアクセスする主な結合方法実行計画上の記載有効な使用シーン内容 Hash Join ・結合する対象が大量・行数の少ない表と多い表の結合・行数の少ない表の結合条件列に重複値がない・結合キーでハッシュを作成し、ハッシュと結合先を突き合わせて結合する Merge Join ・結合する対象が対象・結合する表の行数が同じくらい・あらかじめデータがソートされている・結合するテーブルを結合キーでソート後、順番に突き合わせて結合する Nested Loop ・結合する対象が少量・行数の少ない表と多い表の結合・行数が多い表の結合条件列にINDEXがある・主となるテーブルに結合する方のテーブルを全スキャンして結合する有効な使用シーンに該当しないのに、その計画タイプとなっている場合が要注意！ 64

65.

どうやってみたらいいですか？ほかに何が書いてある？計画の推定情報 Hash Joinのための結合準備計画実行時の実際の情報取得される行数繰り返し回数取得される行数＊繰り返し回数が実際の行数計画を立てるのにかかった時間残念ながらここまでに出てきたもので全種類ではありません。代表的なものでもソートや、フィルターがあります。ほとんどのものは実行計画を見て、「なるほど、ここのことか」と気づきを得ながら解読していくことになると思います。 65

66.

" 「コンビニに行って極上肉まん一個買ってきて!」「この机に使ってるねじと同じもの買ってきて。近所に2つあるホームセンターのうちのどちらかで買ったはず。ねじの名前はちょっと憶えていないけど、同じもの！一つ！」さて、どちらのおつかいの方が時間がかかるでしょう？ 66

67.

68.

SQLにしてみるとコンビニの極上肉まんホームセンターのねじ SELECT ( SELECT 商品.名前, 商品.値段, 商品.実物商品.名前, 商品.値段, package(商品.実物) FROM ロイヤルホームセンター.棚 INNER JOIN ロイヤルホームセンター.商品全部の棚を持ってきたねじと同じのあるか見て回る ON 商品.ID = 棚.商品ID FROM WHERE 目視scan(商品. 見た目) ＝目視scan(持ってきたねじの見た目) コンビニ・棚 INNER JOIN コンビニ・商品 ON 商品.ID = 棚.商品ID WHERE 棚.名称＝ ‘レジ横ホットフード棚’ AND 商品.名前＝ ‘極上肉まん’ LIMIT 1 ; LIMIT 1 ) UNION ( SELECT 商品.名前, 商品.値段, 商品.実物 FROM コーナン.棚 INNER JOIN コーナン.商品 ON 商品.ID = 棚.商品ID WHERE 目視scan(商品. 見た目) ＝目視scan(持ってきたねじの見た目) LIMIT 1 ); 68

69.

高負荷になりやすいSQL 命令が多い、まわりくどい命令があるそもそも命令が多い、命令の中でもまわりくどい命令が多いとそれが高負荷になりやすい対象が膨大であてなく全部見る必要があるいろんなテーブルを接続し、接続し、接続し、大きな表になればその分高負荷になりやすく、さらに特定の一つを見つけるのに、全量を読み込む必要ある場合、高負荷になりやすい NOT EQUAL演算子を使用しているそれ以外を探すという動作になる場合、設定されているINDEXがうまく動作しないため高負荷となりやすいディスクやバッファの読み取りブロック数が多い対象が大きくなると、ディスクからの読み取り量が増え、バッファやワークメモリの領域が不足する可能性があり、そうなると高負荷となりやすい 69

70.

SQLの改善の事例 INDEXを付与することでピンポイントのアクセスとなり改善絞り込んで特定のデータを取得する場合や、特定のデータをキーにして結合する場合、そこにINDEXが付与されていれば、ピンポイントでスキャンをしたり、結合したりできるのに、INDEXがないことで、全スキャンや全結合の計画タイプが選択されてしまい無駄に時間がかかってしまっていた。キーになるカラムに対しINDEXを作成することで改善した。ちなみに主キーの場合は自動的にINDEXが作成されている。結合時に必要な分だけしか取得しないSQLにすることで改善たくさんのテーブル結合を行うSQLでサブクエリを実行し、その結果同士を結合するSQL。サブクエリでは行数の多いテーブルから全スキャンで取得、十万行近く全量スキャン。しかし、実際には外側のクエリで絞り込まれた数十件分のみが必要なだけだった。サブクエリを使用するのをやめ、外側のクエリで絞りこまれた結果と結合することで全量スキャンをやめ、必要分だけ取得するようになった。 70

71.

データベース設定の改善 SQLチューニングで改善が見られない場合は、データベースクラスタ自体の設定の調整で対応を検討する必要がある。これに関しては方法手順ではなく、検討材料とすべきものを紹介のみとします。メモリ関連共有バッファ、WALバッファ、ワークメモリのサイズが足りているのか？足りていない場合に、ディスクへのアクセスが高頻度で発生し、それが負荷の原因となることがある。それぞれサイズの増加が可能。バックグラウンド動作関連基本的に低負荷で高頻度でバックグラウンドプロセスを実行させる状態が望ましい。一時的に、急激に、負荷がかかるようなバックグラウンドプロセスの動きがないように調整をする。テーブル設計テーブル毎にどれだけファイルにデータを書き込むか、どれだけ空きが出たらVACUUMをさせるか設定が可能。サイズや更新の頻度もテーブル毎にあったものに調整をする。 71

72.

万能ではない遅いSQLを見つける、直す、繰り返す時間のかかるSQLを直しても、またしばらくするとデータの状態が変わり、改変したSQLでまた遅くなる。ということが度々発生する。その対応を繰り返すことが普通のこと。どこかのデータベースにとっては有用でも、どこかのデータベースには有害かもしれないいくつかのデータベースに同じSQLを適用する場合、データベースによって持っているデータの状況が異なるため、一方は早くなっても、もう一方は遅くなるといったこも発生する。そのSQLの適用されるすべてのデータベースでの影響を確認する必要がある。 72

73.

まとめ

74.

わかるようになった事 PostgreSQLデータベースの基本構造データベースクラスタ、プロセス、メモリ領域、VACUUM 遅いSQLの見つけ方スロークエリログ、pg_stat_statementsビュー SQLの実行計画の取得と見方 EXPLAIN ANALYZE、実行計画の見方、スキャンの種類、結合の種類 SQLのチューニング方法の一部高負荷になりやすいSQL、無駄な取得をしないSQL、コツはあるがトライエラーで対応を続ける必要がある 74

75.

おすすめサイト Postgres基本構造について解説あり https://www.fujitsu.com/jp /products /software/resources /featurestories/postgres /article-index/architecture-overview/ 実行計画のスキャンや結合についてわかりやすく解説あり https://www.fujitsu.com/jp /products /software/resources /featurestories/postgres /article-index/implement-sqltuning / 取得SQLでのチューニングについて https://www.fujitsu.com/jp /products /software/resources /featurestories/postgres /article-index/tuningrule9-search/ データベースチューニングについて https://www.fujitsu.com/jp /products /software/resources /featurestories/postgres /article-index/tuningrule9-base/ 75