サービス障害が発生したときのなかの人たちの様子

465 Views

April 25, 25

スライド概要

2025年4月25日 Shima Tech Hub #10
https://shima-tech-hub.connpass.com/event/347952/

profile-image

アールスリーインスティテュートは、kintoneを中心とした クラウドサービスを活用することで お客様の継続的な業務改善をサポートします。

シェア

またはPlayer版

埋め込む »CMSなどでJSが使えない場合

(ダウンロード不可)

関連スライド

各ページのテキスト
1.

サービス障害が 発生したときの なかの人たちの様子 2025/04/25 Shima Tech Hub #10 アールスリーインスティテュート 西島 www.r3it.com

2.

こんにちは! アールスリーインスティテュート サービスグループ gusukuユニット デベロップメントチーム マネージャー 西島 幸一郎 @k_nishijima #しまてく ハッカーズチャンプルーのなかのひと https://hackers-champloo.org/ www.r3it.com

3.

アールスリーインスティテュート システムの受託開発と 法人向けSaaSの二本立て 創業 社員数 拠点 2000年 47名 大阪 10億 東京 沖縄 みんなの家 年商 ちょい www.r3it.com

4.

琉球ゴールデンキングスのパートナーです 今季2冠達成! 最後の1冠・チャンピオンシップも取るぜ! www.r3it.com

5.

本日のお題 サービス障害が 発生したときの なかの人たちの様子 www.r3it.com

6.

詳細はブログを確認 ● 「障害発生時の中のひと」 で検索 ● 3月18日に弊社サービスに 発生した障害について、 ドキュメンタリー風に記載 www.r3it.com

7.

障害の内容を簡単にいうと ● 接続先のシステムが仕様に反した動きをした。 ● 結果こちらのシステムに想定外のリクエストがかかった。 その機能、従量課金なんですけど! ● 影響を受けた多くのお客様が課金分をあっという間に使い 果たしてしまい、詰んだ状態になってしまった。 www.r3it.com

8.

想定外に実施された負荷テスト状態 平時の10倍以上のトラフィック www.r3it.com

9.

サービス障害、それは突然やってくる… なので想定外への対応を想定しておくと気が楽 ● サービス運用しているところは とっくに用意されているとは思いますが😓 ● 事象は変化しても、フロー自体はおおよそ定形になる ので、備えあればなんとやら、の気持ちになれる www.r3it.com

10.

なにをどう用意しておくべきか ● 障害・現象自体を理解して確定するプロセス (なにが起こった?再現可能か?それとも事故なのか?) ● 状況の社内での共有方法 ● 状況の社外への通知手順 ● 解決もしくは落とし所の決定プロセス (誰がどう判断して、どうなれば「回避出来た」「解決した」とみなせるか) ● 緊急時でもデプロイ手順は変えないほうがよい(事故るのでw) www.r3it.com

11.

チーム全体に 障害への耐性が 付いていると とても良いですね👍 www.r3it.com

12.

おわり www.r3it.com