2.3K Views
August 02, 23
スライド概要
2023.7.26 に行われた PagerDuty Summit 2023 にてお話しした、PagerDuty を中心とした cloudpack の MSP サービス基盤および監視業務自動化独自ツールの AMS について紹介した資料です。
クラウド MSP サービスの進化: PagerDuty を中心とした次世代監視基盤 PagerDuty Summit 2023 2023.7.26 アイレット株式会社
自己紹介 業務経歴 • クラウド事業立ち上げ • エバンジェリスト、パートナー アライアンス、 マーケティング担当 • 公正取引委員会 デジタルアナリスト 職歴 • 日本オラクル → 米国オラクル本社 後藤 和貴 アイレット株式会社 執行役員 / エバンジェリスト (ソフトウェア エンジニア) • ウェブデザイン会社 (技術チーム立ち上げ、プロジェクト マネジメント、執行役員) • フリーランス (テクニカル ディレクター) 2
会社紹介 アイレットは、クラウドの導入設計から構築・保守・運用をトータルでサポートする「cloudpack」および「Rackspace」そしてシステム 設計・開発・デザインをワンストップで行う「開発」を提供しています。 ・アプリケーション開発 ・サーバレス開発 ・デザイン / Webシステム開発 ・ゲーム開発 ・ITコンサルティング 開発 Development 開発 デザイン IoT インフラ Infrastructure 構築 MSP※ 請求代行 Resale AWS:2010年開始 Google Cloud: 2019年開始 ・AWS取扱量は毎年大幅増 ・パブリック クラウド 日本トップクラスの取扱量 AWS:2020年開始 KCPS (RPC-Vベアメタル) Azure:2022年9月開始 セキュリティ Security ・世界中でのサービス提供 ・洗練されたツールによる MSP ・英語サポート ※MSP: マネージド サービス プロバイダー / 監視運用保守 3
会社概要 クラウド導入実績 2,500 社以上 年間プロジェクト 4,300 以上 AWS プレミアティアサービスパートナー9年連続認定 APN Consulting Partner of the Year 通算5度受賞 AWS 認定資格保有数が2,000を超える企業として AWS より認定取得 ● ● ● ● ● ● データ&アナリティックスコンピテンシー認定 移行コンピテンシーおよびパブリックセクターパートナープログラム認定 マネージドサービスプロバイダ パートナープログラム認定 Well-Architected パートナープログラム認定 DevOps コンピテンシー認定 AWS 移行コンピテンシー認定 Google Cloud サービス パートナー ● ● ● ● ● Google Cloud マネージドサービスプロバイダ(MSP) 認定 Google Cloud インフラストラクチャスペシャライゼーション認定 Google Cloud アプリケーション開発スペシャライゼーション認定 Google Cloud データ管理スペシャライゼーション認定 Google Cloud セキュリティスペシャライゼーション認定 4
cloudpack とは 請求代行 運用・監視 インフラ構築 開発 クラウドの導入・設計・構築・運用を中心にお客様のインフラ環境を総合的に支援する アイレットのフルマネージドサービス「 cloudpack」 AWS、Google Cloud が持つ世界トップレベルのテクノロジーや ソリューションを大いに活用し、お客様と一緒にビジョンを実現します 5
cloudpack運用・保守サービスについて クラウドの導入や運用を中心に、 お客様のご要望に幅広くお応えする総合支援サービスです。 運用・保守サービス (AWS, Google Cloud) MSPチーム 約1万台を運用・保守 6
cloudpack 初期の監視システム 2012.2.18 cloudpack監視システムについて P23 より https://www.docswell.com/s/kazgoto/ZVLWX5-5jawsug-cloudpack-11645969#p23 7
cloudpack 初期の監視システム 8
cloudpack 初期の監視システム 9
日本国内 パブリッククラウド市場動向 IDC Japan 国内パブリッククラウドサービス市場予測を発表 より引用 https://www.idc.com/getdoc.jsp?containerId=prJPJ49684222 10
成長と共にアラート件数も増大 (予測値) 売上推移(過去 10年で40倍超) プロジェクト数 アラート件数 11
PagerDuty 導入前の課題 ➔ 状況が一目で見えない ➔ アラートごとのアサイン状況が分かりにくい ➔ アラートの分析が困難 ➔ 監視対象が増える度に監視業務負荷が増加 ➔ 影響がほとんどないアラートも毎回対応しないといけない ➔ 人手による作業はミスのリスクがあり、対応品質にバラツキがでる 12
PagerDuty 導入前の課題 1 監視対象やアラート対応数の増加 2 人的リソース不足 3 対応時間・業務負荷・オペレーションミスの増加 4 対応品質の低下 13
この状況を解決したのが... 14
PagerDuty 導入後のフロー 15
● チケット自動起票・情報更新 ● 確認手順追記 ● インフラ監視 ● パフォーマンス監視 ● 状況通知 ● メンテナンス通知 ● 警告メール Direct Connect ● アラート情報集約・通知 ● インシデント管理 ● 障害対応自動化 📞 電話・メール連絡 ● 仮想インターフェース監視(独 自実装) 確認コマンド実行 ● チケット起票 16
次世代監視基盤(Advanced Monitoring System) 監視業務の対応を自動化する独自システム ➔ 動作確認・情報取得 ➔ 復旧操作 ➔ 二次担当者へエスカレーション 17
AMS 18
AMS 処理フロー 19
AMS による処理後の状態 20
➔ 優先度付け自動化 ➔ 一次対応速度向上 ➔ 継続的な対応品質向上 ● インフラ監視 ● パフォーマンス監視 ● チケット自動起票・情報更新 ● 確認手順追記 ● 状況通知 ● メンテナンス通知 ● 警告メール ● アラート情報集約・通知 ● インシデント管理 ● 障害対応自動化 Direct Connect 📞 電話・メール連絡 ● 仮想インターフェース監視(独 自実装) 確認コマンド実行 ● チケット起票 ● 動作確認・情報取得 ● 復旧操作 ● エスカレーション 21
AMS による効果 AMS対応率が向上し 一次対応平均時間が 大きく削減 対応品質向上と 顧客満足度向上に 貢献 アラート件数 一次対応時間平均・ AMS対応率 22
PagerDuty + AMS 効果 定型化された作業を自動化する事で、 人間にしか対応できない作業にリソースを割くことができる 対応時間・業務負荷・オペレーションミスの減少 対応品質が向上=ビジネス拡大 23
まとめ ● PagerDuty 導入により、アラート対応業務を完全シス テム化、増大する処理に対応することが可能 ● PagerDuty のインテグレーションや Webhook / API を活用し、自動処理の拡張も可能 ● 運用・監視ノウハウをシステム化、また新技術を組み込 むことで、MSP 品質向上・ビジネス拡大へ 24
これから ➔ AIOps ➔ 生成系 AI 関連技術の応用 ➔ さらなる MSP 品質向上へ 25
26