【DeNA QA Night #8】DeNA品質管理部門が挑むAI化戦略

-- Views

March 30, 26

スライド概要

2026/03/13に開催されたイベント「DeNA QA Night #8」の登壇スライドとなります。
イベント概要:https://dena-qa-night.connpass.com/event/379547/
「DeNA QA Night #8」アーカイブ動画:https://youtu.be/nD6fCJmMZ0Y

profile-image

DeNA が社会の技術向上に貢献するため、業務で得た知見を積極的に外部に発信する、DeNA 公式のアカウントです。DeNA エンジニアの登壇資料をお届けします。

シェア

またはPlayer版

埋め込む »CMSなどでJSが使えない場合

(ダウンロード不可)

関連スライド

各ページのテキスト
1.

DeNA QA Night #8 DeNA品質管理部門が挑むAI化戦略 藤﨑 隆 DeNA AI Cognitive Expert IT本部 品質管理部 株式会社 ディー・エヌ・エー 2026/3/13 © DeNA Co., Ltd. 1

2.

藤﨑 隆 (品質管理部) 現場の最前線(テスト設計・実行)から、 PHOTO マネジメント(戦略策定・品質管理)までを包括的に対応 直近はPdMとしてAIサービス開発 住 浜在 QA テスト/品質管理/ QA 20年 通算100サービス/ 50名規模PL/PM T&F 100m 11秒29(40歳) マスターズ陸上 4×400mリレー 全国優勝 日本記録 、 スト 横 テ 19XX 2006 © DeNA Co., Ltd. QA へ 業界 ーズ タ ス ーズ ベイ 会 ズ 入 ー ブ A タ ラ タ eN 入社 ス ス D ク 一 A N イ イ e ン 本 横浜 D ベ ァ ベ 日 フ 2011 2014 2021 2024 2

3.

ご質問はSlidoへ 部門紹介 DeNA 品質管理部 年間 Game 数十億円のQA費 Healthcare Medical Live Streaming Sport SmartCity GWS MSOffice Github JIRA Confluence Notion Miro Figma Backlog draw.io New AI 様々な違いを吸収して QA © DeNA Co., Ltd. 3

4.

ご質問はSlidoへ 動画・資料 公開中 AI×品質管理 新しいQAモデルによる生産性倍増への挑戦 © DeNA Co., Ltd. 4

5.

ご質問はSlidoへ 生産性を倍増させる プロジェクト工数分析からAI化テーマを設定 テスト作成 仕様書検証、テスト項目書 *「テスト設計」の解釈が広いため、作成=設計+実装と定義 テスト自動化 自然言語指示によるテスト実施/不具合検出 社会的品質審査 法令・各種規約、倫理・レピュテーションリスクの回避 © DeNA Co., Ltd. 5

6.

ご質問はSlidoへ 成果 生産性の倍増 テスト作成 テスト自動化 社会的品質審査 テスト作成工数 80%削減 作成精度 95%修正不要 インスペ指摘 92%有効 テストスクリプト工数 90%削減 モバイルアプリ 検証中 リリース前審査 5日→即日 高難易度の審査対応 脱俗人化 機能テスト 1600項目 2時間 表示テスト 22000項目 6時間 自然言語によるテスト実行 不具合検知と報告 誤操作、誤判断の自己検知 法令・各種規約・倫理 レピュテーションリスク © DeNA Co., Ltd. 6

7.

ご質問はSlidoへ テストは大きな二面性の課題を持っている 一人のQAではやり切れない 知の課題:どんなテストが必要かを考える難しさ 量の課題:作業量が多い 思考力 知的アプローチ 高難度領域 経験・学習・センスの壁 QA活動の総量 量的アプローチ ボリューム © DeNA Co., Ltd. 隙間が AI精度の課題 7

8.

ご質問はSlidoへ AIの精度を考える 1/3 Q.どこまでいけば、『AIだけ』に任せられますか? AI精度 30% 50% 90% 99% 99.9% 品質目線の演算式 流出課題 全ての課題 AI精度 =カバー率 流出課題の 量・質から逆算 © DeNA Co., Ltd. 8

9.

ご質問はSlidoへ AIの精度を考える 2/3 課題量 vs 耐久力 AI精度 流出課題量 影響ユーザー数 問い合わせ数 組織の耐久力 99% 100% - 99% = 1% 1% × 1,000,000人 = 10,000人 10,000人 × 10% = 1,000件 1,050件 ∴AI精度は99%でも良い AI精度は 程度問題 © DeNA Co., Ltd. 9

10.

ご質問はSlidoへ AIの精度を考える 3/3 ワンミスが致命傷となる業務を AIに任せられますか? AIがミスしても許せますか? AI精度 レビュー・修正 コスト 20% 50% 180% 100% 70% 80% 95% 50% 30% 10% 出来るなら 一気にAI化 © DeNA Co., Ltd. 10

11.

ご質問はSlidoへ 人間中心設計 円滑な業務フロー設計 レビュー 仕様書改善 テスト設計 自動テスト 品質分析 人間のやりたいこと AI支援 AI支援 AI支援 AI支援 業務から デザインする © DeNA Co., Ltd. 11

12.

ご質問はSlidoへ 仕様書からテスト作成 14のテストタイプ 仕様書 機能テスト 機能テスト 項目書 表示テスト 表示テスト 項目書 仕様書 インスペクション 今日はココ シナリオテスト : 複合テスト © DeNA Co., Ltd. 12

13.

ご質問はSlidoへ テスト作成 機能テストデモ 課題 仕様書フォーマット ばらばら 作業ボリューム大 情報不足の 仕様書 テスト手順の緻密さは 実行生産性に直行する © DeNA Co., Ltd. 13

14.

ご質問はSlidoへ テスト作成 表示テストデモ 課題 画面仕様が無い © DeNA Co., Ltd. 確認粒度が人次第 作業ボリューム大 14

15.

ご質問はSlidoへ テスト作成 © DeNA Co., Ltd. 表示テストデモ 15

16.

動作デモ ● ● ● © DeNA Co., Ltd. ダック DeNA AI Advanced Quality ふくろうはQAを代表する動物、よく見てバグ(虫)をみつける 16

17.

当日頂いたご質問と回答① 参加者のご質問 登壇者の回答 AI活用で効果が出やすいプロジェクトや効果が出にくいプロジェ クトはありますか?ある場合はその違いはどのような部分になり ますか? 言語化がしっかりされていると AI活用の精度が高まります。 あいまいな部分を AIが「想像」せずに済むと、期待通りに動く可 能性が高まります。 ◆参考 言語化の程度は、「測定できる」こと DeNA AI Day2026 を目印にすると良いと判断しています。 AI×品質管理 『お風呂が沸いたら入りなさい 要求を仕様書に落とす部分にも精度の差が生まれると思うので すが、こちらに対して何か工夫はしていますか? こちらのツールに詳しい人間が、インスペクションを経て必要情 報を収集しています。 インスペクション自体も AIが行っていますが、テストに十分な情 報を強く集められたら精度の差を減らすことができると考えま す。仕様書を承認直前まで進めることも QAが担っています。 実行の度に生成内容が変わってしまう羃等性の問題について はどの様に考え、対応されていますか 多少の揺らぎは問題なく、最終成果物がレビューアの期待値を 満たすことが重要と考えています。 そのためある程度以上の精度は、人間の補正を前提にツール 運用しています。

18.

当日頂いたご質問と回答② 参加者のご質問 登壇者の回答 電卓は一般的なものなので汎用モデルでも作業手順を導出しや すいかと思われますが、実際のプロダクトでも正しい作業手順を 出してくれるのでしょうか?導出のために工夫されている点はあ りますか? 独特な構造であっても、画面遷移図を AI生成して明確な手順を 導出できるようにしています。 そのため、実際の 20手順あるシステムでも、画面遷移図を元に 手順生成が行われます。 画面遷移図(+ α)にQAエンジニア目線で視認している情報を含 ませている点が工夫している点となります この精度のツール作成にたどり着くまでに、どれくらいの工数が かかりましたか 具体値は伏せますが、実際の QA費から逆算的に予算計上して います。 2桁人員が DAAQ開発に関わっています。 途中で仕様が変わった場合、既に作成した(テスト実行中)項目 に変更内容を適用することができますか?また、テスト実行手 順に誤りがあった場合、そのフィードバックをテスト実行者が送 信できますか? 現状、その機能は具備されていません。 仕様変更は全項目の再作成、再実行を AIで実現する方向性が あるためでもあります。 また、基本的に作成以後の運用は各チームに任せるスタンスと しており、ツール内での完結運用は想定はしておりません。

19.

当日頂いたご質問と回答③ 参加者のご質問 登壇者の回答 テストケースが2万件を超えていますが、過去のテストケースの 管理などはされていますか? DAAQとしては、一度作成した後のテストについての制御をして いません。チームの運用ルールがありますので、そちらに任せ ています。 情報を DAAQが保有すると、情報の混在リスクが発生するた め、現状は一切 DAAQに保有させていません。 フルリグレッションテスト、回帰テスト、のように単純に「テスト対 象の数が多くなる」ようなときに、テスト設計やテスト実行におい て、ヒトまたは AIで工夫していることはありますか? 多いこと自体は問題視しておりませんが、それが QCDの鼎立を 満たさない場合はテスト戦略上の操作をしています。 基本的にはリスク分析してテストを減らしていますが、現状の DAAQではリスク分析はできていません。 AI化してみて、 AI化しない方が良いと思った部分はあります か? AIじゃないほうが、と思ったことは特にありませんでした レビューアの立場で見れば、誰が作ろうとも読み解いてレビュー して完成させる責任があるため特に変わりませんでした ただし、 AIは人間が分かりやすい言葉選びが苦手なため、イン スペクションでは少し翻訳して提出をしています

20.

当日頂いたご質問と回答④ 参加者のご質問 登壇者の回答 Cマークを見逃すと会社にどのような損害が生じるのでしょう か? このこと自体に存在を生むものはありません 『人に任せた作業に自信はあるか?』を示す例となりますが、実 際には法務と調整した規約が誤っていたりすると、会社の損害 につながるものとなります。 なお、 ©は実際によくミスを見かける箇所ではあります AIにどこまで任せるか?の話で、 AIの精度ですが、そもそも人 の精度もあるような …人は完全完璧ではないと思いました。今日 の話は人間が完璧前提で話しているかのように感じました 評価する人間の期待値を、 AIの期待値の上限に置いています。 QCDでいえば Qにリスクを感じていないため、便宜的に人間を完 璧として扱っています。 ◆参考 DeNA AI Day2026 AI×品質管理 AI化の目的と評価軸 テスト手順がわかりづらいのはそもそもの のでは? UX設計に問題がある UX設計自体はインスペクションで解決する問題のため、それで もなお分からない手順をテスト手順として与えています。 初見で見る AIが自然に操作できるように、事前情報を与える構 造としています。

21.

ご質問はSlidoへ © DeNA Co., Ltd. 21

22.

Appendix AIによる作業時間