ユニットテスト基礎講座

462.6K Views

June 07, 25

#テスト #ユニットテスト #テスト駆動開発 #AI #ソフトウェアテスト #ソフトウェア設計

スライド概要

JJUG CCC 2025 Spring 登壇資料

yonekubo / アーキテクトの教科書

@tyonekubo

スライド一覧

著書『アーキテクトの教科書価値を生むソフトウェアのアーキテクチャ構築』（翔泳社）

またはPlayer版

埋め込む »CMSなどでJSが使えない場合

ダウンロード

関連スライド

アーキテクチャを設計するといふこと 2025年版

アーキテクチャ

yonekubo / アーキテクトの教科書 225K

Architecture to Design より良い設計を目指して

アーキテクチャ

yonekubo / アーキテクトの教科書 195.7K

アーキテクチャを設計するといふこと

アーキテクチャ

yonekubo / アーキテクトの教科書 122.5K

コンポーネント設計って何だろう

設計アーキテクチャ

yonekubo / アーキテクトの教科書 93.6K

設計原則と普遍的な判断軸

設計

yonekubo / アーキテクトの教科書 71.4K

変わりゆくもの、変わらないもの。

yonekubo / アーキテクトの教科書 70K

各ページのテキスト

ユニットテスト基礎講座 Jun. 7, 2025 @JJUG CCC 2025 Spring Takeshi Yonekubo

About Me 米久保剛 (よねくぼたけし) ITアーキテクト『アーキテクトの教科書』（翔泳社） X: @tyonekubo note: https://note.com/yonekubo

ユニットテスト、書いていますか？

ユニットテスト、十分に書けていますか？ユニットテスト、上手に書けていますか？

ユニットテストについての課題認識 • ユニットテストを書くことは当たり前になってきた • 書籍など（日本語の）情報源は多くない • ベストプラクティスは浸透しておらず、誤った認識も多い

「テストコードなんて、 AIに書かせればよくね？」

事実、AIにテストコードは書ける。（今回のサンプルコードの大半は AIエージェントに書かせた）

だが、AIにテストコード作成を任せっきりにすべきではない

理由❶ AIが生成するテストは平均点プロダクションコード仕様書 (Markdown) AIエージェント LLM 「テストコード書いて」テストコード学習済みの一般知識＋コンテキストに含まれる固有知識をもとに、確率的にもっともらしいテストコードを生成 AIは状況に応じたテスト戦略は考えてくれない（人間の指示が必要）

10.

理由❷ AIは間違えるプロダクションコード仕様書 (Markdown) AIエージェント LLM 「テストコード書いて」テストコードテスト条件や検証内容の妥当性は、 100%の精度にはなり得ないプロダクションコードの誤りはテストで検知し修正できるが、テストコード自体を守るものはない

11.

現状は、人間がテストの戦略を立て、テストの妥当性を評価しなければならない

12.

テストコードはVibe Codingするべからず雰囲気

13.

Automated Testing（自動テスト）に関するドメイン知識は重要さを増す

14.

Part 1. ユニットテストの基本概念

15.

ユニットテストとはユニットテストと統合テストの境界は曖昧（解釈による） E2E Test Integration Test Unit Test

16.

テストサイズによる分類 Googleでは、共通理解促進のため、テストサイズ（S/M/L）による分類が用いられる出典: “Test Sizes” (Google Testing Blog) https://testing.googleblog.com/2010/12/test-sizes.html Large Medium Small

https://testing.googleblog.com/2010/12/test-sizes.html

17.

ユニットテストの定義 • 「単体（unit）」と呼ばれる少量のコードを検証すること • 実行時間が短いこと • 隔離された状態で実行されること

18.

ただし、古典学派とロンドン学派によって「ユニット」の捉え方が異なる ※古典学派とロンドン学派のスタンスの違いや、歴史的経緯等は『テスト駆動開発』付録Cを参照

19.

ユニットテストの定義（古典学派） • 1単位の振る舞い（a unit of Behavior）を検証すること • 実行時間が短いこと • 他のテスト・ケースから隔離された状態で実行されること

20.

ユニットテストの目的主要な目的： 1. 期待どおりに正しく動作することを検証する ✓バグを摘出する 2. 退行を防ぐ（回帰テスト） ✓ミスによる機能退行を検知することができる 3. ドキュメンテーション ✓テストコードという実例を通して仕様を理解できる（Specification by Examples）

21.

質の良いテストが必要単にテストを作成すれば十分ということではありません …作成されたテストの質が悪ければ、テストを全くしない場合と同じ結果になる出典: “単体テストの考え方/使い方” 第1章

22.

テストコードは散らかりやすい具体値で記述するテストコードは、プロダクションコードの数倍の規模となる →放っておくと散らかっていく出典: “アーキテクトの教科書” 第5章

23.

テストコードのSOS テストコードは意識的にきれいな状態に保ち、負債化するのを防ぐ ✓構造化されている（Structured） ✓整理されている（Organized） ✓自己文書化されている（Self-documenting）

24.

小まとめ •ユニットテストの「ユニット」が指すものを明確にせよ（＝1単位の振る舞い） •テストを作成するだけでは不十分、質の良いテストを作成せよ •テストコードは散らかりやすいので、意識してきれいな状態を保つべし

25.

Part 2. テスト対象の振る舞いの識別ーあるいは設計という行為

26.

サンプルアプリ仕様：映画チケット料金計算通常料金大人 2,000円高校生 1,000円シニア 1,500円小中高生 1,000円大学生 1,500円幼児 1,000円割引料金 • • • • 水曜日割引：1,300円ファーストデー（毎月1日）：1,300円映画の日（12月1日）：1,000円会員割引（月〜木）：1,300円クーポン料金 • 提携先サービス毎に適用条件と料金が異なる ※料金が同額の場合は通常＞割引＞クーポンの適用順サンプルコード: https://github.com/yonetty/cinema-ticket-calc

27.

“1単位の振る舞い” を識別する

28.

トランザクションスクリプト if文などを駆使して書かれた一枚岩のロジック「レガシーっぽいコード書いて」「ほいつ」 LegacyPriceCaluculationService.java

29.

対応するテスト 6カテゴリ 34ケーステストケースの例「ユニットテストも書いて」「ほいつ」高カバレッジ

30.

Q. テストの網羅性は十分か？

31.

(QAエンジニア) 「料金計算ロジックの因子水準数より、全網羅だと384ケース、ペアワイズ法で 2因子網羅だと49ケースなので、34ケースは若干少なくないでしょうか？」

32.

(開発者) （実装上は相関のない因子もあるし、開発者テストとしては十分な気もするが..）

33.

振る舞いが大き過ぎる！トランザクションスクリプトはユニットテストに不向き（このコードでは断言できないな…）

34.

Divide and Concur 分割して統治せよ

35.

振る舞いを分割する大きな振る舞いを、複数の小さな振る舞いに分割する通常料金を取得する適用可能な最安の割引を判定し、クーポン適用料金がある場合は比較してより安い料金を返す。どちらもない場合は顧客分類に対応する通常料金を返す。適用可能な割引の中から最安の料金を判定する Too big! 通常料金、割引料金、クープン適用料金のうち最安の料金を判定する

36.

処理フローロジックと中核ロジックに分けるアプリケーションサービスは、処理の流れの制御に徹する通常料金を取得する料金計算適用可能な割引の中から最安の料金を判定するアプリケーション通常料金、割引料金、クープン適用料金のうち最安の料金を判定するサービス個々のビジネスロジック

37.

関心の分離個々の小さな振る舞いに入力される因子数は、少なくなる顧客分類顧客分類日付通常料金を取得する日付会員フラグクーポン料金会員フラグ料金計算適用可能な割引の中から最安の料金を判定する（通常料金）（割引料金）クーポン料金通常料金、割引料金、クープン適用料金のうち最安の料金を判定する

38.

用語説明：因子水準、組み合わせテスト組み合わせテストにおいて、パラメーターとなるものが「因子」パラメーターの取る値の種類が「水準」因子水準1 水準2 水準3 Javaバージョン Java 17 Java 21 Java 24 ディストリビューション Oracle Corretto Zulu OS Windows macOS Ubuntu 水準4 CentOS 全網羅：すべての因子水準の組み合わせをテスト上記例だと、3 x 3 x 4 = 36通り 2因子網羅：任意の2因子において全組み合わせが担保されるようテスト上記例だと、12〜16通り程度に削減可能（方法：直交表、ペアワイズ法など）

39.

テスト設計のしやすさ因子数が減れば、テスト条件（組み合わせ数）も減る通常料金を取得する適用可能な割引の中から最安の料金を判定する顧客分類日付会員フラグ一般 12月1日会員シニア 12月2日非会員大学生 11月30日中高生 11月1日小学生水曜日幼児月-木金土日通常料金、割引料金、クープン適用料金のうち最安の料金を判定する（通常料金）なし（割引料金）クーポン料金 ※実際には、月・日・曜日に因数分解した方が良い X円 Y円なし Z円 ※実際には、X・Y・Zの大小関係という因子もあるので組み合わせは増える

40.

小まとめ •ユニットテストで検証すべき「1単位の振る舞い」を識別せよ •大きなものは、分割して統治せよ •小さくすることで、テスト設計の容易性も向上する

41.

Part 3. 質の良いテストコードを書くには

42.

テストコードのSOS “構造化されている（Structured）”

43.

パッケージ構造プロダクションコードもテストコードも、水平分割（技術観点）ではなく垂直分割（業務観点）でパッケージを設計する com └── example ├── domain │ ├── coupon │ └── price ├── persistence │ ├── coupon │ └── price └── web ├── coupon └── price com └── example ├── coupon │ ├── domain │ ├── persistence │ └── web └── price ├── domain ├── persistence └── web 料金計算の改修時は、この部分のテストスイートのみに集中できる

44.

テストケースの階層化内部クラスを用いてテストケースをグループ分けする（JUnit 5では @Nested アノテーション）グループ分けの観点は後述

45.

テストケースの階層化多階層にしてもよい第１階層第2階層第3階層階層が深くなり過ぎたり、全体のコード行数が大きくなり過ぎたりすると見通しが悪くなる →複数のテストクラスへファイル分割を検討しよう

46.

階層化のメリットテストランナーで視覚的に構造を俯瞰でき、必要に応じてドリルダウンできる（鳥の目／虫の目）

47.

テストコードのSOS “整理されている（Organized）”

48.

テストケースのグループ分けテストケースを体系的に分類することで、観点の抜け漏れや網羅性のチェックがしやすくなる (例) 正常系/準正常系/異常系でグループ分け (例) テストケース数が多い場合にパターンによりグループ分け

49.

（補足）テスト設計の根拠グループ分けにより体系は把握しやすくなるが、どのような観点でテストケースを分類したのか、「テスト設計の根拠」までは表現できない JavaDocコメントとして、テスト設計の根拠を記すのがオススメ

50.

パラメーター化テスト同じ内容の検証を行うテストメソッドが多数あると冗長で見通しが悪いので、パラメーター化テストを導入するテストメソッド本体パラメーターのソース 1ケース目のパラメータ複数のテストケースに展開して実行： 2ケース目のパラメータ

51.

テストコードのSOS “自己文書化されている（Self-documenting）”

52.

「自己文書化されている」テストコードを一瞥しただけでテストの目的や条件が明快にわかること

53.

テストの名称メソッド名（または表示名）に、日本語（または標準言語で）でテスト条件と期待する振る舞いを明示する NG例： “割引料金未適用のテスト”

54.

AAA または Given-When-Then Arrange（準備）、Act（実行）、Assert（検証）の 3フェーズに分けて記述するポイント： • Actは原則1文 • Arrange-Act-Assert-ActAssertのように繰り返すのは絶対NG

55.

可読性を考慮する実用的なコードだと、ArrangeとAssertは記述が長く冗長になりがち。とくにテストフィクスチャのセットアップはヘルパーメソッドに切り出すなど、読みやすさを考慮する。

56.

用語説明：SUT、DoC、テストフィクスチャ SUT (System under test): テストする対象 Doc (Depended-on component): SUTが依存するもの DoC Foo Param テストコード SUT Bar Fixture テストフィクスチャ (Test fixture): テスト実行に必要なものすべて DBのデータや、環境変数、なども含む Baz

57.

大きな振る舞いに対するユニットテスト

58.

小さく分割した振る舞いをテストした後は？アプリケーションサービスに対するテストをどうする？通常料金を取得する料金計算適用可能な割引の中から最安の料金を判定するアプリケーション通常料金、割引料金、クープン適用料金のうち最安の料金を判定するサービス個々のビジネスロジック

59.

処理フローロジックのテストは必要か？アプリケーションサービスが担う、処理フローロジックのみを検証することは手間がかかる（モック利用）上に実りが少ない Aを呼ぶ。次にBを呼ぶ。もし〜だったら …という一連の手続きは内部設計(実装の詳細)であり、外部の呼び出し側コードの関心事ではない料金計算サービスの実装

60.

集合体として提供する振る舞いをテストするより大きな振る舞いを、網羅的にテストするか、否か？ →テスト戦略次第だが、基本的には代表的なパターンとエッジケースをテストすれば十分だと考える料金計算コンポーネント料金計算サービスサービスは処理フローに専念していることが前提

61.

テストダブルの使い方

62.

テストダブルとは実物のコンポーネント（DoC）の代替となるもの出典: “xUnit Test Patterns” 第11章

63.

間接入力 SUTはDoCとの相互作用により、振る舞いを実現する DoCが返す結果＝SUTにとっての間接入力 DoC 直接入力テストコード SUT 間接入力 DoC

64.

スタブによる間接入力の制御何らかの理由で間接入力を制御したい場合、スタブを用いる Stub 直接入力テストコード SUT 間接入力 DoC

65.

いつスタブを使うかスタブを使うと良いケース： ✓サードパーティのライブラリなど、制御困難なDoC ✓複雑なオブジェクトグラフで、セットアップが困難なDoC ✓通常だと発生しない例外をDoCから発生させたい ✓期待する間接入力をDoCから得るための条件が煩雑 Mockitoのメソッドはスタブとモックの区別がないが、変数名でスタブであることを明言

66.

間接出力 SUTが呼び出し元に返却する直接出力の他に、副作用として発生するもの＝間接出力 DoC テストコード SUT 直接出力間接出力 DoC

67.

モックによる間接出力の観測何らかの理由で間接出力を観測し、それを検証したい場合、モックを用いる DoC テストコード SUT 直接出力間接出力 Mock

68.

いつモックを使うか使わずに済ませられないか？を考える： ✓それは本当に観測すべきものか？ ✓副作用がなくなるように設計を見直せないか？外部との契約として観察可能な振る舞いに限り、モックで検証してOK 出典: “単体テストの考え方/使い方” 第5章

69.

テストダブルの利用指針 ✓まずは、テストダブルを使わずに済むか考える ✓スタブは目的を理解した上で適切に使えばOK ✓モックの利用は極めて慎重に

70.

テストパターン

71.

テストパターン今日は紹介する時間がないが、テスト特有のパターンについて代表的なものは押さえておくとよい出典: http://xunitpatterns.com/index.html

72.

小まとめ •テストコードのSOSを用いて整理整頓する •小さな振る舞いを網羅的にテストした後、より大きな振る舞いをテストする •テストダブルに頼り過ぎることなく、うまく活用する

73.

まとめ

74.

Key Message 1. ユニットテストの意義 • ユニットテストは1単位の振る舞いを検証する • 振る舞いの識別と分割（＝設計） • テストコードを書くことは、設計と表裏一体 • テストコードを通して「設計の筋の良さ」を検証できる

75.

Key Message 2. テスト容易性 • テスト容易性という品質特性は重要 • 「テストコードを書きやすい」という観点 • ＋「テスト設計をしやすい」という観点

76.

Key Message 3. テストコードを重要な資産として扱う • テストコードのSOS： • 構造化されている（Structured） • 整理されている（Organized） • 自己文書化されている（Self-documenting） • 自動テストの持続可能性のために、テストコードにも力を入れよう

77.

参考文献リストタイトル著者・訳者出版社（出版年）アーキテクトの教科書価値を生むソフトウェアのアーキテクチャ構築米久保剛著翔泳社（2024）テスト駆動開発 Kent Beck 著和田卓人訳オーム社（2017）単体テストの考え方/使い方 Vladimir Khorikov 著須田智之訳マイナビ出版（2022） xUnit Test Patterns Refactoring Test Code Gerard Meszaros 著 Addison-Wesley（2007）