>100 Views
June 27, 26
スライド概要
何卒よろしくお願い申し上げます。 一流のIT研修講師を目指し、日々研鑽を続けております。 本資料は外部公開用としてご提供するものです。
NotebookLM 顔統一プロンプト集 キャラクター・アイデンティティ一貫性の 科学的アプローチ 査読済み論文ベース / AI画像生成・顔特徴制御の最新知見 うさうさ研修工房 🐰 面白きこともなき世を面白く
なぜ「顔統一」が難しいのか 顔特徴の多次元性 人の顔は目・鼻・口・輪郭・色調など 数十の独立パラメータで構成される。 一般的なプロンプトは「全体印象」を 指示するため特徴が揺れやすい。 確率的生成の限界 拡散モデルは確率的サンプリングを行う ため、 同一プロンプトでも毎回異なるノイズから 生成される。顔の「同一性」は保証されな い。 参考: Rombach et al. (2022) High-Resolution Image Synthesis with Latent Diffusion Models. CVPR セマンティックドリフト スタイル・表情・ポーズの指示が 顔特徴に意図せず干渉する。 「笑顔」を指示しただけで 顔の造形が変わることがある。 うさうさ研修工房 🐰
顔統一プロンプトの 3層構造 Layer 1:アイデンティティ固定層 性別・年齢・人種・基本骨格を固定 → キャラの「DNA」 Layer 2:特徴詳細層 目の形・鼻梁高さ・唇形状・肌色を数値的に記述 → キャラの「パーツ仕様書」 Layer 3:状況依存層 表情・照明・アングル・スタイルを分離指定 → キャラの「演出指示」 💡 3層を分けて記述することで、 Layer 3 を変えても Layer 1-2 が安定する うさうさ研修工房 🐰
プロンプト集 ① :基本テンプレート(顔固定) 📋 コピペ用テンプレート [CHARACTER_NAME], consistent face identity, [AGE]-year-old [GENDER], [ETHNICITY] features, [EYE_SHAPE] eyes, [EYE_COLOR] iris, [NOSE_DESC], [LIP_DESC], [SKIN_TONE] skin, [FACE_SHAPE] face shape, same person across all images, photorealistic, high detail, -- [STYLE_OPTION] | [EXPRESSION] | [LIGHTING] [ ] 部分 角括弧内をキャラ設定に合わせて書き換える -- 以降 Layer 3(状況変数)を / で区切って変更可 consistent face NotebookLM がセッション内で顔を参照するキー句 うさうさ研修工房 🐰
プロンプト集 ② :シーン別応用パターン 😊 表情バリエーション 📸 アングル変更 same face identity as [CHAR], smiling expression, keep all facial features identical, only change mouth and eye expression same person [CHAR], side profile / 3/4 view / front view, consistent facial structure, same bone structure 💡 表情変化は expression-specific キーワードで分離 💡 視点変更は bone structure / facial structure で固定 🎨 スタイル変換 👗 衣装変更 character [CHAR], anime style / watercolor / sketch, preserve: eye shape, nose bridge, lip contour, face proportions identical face to [CHAR], wearing [NEW_OUTFIT], do not change: facial features, skin tone, hair color 💡 preserve: で保持パーツを明示的にリスト化 💡 do not change: で変更禁止を明示するネガティブ指示 うさうさ研修工房 🐰
プロンプト集 ③ :顔特徴の科学的語彙集 🔵 目・眼 🔵鼻 almond-shaped / hooded / monolid / deep-set / wide-spaced eyes dark limbal ring, defined iris texture, [COLOR] iris low/high nose bridge, broad/narrow nostrils, bulbous/pointed nasal tip, defined alar groove 🔵 口・唇 🔵 顔型・骨格 full/thin lips, Cupid's bow defined, downturned/upturned corners, philtrum depth [shallow/deep] oval/square/heart-shaped face, high cheekbones, defined jawline, prominent chin 🔵 肌・色調 🔵 ネガティブ指示 warm/cool/neutral undertone, [Fitzpatrick I-VI] skin tone, smooth skin texture, visible pores do NOT: change eye shape, alter facial structure, modify skin tone, distort proportions 参考: Fitzpatrick (1975) Soleil et peau. J Med Esthét. / Ekman (1978) Facial Action Coding System うさうさ研修工房 🐰
プロンプト集 ④ :NotebookLM 活用テクニック キャラクターバイブル登録 01 NotebookLM のソース文書として キャラクター設定シートを登録。 「このキャラの顔の特徴を参照して画像生成プロンプトを作成して」で 毎回一貫した顔記述を取得できる。 差分比較プロンプト 02 前回と同じ顔で [変更点] のみ変えた 画像プロンプトを生成して ── NotebookLM が差分を管理し ドリフトを自動抑制する。 CLIP スコア最適化 03 同一人物を担保する呪文 : "same individual", "consistent identity", "identical facial features to previous" ──モデルの CLIP 埋め込み空間で 顔 embedding を安定させる効果が報告されている。 参考: Radford et al. (2021) Learning Transferable Visual Models From Natural Language Supervision. ICML うさうさ研修工房 🐰
プロンプト集 ⑤ :ネガティブプロンプト(顔崩れ防止) 🚫 マスターネガティブプロンプト different face, changed features, inconsistent identity, morphed appearance, altered eye shape, modified nose, changed lip shape, different skin tone, age regression, age progression, gender swap, ethnicity change, distorted proportions, asymmetric face, uncanny valley, deepfake artifacts 構造的崩れ different face structure altered bone structure changed facial proportions 部位変化 modified eye shape changed nose bridge altered lip contour 属性変化 age change gender swap ethnicity change 品質問題 blurry face cartoonish features uncanny valley うさうさ研修工房 🐰
NotebookLM × 顔統一 実装ステップ 1 2 3 4 5 STEP 1 STEP 2 STEP 3 STEP 4 STEP 5 キャラバイブル作成 NotebookLM へ登録 プロンプト生成依頼 検証・フィードバック プロンプトライブラリ化 「このキャラの顔設定を忠 実に反映した [シーン名] の画像生成プロ ンプトを作成して」 出力プロンプトで画像生成 → 顔が揺れた箇所を NotebookLM に「○○が変 わった、修正して」でループ 改善 確定プロンプトをシーン別に ノートへ保存 → 次回以降はそのまま再 利用・差分更新のみ 名前・年齢・性別・民族的背 景 Fitzpatrick スケール肌色 各パーツの英語記述(本ス ライドの語彙集を使用) テキストファイルまたはド キュメントとして ソース追加 → 「キャラク ター設定」とタイトル付け うさうさ研修工房 🐰
まとめ 1 2 3 4 5 顔統一の鍵は「3層分離」── アイデンティティ固定 / 特徴詳細 / 状況依存 を分けて記述する Fitzpatrick スケール・FACS 準拠の語彙を使うと再現性が高まる(査読済み研究に基づく) NotebookLM ではキャラバイブルをソース登録することでセッションをまたいだ顔管理が可能 ネガティブプロンプトで「変化してほしくない要素」を明示的にブロックする CLIP 空間での顔 embedding 安定化には same individual / consistent identity が有効 うさうさ研修工房 🐰 またお会いしましょう | 面白きこともなき世を面白く