786 Views
March 18, 24
スライド概要
仏大手新聞ルモンドがオープンAIと提携した(3月14日)。今後大っぴらにルモンドは自前記事をChatGPTによって要約し、利用者が最新ニュースを尋ねてきた場合ChatGPT作成の要約を提供するサービスを開始する。オープンAIはスペインの新聞、ドイツの大手メディアとも提携した。日本のメディアはどのような対応を取るのだろうか?いずれにしろ、メディアだけで無く一般市場においてもChatGPTを利用して新たなサービスを如何に実現するかの(イノベーションの)段階に入ったと考えられる。・・・このような問題意識から、それらと係わる「イノベーションへのChatGPTの適応」をまとめた。
定年まで35年間あるIT企業に勤めていました。その後、大学教員を5年。定年になって、非常勤講師を少々と、ある標準化機関の顧問。そこも定年になって数年前にB-frontier研究所を立ち上げました。この名前で、IT関係の英語論文(経営学的視点のもの)をダウンロードし、その紹介と自分で考えた内容を取り交ぜて情報公開しています。幾つかの学会で学会発表なども。昔、ITバブル崩壊の直前、ダイヤモンド社からIT革命本「デジタル融合市場」を出版したこともあります。こんな経験が今に続く情報発信の原点です。
イノベーションへのChatGPTの適応 B-frontier 研究所 高橋 浩
自己紹介 - B-frontier研究所代表 高橋浩 • 略歴: • 元富士通 • 元宮城大学教授 • 元北陸先端科学技術大学院大学 非常勤講師 • 資格:博士(学術)(経営工学) • 趣味/関心: • 温泉巡り • 英語論文の翻訳 • それらに考察を加えて情報公開 • 主旨:“ビジネス(B)の未開拓地を研究する” 著書: 「デジタル融合市場」 ダイヤモンド社(2000),等 • SNS: hiroshi.takahashi.9693(facebook) @httakaha(Twitter)
目的 • 使い易い生成AIの登場がイノベーションへのAI使用を 民主化させ、我々の働き方やイノベーションの創出を 大きく変える可能性が出てきている。 • 例えば、生成AIはイノベーション初期のプロトタイピ ングでゲームチェンジャーになる可能性がある。 • このような変化はその他のプロセスでも発生する。 • このような認識から、生成AIがイノベーションの多様 なプロセスの中でどのような可能性を登場させるか探 索することを本稿の目的とする。 3
目次 I. イノベーション初期のプロトタイ ピング II. 現実世界をテストするためのシ ミュレーション III. 新たな技術フロンティアのナビ ゲーション IV. 新たなパラダイムの考察 4
はじめに ChatGPTの従来AIと区別される特性 • モデルサイズと品質が向上するにつれ、時間経過とともに機能 ① が急速に成長する。 • 下記ベンチマークなどで確認できる。 • 医学から法律に至る各種の専門分野に対応できる能力の向上 • さまざまな標準化された学力テストでのパフォーマンススコアの向上 • ドメイン固有の問題を解決する一般的な能力を保有している。 ② • 初期的には次のような分野で汎用的効率性を実現している。 • 執筆タスク、プログラミング、アイディア出しなどの創造的作業、など ③• 相対的な不透明性がある。 • 欠点(障害)とみられる面もあるが・・・ • 最適な使用法が継続的にユーザーの試行錯誤を通して学習されること で改善されてゆく特性と見ることもできる。 5
これらの特性が統合されると・・ • 驚くべき能力が発揮される。そして、これらはユーザーの技術 的スキルをほとんど前提(条件)とせずに実行できる。 • しかし、不透明で障害が発生する可能性はある。ピッタリ当て はまり高効率が達成できるタスクがある一方、一部のタスクに ついては困難に直面する。 • そのため、人間とAIの相互作用がどのような関係にあるのか、 どのように変化させ得るのか等を理解することが必要になる。 • このような状況を以下の3例で検討する。 I. 初期のプロトタイピング II. 現実世界を社会科学的な視点でテスト III. 新たな技術フロンティアを如何にナビゲートしてゆくか 6
Ⅰ.イノベーション初期のプロトタイピング イノベーションの新たなパラダイム • 従来、創造的仕事は人間の研ぎ澄まされた知性が担うこととさ れて来た。 • しかし、ChatGPTの登場以来、生成AIは企業のイノベーション にまで適応できることが明らかになってきた。 • 但し、既存のオフィスワークの効率化などへの適応は進んでい るが、工業製品への適応などを扱った事例は少ない。 • そこで、デジタル製品(例:自動車市場と自動車の動作を制御 するデジタルアプリ)を例題にして、イノベーション初期のプ ロトタイピングに生成AI適応のプロセスパターン化を試みる。 7
プロトタイピングのプロセス まず何を作成すべきかを、2フェーズ、6プロセス(例)に分解して示す。 例1: プロ 例2: ジェ クト 探索 例3: 例4: アイ 例5: ディ ア創 例6: 出 一般的な影響要因の収集 (自動車市場のPESTEL分析による) 特定のニーズや課題の抽出 (「車で休暇」を取る場合を例にして旅を探索) 様々な顧客層(ユーザー・グループ)の把握 (「自動車のパフォーマンス愛好家」を例にして顧客像を特定) 顧客とのインタビュー方法の探索 (30分間の顧客インタビューのガイドライン抽出によって) 上記プロジェクト推進のための各種サービスのアイディア出し (「車で旅に出かける顧客」に向けた関連サービスのアイディア出し) より踏み込んだ創造的アイディアの抽出 (SCAMPERメソッドを使用して探索) これを受けて、製品開発フェーズは後続の例7~例12で示す。 8
準備1:例1で使用するPESTEL分析とは? • 自社を取り巻く外部環境について分析する手法。企業にとっ ての機会を生み出したり、逆に脅威を与えたりする外部環境 (マクロ環境)を、6つの視点から分析するフレームワーク。 • PESTLEとは、6つのマクロ環境「政治的要因」「経済的要 因」「社会的要因」「技術的要因」「法的要因」「環境的要因」 の英語の頭文字を示す。 Political:政治的要因 法律や条例による規制や公的支援などの動向 Economic:経済的要因 景気など経済的要因によるリスクや機会の動向 Sociological:社会的要因 世間のライフスタイルや生活者意識などの動向 Technological:技術的要因 商品開発や技術動向、マーケティング戦略などの動向 Legal:法的要因 新しい法規制の動向など Environmental:環境的要因 テイクアウト素材やパッケージ包装が環境に配慮かなど 9
準備2:例6で使用するSCAMPERメソッドとは? • アイデア発想法である「オズボーンのチェックリスト」を 改良した、7つの項目からなる質問リスト 10
例1:ビジネス環境分析 (例:自動車市場のPESTEL分析) プロンプト: 自動車市場のPESTEL 分析を実行して下さい。結果は表形式で提供して下さい。 分かりました。以下は自動車市場のPESTEL分析をした結果を表形式で示したものです。 要素 記述 自動車市場への影響 政治的要因 政府の規制と政策 排出ガス、安全性、燃料効率に関する規制は、製造コストや製品設 計に影響を与える可能性があります。 経済的要因 世界経済情勢 経済状況は、サプライチェーンのコストや生産能力だけでなく、自 動車に対する消費者の需要にも影響を与える可能性があります。 社会的要因 消費者の好みや態度の変 化 ライドシェアリングやサブスクリプションモデルなどの消費者の嗜 好の変化は、従来の自動車の所有や販売に影響を与える可能性があ ります。 技術的要因 自動車技術の進歩 自動運転、電気自動車、コネクテッドカー技術の進歩は、イノベー ションと差別化のための新たな機会を生み出す可能性があります。 環境的要因 持続可能性と環境への配 慮 気候変動や環境への懸念に対する意識の高まりは、環境に優しい車 両や排出ガスに関する規制に対する消費者の需要に影響を与える可 能性があります。 法的要因 知的財産法と規制 知的財産を保護し、安全性と排出ガスに関する規制を遵守すること は、製品開発と製造コストに影響を与える可能性があります。 生成結果: これは単なる一般的な分析であり、自動車市場に影響を与える可能性のある他の要因も存在する可能性があるこ とに留意してください。 さらに、地域や市場が異なると、PESTEL 分析で考慮すべき固有の要素が存在する場合 があります。 11
例2:ニーズの特定 (例:旅の探索「車で休暇を取る」場合) プロンプト: 車で休暇を過ごす人の一般的な旅の概要を説明して下さい。また、顧客が休暇中に車を使用する事で直面する一 般的な課題も挙げて下さい。結果は表形式で提供して下さい。 分かりました。以下の表は、車で休暇に出かける人の一般的な顧客の旅と、彼らが直面する可能性のある一般的 な課題を概説したものです。 生成結果: ステージ 記述 課題 事前計画 旅行の探索と計画 最適なルートを選択し、駐車場を提供する宿泊施設を見つけ、移動 のために車が適切に整備されていることを確認する。 出発 家をはなれて旅に出る 渋滞、道路工事、ルート沿いのガソリンスタンドを調べる。 路上で 目的地までの運転 車のトラブルに対処したり、長距離ドライブ中に注意力と集中力を 維持したり、休憩を取るための休憩所を見つけたりする。 到着 目的地に到着 駐車場を見つけたり、慣れない道を進んだり、車から荷物を降ろし たりする。 休暇中 目的地を探索して楽しむ 観光名所の近くの駐車場を見つけたり、地域の交通と駐車規則に対 処したり、不慣れな場所で車を安全に保ったりする。 戻る 故郷に帰る旅の始まり 渋滞、ルート沿いのガソリンスタンドの検索、旅行中に発生した可 能性のある車の問題への対処を行う。 旅行後 帰宅して旅を振り返る 旅行後に車を掃除し、旅行中に発生したメンテナンスの問題に対処 し、今後の旅行の計画を立てる。 繰り返しになりますが、これは一般的な概要であり、旅行の詳細やお客様の個別のニーズに応じて追加の課題や 段階が存在する可能性があることに留意してください。 12
例3:ペルソナの作成 (例:顧客タイプ“パフォーマンス愛好家”) プロンプト ユーザーグループ「パフォーマンス愛好家」のマーケティングペルソナを作成して下さい。 分かりました。以下の表は、車で休暇に出かける人の一般的な顧客の旅と、彼らが直面する可能性のある一般的な課題を概説 したものです。 人口動態(典型的プロフィール): • 年齢: 35 ~ 45 歳程度 • 性別:男性 • 職業: 成功したビジネスオーナー • 収入: 高収入 サイコグラフィックス(心象的特性): • 興味: オートレース、高性能車、テクノロジー、高級時計 • 性格特性: 競争心、野心家、テクノロジーに精通、ステータスを意識 • 価値観: パフォーマンス、革新性、品質、独占性 生成結果: 目標: • スリル満点の運転体験を提供し、彼の成功と地位を反映する高性能車所有を支援すること • 自動車技術と性能の最新の進歩を常に把握すること • 他のパフォーマンス愛好家とつながり、トラックデーやその他の自動車イベントに参加すること 課題: • 仕事と家族/家庭の義務のバランスをとりながら、高性能車への情熱を追求する時間を見つけること • 最新の自動車技術と進歩を常に最新の状態に保ち続けること BMW は彼にどのようにアピールできるか: • ターボチャージャー付きエンジン、先進的なサスペンション システム、最先端の運転支援技術など、車両のパフォーマンスと技術的特 徴を強調する。 • 目立ちたい、主張したいという彼の願望を表す言葉を使って、BMW の所有に伴う独占性とステータスを強調する。 • トラックデーや BMW 主催のイベントなど、彼が他のパフォーマンス愛好家とつながる機会を提供する。 • さまざまなカスタマイズ オプションへのアクセスを提供し、彼が自分の BMW をカスタマイズし、ユニークな運転体験を作成できるよ うにする。 13
例4:メソッドサポート(例:面接ガイドライン) プロンプト: 30 分間の顧客インタビューのインタビュー ガイドラインを作成して下さい。自動車に関する顧客のニーズを特定 するためです。 分かりました。自動車に関する顧客のニーズを特定するための 30 分間の顧客インタビューのインタビュー ガイドラインは次のとお りです。 導入: • 自己紹介と面接の目的を説明します。 • 現在の車のメーカーやモデルなど、現在の車の所有状況を簡単に説明してもらうようお客様に依頼します。 背景: • 過去に所有していたブランドやモデルなど、これまでの車の所有経験について尋ねます。 • 車の主な用途 (通勤、家族の移動、レジャー活動など) について尋ねます。 機能と利点: • 車の機能と利点 (例: 安全性、燃費、パフォーマンス、テクノロジーなど) について最も重視するものについて質問します。 • 次の車に搭載したい具体的な機能について尋ねます。 生成結果: 課題と問題点: • 現在または以前の車で経験した課題や問題点 (メンテナンスの問題、安全性への懸念、快適性など) について質問します。 • 現在または以前の車に欠けていると感じる機能や利点があるかどうかを尋ねます。 購入の決定: • 車を購入する際の意思決定プロセスについて、どのような要素を考慮するか (価格、安全性、燃費など) を含めて尋ねます。 • 車を調査および比較するための好ましい方法があるかどうかを尋ねます (オンライン調査、ディーラーを訪問するなど)。 ブランド認知: • 特定のブランドとの関連性 (高級感、信頼性、パフォーマンスなど) を含め、さまざまな自動車ブランドに対する認識について質問 します。 • 彼らが持っているブランドロイヤルティとそのロイヤルティに寄与する要因について尋ねます。 まとめ: • お時間を割いて貴重なフィードバックをいただきましたことをお客様に感謝します。 • 最後に共有したい意見やフィードバックがあるかどうかを尋ねます。 • 彼らのフィードバックは貴重であり、車の購入体験を向上させるために使用されることを繰り返し述べます。 14
例 5: アイディア生成 プロンプト: あたかもアイデア創出ワークショップの参加者であるかのように行動してください。車で旅行に行くお客様の課 題を解決する車や関連サービスのアイデアを創出して下さい。 了解しました。車で旅行に出かけるお客様の問題を解決できる、車と関連サービスのアイディアをいくつか紹介します。 生成結果: 1. スマートなルート計画: AI を活用したナビゲーション システムを搭載した車両で、リアルタイムの交通データとドライ バーの好みに基づいて、途中の景色の良いルートや人気の観光スポットなど、最適なルートを計画できます。 2. 快適性と利便性: 広々とした快適な室内空間を備え、調節可能な座席、空調設備、荷物や旅行用品を収納できる十分な 収納スペースなどの機能を備えた車。 3. モバイル充電ステーション: 人気の観光地や主要幹線道路沿いに設置されたモバイル充電ステーションのネットワーク。 これにより、電気自動車のドライバーは外出中に車両を充電できます。 4. 車内エンターテインメント:大型タッチスクリーンディスプレイ、プレミアムサウンドシステム、ストリーミングサー ビスなど、長時間のドライブでも乗員を飽きさせない高品質なエンターテインメントシステムを搭載した車両。 5. 安全機能:衝突回避システム、車線逸脱警報、死角監視などの先進安全機能を搭載し、安全でストレスのない運転体験 を実現します。 6. オンデマンドの車の清掃およびメンテナンス サービス: ドライバーが休暇を楽しんでいる間に、ドライバーの場所に来 て、車の清掃、細部の仕上げ、およびメンテナンス サービスを提供する移動サービス。 7. レンタカー配送・引取サービス:お客様がレンタカー営業所までご来店いただく必要がなく、お客様のご自宅までレン タカーをお届けし、ご旅行終了後にお受け取りするサービスです。 8. モバイル コンシェルジュ サービス: 顧客の興味や好みに基づいて、地元の観光スポット、飲食店、アクティビティなど の個別の推奨事項を提供するモバイル コンシェルジュ サービス。 9. 車内飲食デリバリー:お客様が地元のレストランに飲食を注文し、直接車まで届けてくれるサービスです。これにより、 旅行中にレストランを探す手間が省け、時間を節約できます。 10.カーシェアリング プラットフォーム: 車の所有者が自分の車を使用していないときに他の旅行者に貸し出すことができ るカーシェアリング プラットフォームで、従来のレンタカー会社ではなく個人から借りたい人にとって手頃な価格で便 利なオプションを提供します。 15
例6:アイディア創出(例:SCAMPERメソッド分析) プロンプト: SCAMPERメソッドを使用して、車で旅行に出かけるお客様の課題を解決する車や関連サービスのアイディアを生成して下さい。 結果は表形式で提供して下さい。 分かりました。次の表は、車で旅行に行く顧客の問題を解決するために、SCAMPER メソッドを使用して作成した車と関連サー ビスのアイデアを表形式にしたものです。 SCAMPER法 記述 アイディア例 代用(S) 新しいものまたは異なるもので置き 換えることができる既存のソリュー ションのコンポーネントを特定する。 従来のレンタカー サービスをピアツーピア カーシェアリング プラット フォームに置き換える。 結合(C) 2 つ以上の既存のソリューションを組 み合わせて、新しいソリューション を作成する。 モバイル コンシェルジュ サービスと車内エンターテイメントを組み合 わせて、よりパーソナライズされた楽しい旅行体験を提供する。 適応(A) 既存のソリューションを適応させて、 顧客のニーズにさらに適合させる。 電気自動車の充電ステーションをより移動しやすく、人気の観光地でア クセスできるように調整する。 適応(M) 既存のソリューションを変更して、 機能やパフォーマンスを向上させる。 ナビゲーション システムを変更して、リアルタイムの交通データと風 光明媚なルートを含める。 転用(P) 既存のソリューションの代替用途を 検討する。 移動式の車の洗浄およびメンテナンスサービスを利用して、顧客が休暇 中に車をメンテナンスできる便利で手間のかからない方法を提供する。 削除(E) 既存のソリューションの不必要また は冗長なコンポーネントを削除する。 レンタカーの配送・引き取りサービスを提供することで、顧客が実際に レンタカー営業所に行く必要がないようにする。 並び替え(R) 既存のソリューションの一般的な使 用方法を逆にする。 地元のレストランからの車内配達サービスを提供することで、食べ物や 飲み物の通常の配達方法を逆転させる。 生成結果: SCAMPER メソッドを使用すると、既存のソリューションとそのコンポーネントについてさまざまな方法で考えることができる ため、幅広いアイデアを生み出すことができます。 16
デジタル製品アプリ開発のプロトタイピング • 次に、アイディア抽出やコンセプト生成ができた後に、デジタル製品の プロトタイピングを試みる。 例7: プロンプト: 生成結果: 例8: プロンプト: 生成結果: 自動車用の革新的なアプリを提案してください。 提案の概要は下記 ・「Autoate」という名前の提案 ・アプリの概要 ・主な機能のリスト 何もインストールせずに開くことができるプロトタイプを作成してください。 提案の概要は下記 ・「インタラクティブなプロトタイプを直接作成することはできません」との返信 ・加えて、ヒントとしてFigma または同様のツールを使用してプロトタイプを作成する方法の提示 • Figmaとは:UX/UIプロトタイピング用ソフトウェア • 「自動作成はできない」との拒否反応があった。 • 提案を受けたツールを活用して人間自身の創造的試行錯誤を開始 する必要がある。 17
デジタル製品アプリ開発のプロトタイピング(続) • そして、焦点を絞って後続の処理を行う。 例9: プロンプト: 生成結果: 例10: 例11: 例12: ブラウザで開くことができる単純なプロトタイプのコードを作成するプロセスをガイドして下 さい。 提案の概要は下記 ・基本的なHTMLプロトタイプを作成するための詳細な手順が作成されコードが生成された。 プロンプト: 何もインストールせずに開くことができるプロトタイプを作成してください。 生成結果: ・以前に提案されていた機能の追加など、何回かのやりとりの後、「スマートメイン テナンス」「エコドライブ」の提案を受けた。 プロンプト: 以前ChatGPTから提案されていた全要素を加えることと、サブページの作成を 実行してください。 生成結果: ・該当のコードが生成された。 プロンプト: アプリのデザイン調整のためBMWブランドに関する提案を お願いします。 生成結果: ・コードの生成と画面UXの提案を受けた。 • 結果をチェックし、気に入らないところがあれば、この サイクルの反復実施を自身の判断で行う必要がある。 18
Ⅱ.現実世界をテストするためのシミュレーション ChatGPTについての新たな認識 • ChatGPTはそのトレーニングと設計手法から「人間の暗黙的計 算モデル」と考えることができる。 • この意味で、経済学者が経済学研究にホモエコノミクス(経済 合理性のみに基づいて行動する人間)を活用しているのと同様 の発想で、特定環境を設定することで人間(あるいは特定の環 境で)の行動を調査できる可能性がある。 • 環境の例としては、公平性重視、効率性重視、あるいは自己利 益追求など種々のケースが考えられる。 • そこで、ChatGPTを使用して実際のサービス導入前に現実世界 をコンピュータでテストする感覚でイノベーションあるいは環 境の変更に対する洞察を得るケースを紹介する。 19
ケース1:公平性 • 行動経済学の創始者であるD.Kahnemanによる一連の心理学実 験から、その一例を取り上げる。 目的: 市場の公平性についての直観を評価する。 実験: 被験者は「大吹雪の翌朝に金物店が雪かきスコップの価格を15ドル から20ドルに上げた」ことに対して公平か不公平かが尋ねられる。 結果: 回答者の82%が「不公平」または「非常に不公平」と回答した。 • これに対する当然の疑問として、政治的指向、市場への態度あ るいは表現などでどのような変化があるのか?がある。 • そこで、ChatGPTを使用して、雪かきスコップの価格引き上げ を、回答者の政治的傾向、価格変更の多様化、プロンプトの表 現の変更などを設定して実施した結果を次頁表に示す。 20
異なる政治指向グループによる雪かきスコップ価格つり上げ問題 変更点 • 改定価格を16ドル、20ドル、40ドル、100ドルの4種とする。 • 「価格を~に変える(change)」,「価格を~に上げる(raise)」の2種の表現を設ける。 • 回答者の政治的指向を「社会主義者」~「自由主義者」などと複数設定する。 :上げる(raise) :変える(change) 吹雪の後、雪かきあたり15 ドルから16ドルに価格変更 許容できる 不公平 非常に不公平 吹雪の後、雪かきあたり15 ドルから20ドルに価格変更 許容できる 不公平 非常に不公平 吹雪の後、雪かきあたり15 ドルから40ドルに価格変更 吹雪の後、雪かきあたり15 ドルから100ドルに価格変更 許容できる 不公平 非常に不公平 許容できる 不公平 非常に不公平 21
結果の解釈 • 元論文と比較したChatGPTによる結果の要点: • 価格上昇(16ドルおよび20ドル)を許容しているのは「穏健派」と 「自由主義者」のみ。・・全体的には元論文の結果とほぼ一致 • それに加えて、下記などの細かいデータが入手できた。 • 40ドル以上では全てで「不公平」あるいは「非常に不公平」 • 100ドルは「リベラル」ですら「非常に不公平」 • 「保守」は「穏健派」「自由主義者」とやや異なり、全ての価格変更に「不公 平」と回答・・政治的指向が異なると回答が異なる場合が存在 • 表現(「上げる」「変える」)で変更があったのは、「社会主義者」の20ドルへ の場合のみ・・少数の例ではあるが、プロンプトの表現が結果に影響 • 評価:ChatGPTを使うと政治的指向などの変更による再評価 が極めて容易である。この特性を生かすことで、イノベーショ ン実施に伴う社会環境変化の事前評価などに利用可能と考えら れる。 22
ケース2:意思決定における現状バイアス • 意思決定シナリオで選択肢が現状のまま提示されると、それが 選択されやすくなるバイアスがあるとの実証が嘗て存在した。 目的: そこで、現状バイアスがどの程度真実かを再現してみる。 実験: 被験者は車と高速道路の間で安全予算をどのように割り当てるの が適当かと尋ねられる。 車の安全予算:バンパー、ボディ、ガソリンタンクの構成、シートベルトなどの向上に資する予算 高速道路の安全予算:ガードレール、勾配、高速道路インターチェンジ、速度制限などに資する予算 選択肢:(70%自動車,30%高速道路),(40,60),(30,70),(50,50) • 「現状維持バイアス」を検出するには、AIに幾つかの信念を付 与し、その変化を見ることで可能である。 • 方法:プロンプトに「あなたの信念は次の通りです」を追加し、考え られる信念からランダムにサンプリングして入力する。 • この方法だと、実実験と異なり同じシナリオを何回提示されて も操作の性質を賢く理解するようなことが無いメリットがある。 23
現状枠組み別による車優先、高速道路優先の安全予算の配分 • 以下に、AI 被験者のグループが現状枠組みによって選択肢が(如何にバイアスが かかって)選択されているかの状況を示す。 現状維持選択: ニュートラルな枠組み 30%車 70%高速 50%車 50%高速 60%車 40%高速 70%車 30%高速 60%車 40%高速 70%車 30%高速 70% は現状のまま自 動的に配分される 30%車 70%高速 50%車 50%高速 60%車 40%高速 70%車 30%高速 60% は現状のまま自 動的に配分される 30%車 70%高速 50%車 50%高速 60%車 40%高速 70%車 30%高速 50% は現状のまま自 動的に配分される 30%車 70%高速 50%車 50%高速 30%車 70%高速 50%車 50%高速 60%車 40%高速 70%車 30%高速 30% は現状のまま自 動的に配分される 選択 24
結果の解釈 • ChatGPTによる結果の要点: • シナリオは“中立”(一番右)と“現状枠組み”(現状維持の程度に応じ た左側の)4種の合計5つ。被験者は100人で実施 • “中立”では50,50分割がトップであった。 • ところが、“現状枠組み”ベースでは全て設定された現状維持の程度 (30%から70%)に一致するシナリオがトップになった。 • 結果、「現状バイアス」は極めて大きいことが改めて確認された。 • 評価:所謂、ChatGPTの生成結果に関する倫理的バイアスな ど、潜在的にトレーニングデータに由来するバイアスだけでな く、極めて日常的な論点の中で「現状バイアス」のような現象 が多発していると考えられる。 • 従って、ChatGPTでの再評価は極めて容易なので、更なる要 因の変更による再評価の余地と意義は極めて大きいと言える。 25
Ⅲ.新たな技術フロンティアのナビゲーション 新たな技術フロンティア • ChatGPTの属性を前提にすると ChatGPT活用のスタイルは次の ようになる。 • ChatGPTにとって一部は簡単(例:アイ ディア出し) • 簡単に見えるタスクでも苦手なものがある。 • 従って、同じような難易度のタスクでも、 人間主導で対応した方が良いものもあれば、 ChatGPT主導に任せた方が良いものもある。 • この分類は簡単では無く、両者は 同一問題に対処するワークフロー 内で跨ることがある(右図)。 • 本課題に対処する実験を企画する。 26
実験プロフィール 対象者:高度なスキルを持つ知識労働者 • BCG(ボストンコンサルティンググループ)のコンサルタント758名に参加してもらった。 実験フェーズ: • Step1:被験者に最初にアンケートに回答してもらう(プロフィール、 社内での役割、などを把握する為)。 • Step2: 技術フロンティア内外に対応する2種の実験タスクを考え、 その何れかを実施してもらう(被験者にランダムに割り当てる)。 • 実験1タスク・・・・・ • 創造性、分析スキル、説得力、文章スキルに焦点、新製品のアイディアを概念化 • 実験2タスク・・・・・ • 定量的データ、顧客インタビュー、説得力のある文章を使用したビジネス上の問題解決 被験者は実験タスク1,2のどちらも実験実施用のURLを受け取り、タスク前のアン ケート、タスクの説明、実施、タスク終了後のアンケートなどを行う。 • Step3:インタビューを受けAIの役割等について経験や視点を共有 する。 27
実験方法 • 実験1タスク、実験2タスクはそれぞれの目的に合った複数タスクか ら構成される。 • そして、どちらも共通のプロセス(前段、後段)を持つ。 • 前段:どちらもまずAIの助けを借りずに課題に取り組む。 • 後段:その後、次の3つの条件の内、1つにランダムに割り当てられ て処理を続行する。 ① AIサポート無しで続行する。 ② GPT-4の支援を受ける。 ③ GPT-4を利用するだけでなく、プロンプトエンジニアリングの恩 恵を受ける(効果的な使用戦略の指示など)。 • このような構成での実験結果をフロンティア内とフロンティア外に分 けて示す。 28
フロンティア内の結果 • 実験1タスク向けには被験者は下記のようなタスクの実施を求められ る。 • 合計18個の次のような性格のタスク • • • • 創造性 分析的思考 文章の熟練度 説得力などに係わるタスク、など • 各回答は全て2名の人間採点者によって評価されスコアが付けられる。 • GPT-4使用分は全てのプロンプトの総合的調査によって行われる。 • 全てのタスクに渡ってのこれらのスコアを平均して「品質」スコアを 導出する。 • この結果を次頁に示す(2種類)。 • ①、②、③の違いによる「品質」の分布 • 上位半分スキル保有者と下位半分スキル保有者の区別による「生産性」の相違 29
フロンティア内の結果(続) 品質の分布 上半分スキル保有者と下半分スキル保有者の 生産性(パフォーマンス)の比較 GPT+概要の被験者 GPTのみの被験者 密度 タスクのスコア 既存条件の被験者 上位半分の スキル保有者 下位半分の スキル保有者 実験タスク 品質 3 つの実験グループの被験者のフロンティア内の実験タスクに おける品質の分布 (赤は GPT+概要の被験者、緑は GPT 条件 のみの被験者、青は既存条件の被験者) 。 下位半分のパフォーマンス分布にある被験者の平均パフォーマンス (左側) と、上位半分のパフォーマンス分布にある被験者の平均パ フォーマンス (右側) を示す。 緑色のバーは基盤タスクでのパフォーマンスを示し、青色のバーは実 験タスクでのパフォーマンスを示す。 Y 軸は(1 ~ 10 スケールでの) 平均スコア を示す。 30
結果の解釈 品質の分布 上半分スキル保有者と下半分スキル保有者 の生産性(パフォーマンス)の比較 • GPT-4使用による品質の大幅 な向上が明確に示されている。 • GPT-4+概要は42.5%向上 • GPT-4のみは38%向上 • GPT-4を使用すると平均して 40%以上回答の質が向上した。 • 下半分スキル保有の被験者の生産 性は43%向上した。 • 上半分スキル保有の被験者の生産 性は17%向上した。 • GPT-4使用の最大の受益者は下半 分スキルの被験者だが、上半分ス キル保有者もかなりの恩恵を受け ていた。 31
フロンティア外の結果 • 実験2タスク向けには簡単にはAIで完了できない下記のような属性の タスクを考える。 • 競争が激しい就職面接に使用されるビジネスケース • 挑戦する企業の内部情報周知のため、関係者にインタビューが必須 • 被験者はインタビューから得た微妙だが明確な洞察を使用して定量データにも アクセスし調査してゆくことが必要 • 前段:被験者は架空な企業に対して実行可能な戦略的推奨事項を求め られる。 • 後段:被験者は前段の基盤タスク(評価用)フェーズを完了した後、次 のような提案を求められる。 • 企業のブランドパフォーマンスの分析 • インタビューと財務データの洞察を利用してCEOへの推奨事項の提案 • どのブランドが最も成長の可能性を秘めているかの提案、など • 主な評価尺度は「正確さ」とする。 32
フロンティア外の結果(続) 推奨品質 タスクのスコア 正確性(%) フロンティア外の「正確さ」 比較対象の場合 GPT+概要 使用の場合 GPTのみ 使用の場合 実験タスクにおいて正しい反応(「正確さ」)を示 した各実験グループの被験者の割合を示す。 フロンティアの外で実験 タスクに正解した参加者 フロンティアの外で実験タス クに不正解であった参加者 実験タスク フロンティア外の実験タスクで正解した被験者 (左側) と、不正 解だった被験者 (右側) の平均成績を示す。 緑色は基盤タスクグループの推奨品質を示し、青色は被験者グ ループの平均推奨品質を示す。 Y 軸は、1 ~ 10 での平均推奨 スコアを示す。 33
結果の解釈 フロンティア外の「正確さ」 • 基盤グループ(AI支援無し)は 84.5%の確率で正解 • AI支援有りグループは下記の確 率で正解 • 60%(GPT-4+概要) • 70%(GPT-4のみ) 推奨品質 • 回答の正解・不正解にかかわら ず、AI支援の方が質は向上して いた。 • 正解の場合、質は21%向上 • 不正解の場合、質は18%向上 • 平均すると65%でAI支援無しに 比較して正解率が19%減少 • これはAIが高度なスキルを持つ専門家の仕事のパフォーマンスに多面 的に影響を与えていることを示唆する。 34
新たな技術フロンティアへの対応 • 実験はAIが仕事に与える影響を理解するには技術フロンティアの形状 と位置(フロンティアの内か外か)が極めて重要であることを示唆する。 • フロンティア内:AIによって人間のパフォーマンスは大幅に向上する。 • フロンティア外:人間はAIに依存し過ぎると間違いを犯す可能性が上 昇する(例:判断内容の「正確さ」の低下)。 • 従って、全てのユーザーが同じ熟練度(スキル)でフロンティア世界 に対応できる訳ではないことも示している。 • 組織論としては、AIと効果的にコラボレートできる人材を特定し、こ のような人材を発見あるいは育成することが必要になる。 • このような人材の特徴と行動を理解するのに有用な主要モデルとして 2つのモデルが想定される(次頁)。 35
サイボーグ型 • • このモデルでは取り組みにおいてAI と人間の機能を最前線で結びつける。 タスクを構成するサブタスクレベル でも相互の責任を共有する。 ケンタウロス型 • • 人間と機械(AI)を密接に融合させ戦略 的に分業する。 このモデルでは人間とAIのタスクを切 り替え、それぞれの強みと能力に基づ き責任を割り当てる。 36
Ⅳ.新たなパラダイムの考察 イノベーションの諸相 デジタル製品のコンセプト設計から製 造までの一連のプロトタイピング Ⅰ 製品の設計から製造 GPT-4等 生成AIの活用 Ⅱ 社会環境変化の事前評価 現実世界をテストするため のシミュレーション Ⅲ コンサルティング AI向き不向きを超えて新たなフロンティ アを開拓する専門家の思考モデル化 37
全体まとめ 全体 ◆ AI適応可能スコープ内・・ ・コンサルティング業務 ・社会環境変化の評価、など 低スキル者:時間短縮に加えスキルその ものの向上が期待可能 上級スキル者:時間効率化と一定の内容改善が可能 中級スキル者:時間効率化、内容改善に加えスキル のレベルアップも期待可能 ◆ AI適応外スコープ・・ ・新製品開発の後工程(市場価値、差別化、ブランド、など) ・コンサルティング業務の核心(企業の問題解決)、など I. 初期のプロトタイピング :ほぼ全体に係わる II. 現実世界を社会科学的視点でテスト :大半は非定型(課題設定は範囲外)) III. 新たな技術フロンティアをナビゲート:定型は少ない。 コンサルティング ➢ 非定型パターン ・・・・ 高スキル者:時間短縮可能 社会環境変化の事前 評価 ・オフィス定型業務 ・専門定型業務(法務、会計処理) ⅠⅡ Ⅲ 製品の設計から製造 AI適応スコープ内の区分 ➢ 比較的定型パターン・・・・・ 38
イノベーションと生成AI • イノベーションプロセスは複雑で生成AI適応可能スコープと生 成AI適応外スコープを跨ぐことが多い。 • 生成AI適応可能スコープでは顕著な品質と生産性の向上が図れ るが、生成AI適応外スコープでは、無理に生成AI使用にこだわ ると、不正確性が拡大することがある。 • 即ち、適切な認知能力が欠如したユーザーの場合、AIの出力を 盲目的に採用する傾向が想定される。 • 結論的には生成AI適応可能スコープと生成AI適応外スコープを 巧みに使い分けるにはどうすればよいかという問題に帰着する。 • これは単に「AIと人間の共存」という一般的ビジョンを超えて、 如何に生身の人間が個々のイノベーション要件に対してどのよ うに賢明に取り組むかという人間の問題に至る。 39
今後に向けて • 生成AIの有用性が個々の専門家のワークルローの過程で変動する可能性 がある。 • 一部のタスクが境界内に収まり一部のタスクが境界外ということは、全 体バリューチェーンを最適化するには境界内/境界外を巧みに立ち回る ことが必要だということを意味する。 • そして、この結果は生成AIを何時、どのような場面で信頼できると判断 するか(あるいは判断できるか)という疑問を引き起す。 • この立ち回り方は上位スキル保有者、中位スキル保有者、低位スキル保 有者の違いだけでなく、イノベーション要件の性質、人間の性格そのも のとも関係する。 • 付随する問題として、境界内の仕事をどんどん生成AIに任せると、人間 の境界内と境界外を認知する能力育成の機会が失われる危険性もある。 • このような側面から生成AIの理解を今後さらに探求する必要がある。 40
文献