生成AIは社会(とそれを研究する社会科学)にどのような影響を与えるか？

2.6K Views

April 27, 24

#chatgpt #生成ai #社会科学 #社会科学のためのai #aiの社会科学 #生成AI #ChatGPT #AI倫理 #研究方法

スライド概要

生成AI関係は技術的進歩に関する話題は勿論のこと、並行して社会的変化も起きて来ている。これを示す例として、生成AI関係の応用関連論文をテーマ別に分類した研究がある。これによると、「社会科学」の比率は20%と非常に高く、2位になっている（因みに1位は医療）。社会全体への包括的影響を社会科学的に探索するニーズが急激に高まっていることを示していると思われる。このようなことから、本稿は「社会科学系」の論文がどんな内容か？何故多いのか？を紐解いてみることにする。

高橋浩

@5451263343

スライド一覧

定年まで35年間あるIT企業に勤めていました。その後、大学教員を5年。定年になって、非常勤講師を少々と、ある標準化機関の顧問。そこも定年になって数年前にB-frontier研究所を立ち上げました。この名前で、IT関係の英語論文（経営学的視点のもの）をダウンロードし、その紹介と自分で考えた内容を取り交ぜて情報公開しています。幾つかの学会で学会発表なども。昔、ITバブル崩壊の直前、ダイヤモンド社からIT革命本「デジタル融合市場」を出版したこともあります。こんな経験が今に続く情報発信の原点です。

またはPlayer版

埋め込む »CMSなどでJSが使えない場合

ダウンロード

関連スライド

生成AIからエージェントAIへの移行の課題と展望

aiエージェントエージェントai 自律性ガバナンスエージェント介入リスク

高橋浩 9.2K

医療分野における大規模言語モデルの調査

医療医療llm 生成ai 医師免許試験デジタル化

高橋浩 5.6K

医療へのChatGPT & AIの適用

chatgpt イノベーションヘルスケア新サービス開発組織変革

高橋浩 5.1K

ChatGPT 機会課題影響

大規模言語モデル chatgpt 生成ai 商業化の壁 llm

高橋浩 5K

GPTは労働市場にどのような影響を与えるか

chatgpt 生成aiツール生産性向上生成aiの今後 llm

高橋浩 3.9K

価値創造と価値獲得

value creation value capture オープンイノベーションデジタル化 b2b業界価値創造と価値獲得のバランス

高橋浩 3.8K

各ページのテキスト

生成AIは社会(とそれを研究する社会科学) にどのような影響を与えるか？ B-frontier 研究所高橋浩 1

自己紹介 - B-frontier研究所代表高橋浩 • 略歴： • 元富士通 • 元宮城大学教授 • 元北陸先端科学技術大学院大学非常勤講師 • 資格：博士(学術)(経営工学) • 趣味/関心： • 温泉巡り • 英語論文の翻訳 • それらに考察を加えて情報公開 • 主旨：“ビジネス(B)の未開拓地を研究する” 著書：「デジタル融合市場」ダイヤモンド社(2000),等 • SNS： hiroshi.takahashi.9693（facebook) ＠httakaha（Twitter）

目的 • ChatGPT 絡みの研究で社会科学に関する論文の比率は非常に高い(20%で第2位)。 • これらの論文でどのようなテーマが扱われているかを知ることは社会への影響を考える重要な指針になる。 • そこで、その内容の探索を本稿の目的とする。出典:SS Sohail et al., Decoding ChatGPT: A taxonomy of existing research, current challenges, and possible future directions, 2023

目次 I. はじめに II. 社会科学のためのAI III. AIの社会科学 IV. 人間とAIの連携 i. 事例１ ii. 事例２ iii. 人間とAIの適切な連携に向けて 4

Ⅰ.はじめに ChatGPTによる社会科学の機会 • 生成AIは重大な欠陥があるにも関わらず（あるいはそれだからこそ）状況によっては人間に成りすますと考えることができる。 • 生成AIが人間に成りすました場合、明らかに害を及ぼす可能性があるが、同じ機能が社会科学者にとって研究に役立つ可能性もある(下記）。 • 社会科学の実験（投票行動、世論調査、採用判断、‥）で人間の回答者の特定の行動や感情を生成AIを使って成りすます、など • 大規模な人間募集が必要な実験の場合、生成AI活用でコスト削減、倫理問題（プライバシーなど）を上手く回避、など • 生成AIは潜在的に無限の時間対応が可能なことも便利である。 5

新たな機会に向けた質問リストの例社会科学関係の質問質問１：生成AIは仮想的な研究アシスタントが可能か？質問２：生成AIは社会科学論文レビューが可能か？社会一般に係わる質問質問３：生成AIは人間の偏見を明らかにするか？質問４：生成AIがバイアスを示す傾向は「バグ」と考えるべきか？質問５：生成AIは誤った情報を拡散させるか？ 6

質問１：生成AIは仮想的な研究アシスタントが可能か？ • 米国の選挙で選ばれた議員の公式声明を分析することで、そのイデオロギーを正確に分類することができたとの報告がある。 • 信頼性を正確にコード化し、タグ付け訓練を受けたAmazon Mechanical Turk労働者より優れたパフォーマンスが発揮できたとの報告がある。 • 評価：仮想研究アシストとして機能する可能性はあるが、今の所、その精度やタスクの幅の広さ、効率は人間より低い。質問２：生成AIは社会科学論文レビューが可能か？ • 現状：ChatGPT以前に文献のネットワーク化はかなり進んでいる(例： Web of Science, SCOPUS、など)。 • 将来への期待：生成AIによって科学地図作成能力が拡張されるとの期待はあるが、現在はまだ不明 • 最近の試行：ほとんど失敗している(失敗例：MetaのGaoptica、Google のBARD、など） • 失敗の背景：生成AIは学術文献を要約できるほど信頼のできるものではなかった。 • 当面の可能性：生成AIは直ぐに活用できるほど有能な論文アドバイザーではないが、一緒に考えるツールとしては期待できる。 7

質問３：生成AIは人間の偏見を明らかにするか？ • インターネット上には人間によって作成された大量の偏見に満ちた情報が蔓延している。 • これらの情報をトレーニングに使用している生成AIがバイアスを持つのは謂わば当然である。 • これを逆手に取って生成AIをバイアスの規模と方向性を評価する一つの方法として利用する取組みがある(例：中絶, 銃規制, 等に関する回答の分析）。質問４：生成AIがバイアスを示す傾向は「バグ」と考えるべきか？ • 偏見まみれのデータをトレーニングに使用している以上、バイアスは当然なので、生成AIをバイアスの「リバースエンジニアリング」として役立てることは可能かもしれない。 • しかし、現実の生成AIがトレーニングプロセスやRLHF(人間を利用した強化学習)プロセスを非公開にしているので、簡単な作業ではない。 • RLHFプロセスなどによるガードレールの設定は生成AIの安全性を向上させているが、社会学者が研究目的でバイアスを利用しよう、あるいはバイアスの傾向を探ろうとする場合には目的を妨げる可能性がある。 8

質問５：生成AIは誤った情報を拡散させるか？ • 悪意のある攻撃者が生成AIを使って誤った情報を拡散させるリスクはある。 • 短期的にはさまざまな設定によって対抗できる可能性はあるが、長期的には潜在的問題を引き起こす可能性が高い。 • 例：学術誌や資金提供機関は生成AIによって作成された低品質の「ジャンクサイエンス」によって圧倒されるかもしれない。 • このような攻撃に対し、データに「ウォーターマーク」など防御の手段も登場しているが、あらゆる生成AIでの実装は困難か？ • これらへの対応のため、規制が奨励される可能性があるが万能とは言えない。 • 既に生成AIのオープンソース化は進んでおり、膨大な数の小規模LLM が登場する方向にある。 9

10.

以上のような事例から社会科学とAIの関係性を考えると・・・ • 現在、社会は生成AIがもたらす重大な影響を目の当たりにしている。 • ChatGPT等の生成AIは自然言語を理解し複雑なタスクを処理する強力な能力で、投資家、消費者、企業の想像力を捉え、チャンス活用に向けた熱情をかきたてている。 • 生成AIの進化は速く、潜在的影響は深刻であるため、その影響を理解するには学際的レンズが必要である。 • そのレンズの中核はコンピュータを活用した社会科学であろう。 • このような背景から社会科学に係わる論文比率が高いと推定する。 • そこで、この問題に対して次の2側面に焦点を当てた検討を試みる。 ◆社会科学研究者のAI活用に焦点を当てた「社会科学のためのAI」 ◆AIの知識レベルや特性を社会科学分野毎に取り上げた「AIの社会科学」 10

11.

「社会科学のためのAI」と「AIの社会科学」のビジョン研究の目的 • • 費用対効果が高く、迅速かつ倫理的リスクを回避して、人間社会の法則を研究 AI自体の行動法則、特に人間社会の法則と異なる側面に焦点を当てて調査することで、人間社会の法則を研究 11

12.

ビジョンの解説 • 生成AIの優れた機能とパフォーマンスは社会科学研究全般に向けて効果的ツールとして機能するはずである。 • そのような場合、研究者が適切なツールを選択するガイドラインを提供するのは有益である。・・このような方向性が「社会科学のためのAI」 • 一方、今日のAIは、既にAIエージェント自身が社会的存在として調査の対象になり始めている。 • 特に生成AIは、人間と同等あるいはそれ以上の認知能力、論理的推論、言語能力を示しており、このようなAIエージェントによって構成されるコミュニティは人間社会と同様の創造的行動を示している。 • そこで、AI開発を社会ニーズや人間の価値観の洞察の指針として提供できる可能性がある。・・このような方向性が「AIの社会科学」 12

13.

社会科学とAIの交差点の整理 13

14.

Ⅱ.社会科学のためのAI 「社会科学のためのAI」の概要図 • 下図のように、生成AIは社会科学研究のあらゆる段階において適用できる多目的ツールとして機能できる可能性がある。仮説の生成実験ｱｼｽﾀﾝﾄ実験ｼﾐｭﾚｰｼｮﾝｻﾝﾌﾟﾘﾝｸﾞ測定分析データ収集ﾃｷｽﾄ分析ﾃｷｽﾄ生成ﾃﾞｰﾀ分析 14

15.

仮説の生成定義 • 無関係な社会科学的概念間に意味のある暗黙の関連性を掘り起こす。 • 文献量が拡大するに連れ確実に仮説を迅速で効率的に生成する方法も模索文献ﾚ • ChatGPTを使用して系統的レビューの質問方式を洗練化させ、従来の最先端自動質問方式より優れた結果を出したとの報告がある。ﾋﾞｭｰ • ChatGPTを使用して関連論文の要約を言い換え100回以上引用された文献の文献レビュー一覧を自動生成したとの報告がある。仮説の • GPT-4を使用して科学的仮説を生成し、エラー率は高いものの興味深い検証可能な仮説を提供できたと結論付けた報告がある。提案 • GPT-3を利用して心理学的仮説を生成し、50人の心理学専門家を参加させた評価で人間による提案と遜色ないレベルに達しているとの報告がある。結論 • 現在は仮説生成の実現可能性と有効性を探る段階にあるが、特に利点は優れたパフォーマンスと評価されている。 • 但し、「捏造または不正確な情報」や「プロンプトに対する高い感度」などの課題は残している。 15

16.

仮説の検証：実験研究(1) 定義 • 提案された仮説を支持まはた反駁するための証拠を提供すること • 主にAIと相性の良い下記２つの定量的手法を扱う。実験 • 通常研究者が行う単純だが労働集約的なタスクを自動化することを指すｱｼｽﾀﾝﾄ • 実験条件の妥当性と比較可能性を高め、現実の外部情報利用の必要が無いので個人のプライバシーを保証しやすいメリットがある。実験ｼﾐｭ • 現実世界では調査が難しい複雑なシステムの動作を調査、最適化、および予測するプラットフォームを設計して実行することを指す。ﾚｰｼｮﾝ • 古典的な行動心理学の実験で得られた結果をGPT-3を使用して定性的に再実行し、加えてより細かな付随結果を導いたとの報告がある。結論 • 生成AIによる実験研究は人間の行動の信頼できる代理人としての機能を担えることに注目が集まっている。 • 現在はまだ設計が粗い段階にあるが、更なる改善が保証されている分野である。 16

17.

仮説の検証：調査研究(２) 定義 • 提案された仮説を支持まはた反駁するための証拠を提供することｻﾝﾌﾟﾘﾝｸﾞ • 特定の人間のサブグループの代理として機能し、トレーニングデータベースのデータを研究のサンプルとして直接利用する。 • ChatGPTによって生成された平均スコアが米国のベースライン調査の平均とほぼ一致したとの報告がある。測定 • 有効で信頼できる応答を引き出すための質問設計に焦点が当てられている。 • 生成AIが信頼性の一般的方法で起こり得る精度に達したとの報告がある。分析 • ChatGPTを利用したメンタルヘルス分析で解釈可能性を向上させたとの報告がある。結論 • 但し、生成AIは数値分析に欠点があるため、分析分野への本格的導入は行われていない。 17

18.

仮説の検証：非反応性研究(３) 定義 • 提案された仮説を支持まはた反駁するための証拠を提供すること • 参加者が自分の情報が研究の一部であることに気づかない研究方法である。ｺﾝﾃﾝﾂ 1. 感情分析：テキスト内の喜び、怒り、悲しみなどの特定分析 2. スタンス検出：テキスト内で表現されている著者・話者の政治的、社会的、文化的スタンスの特定 3. ヘイトスピーチ検出：ヘイトスピーチが含まれている単語、フレーズ、文章などの特定 4. 誤った情報の検出：誤った情報が含まれている単語、フレーズ、文章などの特定既存統 • 公的機関、組織、個人から提供されている既存の統計データに基づいて構築計分析されている研究手法であり様々な社会現象や問題を対象としている。結論 • 生成AIは多くの社会科学タスク向けに微調整することで相応のパフォーマンスを達成できるメリットがある。 • しかし、まだかなりの非反応性タスクをサポートするための課題が残されている。 18

19.

Ⅲ.AIの社会科学「AIの社会科学」の概要図 • 生成AIを使用する社会科学の研究の内、特に従来の人間行動との違いに重点を置き、AIエージェント自身の行動パターンを調査する。 XX 人間のXX AIのXX 心理学人間の心理現象、意識、行動を研究する。研究範囲は意識、感覚、知覚、認知、感情、性格、行動、人間関係など幅広い分野に及ぶ。 AI エージェントの性格、意識、能力、認知などを研究する。社会学ミクロな社会学的レベルの制度や人間関係から、複数の異なる AI エージェント間のマクロな社会学的レベルの社会システムや構造相互作用と社会的行動を研究する。に至るまで、人間の社会生活、集団、社会を研究する。経済学商品とサービスの生産、流通、消費を研究する。経済主体としての AI エージェントの行動と相互作用を研究する。社会的価値観の権威ある配分を研究する。イデオロギー、所属政党、政治的思慮深さなど、AI エージェントが示す政治的行動や現象を研究する。構文、意味論、語句学、音声学、音韻論、語用論などを含む言語を研究する。 AI エージェントの言語使用パターンを研究し、人間の言語使用と比較する。政治学言語学 19

20.

AIの心理学定義 • AIエージェントの心と行動の科学的研究【エピソード】嘗てGoogleの技術者が「生成AI LaMDAは知覚を持ち人間のように思考し推論できるようになった」と主張し解雇された。個性 • 個性探索データセットを開発し、実際にそれを使って生成AIに個性を発見したとの報告がある。 • 工夫したアンケートを活用してGPT-3を分析し、「GPT-3は若い女性である」と報告した研究がある。 • 特定手法による評価でGPT-3、InstructGPT、FLANーT5はいずれも「人間よりも暗い」と報告した研究がある。認知 • 驚くほど強力な抽象パターン誘導能力を発見したとの報告がある。 • 生成AIは社会参加者の意図や反応を理解できず特定状態の精神状況を推測できないとの指摘があったが、生成AIのレベルアップで改善されたとされる。結論 • 個性は人間のような一貫性がなく、安定していない面があるが、文化的視点と重ね合わせられている面があるとの指摘もある。 • 認知では人間の能力と同等あるいはそれを超えることが分かっているが、人間の認知とは異なるモードで、それを説明する仮説は未だ登場していない。 20

21.

AIの社会学定義 • (AIの進歩から生じる社会的変化ではなく)AIエージェント自身に焦点を当てた科学的研究社会的偏見 • ジェンダーバイアス研究(GPT-３ベース)で、女性は「家族や外見」に関連づけられることが多く、男性よりも「力が弱い」と描かれることを発見したとの報告がある。社会的行動 • ある小さな町に25人のAIエージェントが暮らし、エージェント同士で雑談したり、朝食を作ったり、パーティー招待のスケジュールを立てるなどの社会的行動を実現させたとの報告がある (Park, 2023)。結論 • バイアスの問題は研究途上で暗黙の認知バイアスなど未解決の問題が残されている。 • AIエージェント専用のコミュニティ環境における研究は限られている。 AIエージェントは、インタラクティブなアプリケーションにおける人間の行動を模倣したものである。この作品では、特定のサンドボックス環境に 25 人のエージェントを配置しAIエージェントを実証している。ユーザーは、AIエージェントが一日の計画を立て、ニュースを共有し、人間関係を築き、グループ活動を調整するのを観察し、介入することができる。 21

22.

AIの経済学定義 • 経済主体としてのAIエージェントの行動の科学的研究専門知識 • ChatGPTは大学経済学理解度テストで高得点を取り、金融リテラシーテストでも高レベルに達したとの報告がある。 • 運用管理でもChatGPTはMBAコアコースで高得点を獲得し、非計算問題が得意だが、単純な計算やプロセス分析が上手く機能せず会計が苦手とみなされている。ﾐｸﾛ経済学 • 6つの生成AIを使用して古典的行動経済学の実験を再現できたとの報告がある。 • 2つの生成AIに交渉ゲームでそれぞれ買い手と売り手の役割を演じさせた結果、適切に取引価格を向上させられたとの報告がある。結論 • 専門知識ではAIエージェントは経済学の非計算分野では人間の専門家と同等あるいはそれ以上と言える。 • 但し、殆どの研究はOpenAIのGPTシリーズでのテストに基づき、従来の古典的経済学の文献に基づきトレーニングされているため、これを超えた環境に対応可能かどうかは不明である。 22

23.

AIの政治学定義/傾向 • 経済主体が政治参加者として示す政治的行動や現象の科学的研究 • 現在は主にAIエージェントの政治的傾向や政治的慎重さに焦点を当てている。政治的傾向 • ChatGPTは左派リベラル進歩派に傾いているとする研究が複数ある。 • 但し、共和党と民主党の政治傾向のある2つのコミュニティからのツィートで生成AIを微調整するとそれぞれのコミュニティと世界観を示したとの報告もある。 • そこで、トレーニングデータの政治的バイアスが生成AIにどのような影響を与えているかが調査されている。結論 • AIの政治学の研究は初期段階にある。 • 但し、ChatGPTの政治的傾向が左派であることは明確になっているので、生成AIが公平/公正を目指す上で、このようなバイアスが起きる背景/要因やトレーニングデータの多様性に対する姿勢が問題になる。 • そうでないと、政治および選挙に対する悪影響を与える可能性がある。 23

24.

AIの言語学定義/傾向 • 構文、意味論、形態論、音声学、音韻論、語用論などAIエージェントの言語使用パターンの科学的研究 • 多様な研究が存在するので、ここではAIエージェントと人間の間の一貫性と相互作用に焦点を当てる。言語学的 • ChatGPTは人間と同様に馴染みのない単語を形式に基づいて異なる意味に関連付けたり、ノイズなどによって棄損した可能性のある不合理傾向な文章を再解釈したりできることを発見したとの報告がある。 • このように、生成AIは人間と同様に接辞に基づいて馴染みのない単語を理解することができるとの報告がある。結論 • 生成AIの言語的機能は多様な検討が行われており、より言語学の知見と組み合わせることで、更に生成AIの内部メカニズムをより深く理解できる可能性がある。 24

25.

Ⅳ.人間とAIの連携 • 最終目標を「人間とAIの適切な連携」として、そのための知見獲得を目指す社会科学研究を２件紹介する。 ⅰ. 事例1 人間生成ソリューション vs AI生成ソリューション問題意識 • 将来の人間の問題解決能力の役割はどのように位置づけられるか？目標 • 生成AIと人間の新規性と価値創造の特性を比較 • この知見獲得により、将来の問題解決に向けた人間とAIの棲み分け、あるいは統合アプローチに向けた示唆を得ることを目指す。手段 • 一定のプラットフォームを構築することで、人間による仮説生成と生成AIによる仮説生成を実現する。 • 双方の仮説をマージする。その上で評価者を別途オンラインで募集し、彼等による仮説の由来を伏せたオンライン評価を実施する。 • そして、その結果を分析することで知見を抽出する。 25

26.

実施プロジェクトの詳細対象 • 「持続可能な循環経済におけるビジネスチャンスにはどのような可能性があるか？」を設問とする。【循環経済は環境科学、経済学、デザイン、工学に跨り「AIの社会科学」における多様な分野と相関している】研究ﾌﾟ • 研究推進元(ハーバード大学研究班)はContinuum Lab（AI企業）、ﾗｯﾄﾌｫｰﾑ Freelancer.com(オンラインマーケットプレイス）と提携してプラットフォームを形成し、人間による仮説生成の募集、AIによる仮説生成を行う。仮説 • 人間生成の仮説数：応募310件(期間：2023.1.30~5.15)⇒選別125件 • AI生成仮説数：730件(ﾏﾙﾁｲﾝｽﾀﾝｽ、ｼﾝｸﾞﾙｲﾝｽﾀﾝｽの2種を半分ずつ) • 生成AIが生成する仮説の多様性減少を出来るだけ回避するための施策実施 • ランダムに234件(人間生成仮説54件、AI生成仮説180件）を選択方法 • 仮説の評価者をオンライン(Prolific.org)で募集：300名 • 彼等の評価結果（評価尺度は新規性と環境/財務価値)を分析 26

27.

結果１：人間ソリューションと AI ソリューションの比較 • 人間ソリューションとAIソリューションの新規性と価値を平均スコア（横軸）と密度（縦軸）の分布で示す。結果 • 人間ソリューションはAIソリューションと比較して新規性の右裾が高く、価値の左裾が低い。新規性、価値のスコアはソリューションに割り当てられた全評価者のスコアの平均で計算 27

28.

結果２：2種ソリューションとプロンプト構成(マルチ、シングル)の比較 • (人間, AI)2種のソリューションの新規性と価値をプロンプト構成 (マルチ, シングル)を含めて示す。結果 • シングルAIソリューションの新規性の方がマルチAIソリューションの新規性より高い。 • シングルAIソリューションと人間ソリューションの新規性は同等 • 価値は人間、シングルAI、マルチ AIで差が無い。マルチインスタンス：各インスタンスが同じプロンプトで独立してソリューションを生成シングルインスタンス：複数ソリューションを一度に一つづつ連続して生成（連続する応答の場合は以前の応答から区別しようとする意図が働く） 28

29.

主な結果新規性 • AIソリューションは人間ソリューションと比較して新規性の評価が低い。 • 中でもAIソリューション(マルチインスタンス）の新規性は人間ソリューションと比較して特に低い。 • 但し、AIソリューション(シングルインスタンス)の新規性は人間ソリューションと比較して同等レベル価値 • AIソリューションは人間ソリューションより価値が高い。 • しかし、人間とAI間の価値の差は小さくAI価値の利点は弱い。 • AIのマルチインスタンス、シングルインスタンス間にも差がない。まとめ • AIは人間よりもある程度価値のあるアイディアを生成するが、新規性においては人間はAIを超えるアイディアを生成する。 29

30.

ⅱ.事例２新たな技術フロンティアのナビゲーション新たな技術フロンティア • ChatGPTにとって一部は簡単だが(例：アイディア出し）、苦手なものもある。 • 従って、同じような難易度のタスクでも、人間主導で対応した方が良いものもあれば、ChatGPT主導に任せた方が良いものもある。内外 • この分類は簡単では無い。両者は同一問題に対処するワークフロー内で跨ることがある。 • 本課題に対処する実験を企画する。 30

31.

実施プロジェクトの詳細対象者 • 高度なスキルを持つ知識労働者：BCGのコンサルタント758名実験 • ｽﾃｯﾌﾟ1:被験者は最初にアンケートに回答(ﾌﾟﾛﾌｨｰﾙ, 社内の役割他) ﾌｪｰｽﾞ • ｽﾃｯﾌﾟ2: 内外に対応する2種の実験タスクを設定し作業実施 • 実験１タスク・創造性、分析スキル、説得力、文章スキルに焦点、新製品のアイディアを概念化内部向けﾀｽｸ • 実験２タスク・定量的データ、顧客インタビュー、説得力のある文章を使用したビジネス上の問題解決外部向けﾀｽｸ被験者は実験タスク1,2のどちらも実験実施用のURLを受け取り、タスク前のアンケート、タスクの説明、実施、タスク終了後のアンケート対応を実施 • ｽﾃｯﾌﾟ3:インタビューを受けAIの役割等について経験や視点を共有実験 • 実験1, 実験2タスクどちらも共通プロセス(前段、後段)を持つ。 • 前段：どちらもまずAIの助けを借りずに課題に取り組む。方法 • 後段：その後, 次の３条件の内, ランダムに割り当てられた１処理を続行。 • AIサポート無しで続行 • GPT-4の支援を受ける。 • GPT-4を利用するだけでなく、プロンプトエンジニアリングの恩恵を受ける(効果的な使用戦略の指示など） 31

32.

フロンティア内の結果 • 実験1タスク向けには被験者は下記のようなタスクの実施を求められる。 • 合計18個の次のような性格のタスク • • • • 創造性分析的思考文章の熟練度説得力などに係わるタスク、など • 各回答は全て2名の人間採点者によって評価されスコアが付けられる。 • GPT-4使用分は全てのプロンプトの総合的調査によって行われる。 • 全てのタスクに渡ってのこれらのスコアを平均して「品質」スコアを導出する。 • この結果を次頁に示す。 32

33.

フロンティア内の結果(続) 品質の分布 GPT+概要の被験者 GPTのみの被験者品質の分布既存条件の被験者 • GPT-4使用による品質の大幅な向上が明確に示されている。密度 • GPT-4＋概要は42.5%向上 • GPT-4のみは38%向上 • GPT-4を使用すると平均して 40%以上回答の質が向上した。品質 3 つの実験グループの被験者のフロンティア内の実験タスクにおける品質の分布 (赤は GPT+概要の被験者、緑は GPT のみの被験者、青は既存条件の被験者) 。 33

34.

フロンティア外の結果 • 実験2タスク向けに簡単にはAIで完了できない以下のような属性のタスクを考える。 • 競争が激しい就職面接に使用されるビジネスケース • 挑戦する企業の内部情報周知のため、関係者にインタビューが必須 • 被験者はインタビューから得た微妙だが明確な洞察を使用して定量データにもアクセスし調査してゆくことが必要 • 前段：被験者は架空な企業に対して実行可能な戦略的推奨事項を求められる。 • 後段：被験者は前段の基盤タスク(評価用)フェーズを完了した後、次のような提案を求められる。 • 企業のブランドパフォーマンスの分析 • インタビューと財務データの洞察を利用してCEOへの推奨事項の提案 • どのブランドが最も成長の可能性を秘めているかの提案、など • 主な評価尺度は「正確さ」とする。 34

35.

フロンティア外の結果(続) フロンティア外の「正確さ」 • 基盤グループ(AI支援無し)は 84.5%の確率で正解 • AI支援有りグループは下記の確率で正解 • 60%(GPT-4＋概要) • 70%(GPT-4のみ) • 平均すると65%でAI支援無しに比較して正解率が19%減少 35

36.

主な結果 • イノベーションプロセスは複雑で生成AI適応内スコープと生成AI適応外スコープを跨ぐことは多い。品質と • その際、生成AI適応外スコープでは、無理に生成AI使用に正確性こだわると、不正確性が拡大することがある。 • 適切な認知能力が欠如したユーザーの場合、AIの出力を盲目的に採用する傾向も想定される（今回の結果の原因だったかもしれない)。今後に • 結論的には生成AI適応内スコープと生成AI適応外スコープを向けて巧みに使い分けるにはどうすればよいかという問題になる。 • これは単に「AIと人間の共存」という一般的ビジョンを超えて、如何に生身の人間が個々のイノベーション要件に対してどのように賢明に取り組むべきかという問題に至る。 36

37.

ⅲ. 人間とAIの適切な連携に向けて • 以上の２事例を踏まえAIに有利な領域と人間に有利な領域を図示する。 AI領域と人間領域の区分と変化の方向性人間領域新規性 ⇒ 特高異度化化ソリューション生成AIの進歩プロンプトの洗練化価値 AI領域正確性品質 AI領域と人間領域の緩い境界線 (技術フロンティア)作業プロセス ⇒ 複雑化 37

38.

「人間とAIの適切な連携」に向けた分析の視点 • 今後の分析の視点は次の３つがある。 ① 対象(社会) • 循環経済(事例1)に類する他の対象物を研究することでを知り、 ①は • 「簡単にAIで完了できないタスク」(事例2)のような特定業務を見出すことで Ⅱ. 社会科学のためのAI が対応する。 ② AIを知り、 • 各種の社会科学的知見(心理学など)でAIエージェント自身の特性を明確化することで ②は Ⅲ. AIの社会科学が対応する。 ③ 自ら(人間) • AIと差別化しうる人間の本質的特性を明らかにするを知る。ことで 38

39.

“③ 自ら(人間)を知るための枠組み”への対応 • 新規性、正確性に加え、注意力、創発力などの人間の特性を新しい環境で再評価する必要がある。問題意識 • 本質的に人間のどの側面(直観に対する本能的能力、領域固有の専門知識、文脈の微妙な理解、など)がAI が進歩し続けても人間にとって明確な優位性であり続けるのかを研究する必要がある。目標 • 生成AIに対して相対的に優位性を保ち続け得る属性の明確化手段/思 • 例：人間は“時間の余裕”が保証されれば、其れが直に創造的な気づきを増大させることにつながるのか？考実験 39

40.

これらの取組みによって想定されるまとめ • まとめの例を２つ示す。例１：人間とAIのアイディア生成の未来 • 大量の価値あるソリューションを生成する際、AIの速度と生産性は人間の比ではない。 • とはいえ、非常に斬新なアイディアの追求では人間の創意工夫は依然としてAIには代替できない。 • そこで、人間は主に新しいアイディア出力に集中し、AIは価値あるソリューションの生成を担うとの線引きの可能性が発生する。 • この分業は想像力豊かな思考を呼び起こし、人間の認知力向上や身体的負担軽減を可能にする多くの余裕時間の確保などの必要性を示唆する。 40

41.

例２：生成AIの進化する能力と人間の創意工夫の役割 • 今回の結果はGPT-4に基づく結果で、特定の生成AIに依存している。 • 従って、人間とAIとの連携の具体化は時間とともに変化する可能性、他の生成AIの可能性を考慮する必要がある。 • 特にシングルインスタンス構成のプロンプトは統計的に稀なアイディアを生み出す可能性があることを示した。 • 今後、プロンプトの更なる洗練化でより斬新なアイディアを生成できる可能性がある。 • 複数生成AIの継続的進歩は、本質的に人間は人間のどの側面が明確な利点であり続けるのかをより深く研究する必要性を強く示唆する。 41

42.

全体まとめ • 生成AIは社会とそれを研究する社会科学に多大な影響を与えている。 • 関連論文は社会を研究する方法への影響だけでなく、生成AI自身の特性に関するものも含めて極めて幅が広い。 • この背景に、生成AIが“人間になりすまし得る”という、従来には無い特性を持っていることがある。 • このような特性を持つ生成AIの社会への影響はあらゆる分野に浸透してくる。そこで、この影響を理解するための研究は枚挙にいとまがなく重要性は増大する。 • このような、従来とは異なる認識で多様な分野を多様な切り口で研究を深めてゆく必要がある。これが将来の「人間とAIの共存や連携」に重要になってくる。 42

43.

経営論を考える上での考慮事項 • 生成AIは欠陥があるにしても“人間に成りすまし得る”点に大きな特徴がある。 • その結果、個々の専門家が担当するワークフローで、一部タスクは生成 AI境界内、一部タスクは生成AI境界外になる状況が発生する。 • この状況で全体バリューチェーンを最適化するには、境界内/境界外を巧みに立ち回る経営的戦略が必要になる。 • この戦略は生成AIを何時、どのような場面で信頼できると判断するか (あるいは判断できるか）という課題を引き起す。 • この戦略は、生成AIを一種の疑似人間(エージェント)と見做している以上、生成AIと如何に連携するかの高度スキル(AIリテラシー)が問われる。 • このようなAIリテラシースキルの上位スキル保有者、中位スキル保有者、低位スキル保有者で、当然、戦略には違いが生じる。 • それとともに、イノベーション要件の性質、人間の性格も関係する複雑な状況が登場する。 43

44.

新たな経営論の構築に向けて • 新たな経営論を考える際には、次のようなことが示唆される。 1. 何を人間主導、何をAI主導とするかの判断基準や考え方の整理(単に生成 AIの“幻覚”をあげつらうのでなく、生成AI、人間を同水準で見た場合の整理） 2. 適切なバランスを確保するために人間とAIの間に存在する共通部分を活用するためのアイディア(生成AIベースのプラットフォーム理論の再構築、など） 3. 複数の課題を一貫したプロセスとして実施するような、現実的取り組みに対応した、AI、人間合同の作業プロセス論の構築 4. 生成AIの急速な変化を経営や組織変革に取込み可能な柔軟な組織論と、このような状況に対応可能な新たなダイナミックケイパビリティ論の構築 5. 組織内に人間とAIエージェントが共存する状況に対応するリソースベーストビュー理論やコースの定理の見直し 6. 新たな環境への対応で旗振りする人材の発掘や育成法、など 44

45.

文献