アップロード
Open user menu
アップロード一覧
公開プロフィール
ユーザー設定
利用プラン
サインアウト
ログイン
新規登録
Open main menu
プロフィールを編集する
アップロード
検索
人気
プログラミング
ビジネス
教育
ノウハウ
科学・技術
すべてのスライド
ログアウト
新規会員登録
ログイン
人気
プログラミング
ビジネス
教育
ノウハウ
科学・技術
すべてのスライド
検索
タグ #強化学習 に関するスライド
検索
【DeNA × AI Day】 自律型 AI が生み出す未来
dena ai day
DeNA_Tech
3.9K
【大規模言語モデル入門Ⅱ】12章12.1
京都大学人工知能研究会KaiRA
161
【DL輪読会】Understanding the performance gap between online and offline alignment algorithms
Deep Learning JP
1.7K
【DL輪読会】Alignment Algorithms for Diffusion Models
Deep Learning JP
2.7K
【DL輪読会】Simplifying Latent Dynamics with Softly State-Invariant World Models
Deep Learning JP
0.9K
【DL輪読会】1 π0: A Vision-Language-Action Flow Model for General Robot Control
Deep Learning JP
11.2K
【DL輪読会】PoliFormer: Scaling On-Policy RL with Transformers Results in Masterful Navigators
Deep Learning JP
1.7K
【大規模言語モデル入門】4章4.4~4.6
京都大学人工知能研究会KaiRA
1.8K
【DL輪読会】 Do Differentiable Simulators Give Better Policy Gradients?
Deep Learning JP
1.4K
【DL輪読会】LLM for Social Good
Deep Learning JP
1.4K
【DL輪読会】Behavior Generation with Latent Actions
Deep Learning JP
1.8K
【DL輪読会】Learning Reward for Robot Skills Using Large Language Models via Self-Alignment
Deep Learning JP
839
【DL輪読会】HarmonyDream: Task Harmonization Inside World Models
Deep Learning JP
6.8K
KTO: Model Alignment as Prospect Theoretic Optimization (ICML2024 )
Deep Learning JP
3.7K
簡易的rpy2を作ってみた
株式会社ホクソエム
5.1K
【ゼロから作るDeap Learning】8.4~8.6
京都大学人工知能研究会KaiRA
228
【DL輪読会】Stop Regressing: Training Value Functions via Classification for Scalable Deep RL
Deep Learning JP
2.3K
Autonomous Evaluation and Refinement of Digital Agents
Deep Learning JP
1.6K
強化学習の基本と簡単な実装
強化学習
機械学習
Komiya
2.2K
Scaling Instructable Agents Across Many Simulated Worlds (1)
Deep Learning JP
1.5K
2024_収益向上を目指した強化学習ベースの蓄電池制御手法の検討
強化学習
蓄電池
太陽光発電
小平 大輔
1.5K
【DL輪読会】PRE-TRAINING GOAL-BASED MODELS FOR SAMPLE-EFFICIENT REINFORCEMENT LEARNING
Deep Learning JP
1.5K
松尾研TRAILロボットラーニング勉強会 IsaacSimハンズオン
Makato Sato
118.1K
#強化学習
#大規模言語モデル
#RLHF
#機械学習
#深層学習
#LLM
#DPO
#自然言語処理
#世界モデル
« 前
次 »
1
2