次のトークン予測の根底にある因果世界モデル:制御された環境でのGPTの調査Raanan Y. Rohekar、Yaniv Gurwicz、Sungduk Yu、Estelle Aflalo、Vasudev Lalは、生成事前訓練を受けた変圧器(GPT)モデルを行います。 GPTの注意メカニズムの因果的な解釈を導き出し、この解釈から生じる因果世界モデルを提案することにより、この質問に対処します。さらに、推論時にGPTモデルは、入力シーケンスのゼロショット因果構造学習に使用し、信頼性スコアを提示できることを提案します。経験的評価は、OthelloおよびChess Strategyゲームのセットアップとルールを使用して、制御された環境で実施されます。勝利を目的として再生された現実世界のゲームで事前に訓練されたGPTは、ランダムな法的動きのシーケンスで構成される分散式の合成データでテストされています。 GPTモデルは、因果構造が注意メカニズムに高い信頼性を持ってエンコードされる分散除外シーケンスの合法的な次の動きを生成する可能性が高いことがわかります。 GPTモデルが違法な動きを生成する場合、因果構造もキャプチャできません。
免責事項:info@kdj.com
提供される情報は取引に関するアドバイスではありません。 kdj.com は、この記事で提供される情報に基づいて行われた投資に対して一切の責任を負いません。暗号通貨は変動性が高いため、十分な調査を行った上で慎重に投資することを強くお勧めします。
このウェブサイトで使用されているコンテンツが著作権を侵害していると思われる場合は、直ちに当社 (info@kdj.com) までご連絡ください。速やかに削除させていただきます。
2025年05月25日 他の動画も公開されています