bitcoin
bitcoin

$107957.245065 USD

0.19%

ethereum
ethereum

$2508.355924 USD

-1.20%

tether
tether

$1.000227 USD

0.00%

xrp
xrp

$2.316526 USD

-0.45%

bnb
bnb

$665.985271 USD

0.37%

solana
solana

$172.342327 USD

-1.37%

usd-coin
usd-coin

$0.999629 USD

-0.02%

dogecoin
dogecoin

$0.222496 USD

-2.48%

cardano
cardano

$0.740686 USD

-1.75%

tron
tron

$0.269423 USD

-1.18%

sui
sui

$3.604351 USD

-1.17%

hyperliquid
hyperliquid

$33.793015 USD

4.53%

chainlink
chainlink

$15.353547 USD

-1.83%

avalanche
avalanche

$22.811071 USD

-1.87%

stellar
stellar

$0.285294 USD

-1.28%

加密货币视频

隔壁预测旁边的因果世界模型:在受控环境中探索GPT

2025/05/25 00:46 Statistical Machine Learning

A Causal World Model Underlying Next Token Prediction: Exploring GPT in a Controlled Environment Raanan Y. Rohekar, Yaniv Gurwicz, Sungduk Yu, Estelle Aflalo, Vasudev Lal Do generative pre-trained transformer (GPT) models, trained only to predict the next token, implicitly learn a world model from which a sequence is generated one token at a time?我们通过得出对GPT中注意机制的因果解释来解决这个问题,并提出了一种因果世界模型,该模型是由这种解释引起的。此外,我们建议将GPT模型在推理时间用于输入序列的零射击因果结构学习,并提出置信度评分。经验评估是在受控的环境中使用奥赛罗和国际象棋策略游戏的设置和规则进行的。在现实世界中预先训练的GPT是为了获胜的目的,经过分布外的合成数据测试,该数据由随机法律移动的序列组成。我们发现,GPT模型可能会为分布外序列产生法律下一步的动作,该序列在注意机制中以高信心在注意机制中编码了因果结构。在GPT模型生成非法移动的情况下,它也无法捕获任何因果结构。
视频来源:Youtube

免责声明:info@kdj.com

所提供的信息并非交易建议。根据本文提供的信息进行的任何投资,kdj.com不承担任何责任。加密货币具有高波动性,强烈建议您深入研究后,谨慎投资!

如您认为本网站上使用的内容侵犯了您的版权,请立即联系我们(info@kdj.com),我们将及时删除。

2025年05月25日 发表的其他视频