bitcoin
bitcoin

$107957.245065 USD

0.19%

ethereum
ethereum

$2508.355924 USD

-1.20%

tether
tether

$1.000227 USD

0.00%

xrp
xrp

$2.316526 USD

-0.45%

bnb
bnb

$665.985271 USD

0.37%

solana
solana

$172.342327 USD

-1.37%

usd-coin
usd-coin

$0.999629 USD

-0.02%

dogecoin
dogecoin

$0.222496 USD

-2.48%

cardano
cardano

$0.740686 USD

-1.75%

tron
tron

$0.269423 USD

-1.18%

sui
sui

$3.604351 USD

-1.17%

hyperliquid
hyperliquid

$33.793015 USD

4.53%

chainlink
chainlink

$15.353547 USD

-1.83%

avalanche
avalanche

$22.811071 USD

-1.87%

stellar
stellar

$0.285294 USD

-1.28%

加密貨幣新聞視頻

隔壁預測旁邊的因果世界模型:在受控環境中探索GPT

2025/05/25 00:46 Statistical Machine Learning

A Causal World Model Underlying Next Token Prediction: Exploring GPT in a Controlled Environment Raanan Y. Rohekar, Yaniv Gurwicz, Sungduk Yu, Estelle Aflalo, Vasudev Lal Do generative pre-trained transformer (GPT) models, trained only to predict the next token, implicitly learn a world model from which a sequence is generated one token at a time?我們通過得出對GPT中註意機制的因果解釋來解決這個問題,並提出了一種因果世界模型,該模型是由這種解釋引起的。此外,我們建議將GPT模型在推理時間用於輸入序列的零射擊因果結構學習,並提出置信度評分。經驗評估是在受控的環境中使用奧賽羅和國際象棋策略遊戲的設置和規則進行的。在現實世界中預先訓練的GPT是為了獲勝的目的,經過分佈外的合成數據測試,該數據由隨機法律移動的序列組成。我們發現,GPT模型可能會為分佈外序列產生法律下一步的動作,該序列在註意機制中以高信心在註意機制中編碼了因果結構。在GPT模型生成非法移動的情況下,它也無法捕獲任何因果結構。
影片來源:Youtube

免責聲明:info@kdj.com

所提供的資訊並非交易建議。 kDJ.com對任何基於本文提供的資訊進行的投資不承擔任何責任。加密貨幣波動性較大,建議您充分研究後謹慎投資!

如果您認為本網站使用的內容侵犯了您的版權,請立即聯絡我們(info@kdj.com),我們將及時刪除。

2025年05月25日 其他影片發佈於