제목 : 다음 토큰 너머 (4 월 2025 년 4 월) 링크 : http://arxiv.org/abs/2504.11336v1 날짜 : 2025 년 4 월 요약 : 미래 정보를 대표하는 'LookaheAd'토큰을 포함시키기 위해 교육 데이터를 재정렬하여 교육 데이터를 재 배열하여 언어 모델을 개선하는 데이터 중심 방법 인 Trelawney를 소개합니다. 주요 주제 : - 언어 모델 - 다음 토큰 예측 - 데이터 확대 - 교사 강제 - 계획 - 계획 - 추론 - 스토리 생성 - 룩보드 토큰 - 트레일 니 챕터 : 00:00- 다음 토큰 예측의 문제 00:17- 목표 지향적 사고 00:43- Trelawney 소개 01:17- Deep -view 02. NTP 02:57- Trelawney가 작동하는 방법 03:34- Trelawney의 이점 03:51- 교사 강제 제한 04:38- 영리한 Hans 속임수 05:45 -The Indeciberable Token 문제 06:26- 노출 바이어스 07:11- 정보 흐름의 비선형 특성 07:38- Trelawney : Key Augmentation Augmentation Augmentation 08:038- 08:26- 올바른 청크 선택의 중요성 08:58- 의사 결정 지점과 시퀀스 사이의 거리 09:33- 위치 정보 10:12- 기존 지식 활용 10:41- 증강 시퀀스와의 훈련 11:24- 손실 기능 조정 11:47- Token 12:09- Trelawney 12:231- Trelawney 12:231- Trelawneys와의 비판 12:31- trelawney 12:231- 도메인 13:58- 스타 크래프트 작업 14:23 -NTP 투쟁 14:44- v1 15:11 제외 - 표준 자동 회귀 세대 16:00- 알고리즘 추론 16:39- 규칙 기반 vs 랜덤 선택 17:16- 자연어 계획 17:50- 평가 18:35- Perplex 19:11- Big Picture 19:11:2011:11:11:11:11.