🛠️ 최신 변경 사항: • using_no_nccl_support에 대한 새로운 스타일 Starlark bool_flag 지원 • 디버그 시간을 제공하기 위해 PjRtStreamExecutorRawBuffer::ReadDynamicShape의 임시 롤백. • PjRtBuffer TOKEN 복사 테스트를 추가하고 토큰 처리를 수정합니다. • PreprocessHlos 및 ReshardAsWindowedInput의 pad-]슬라이스 병합 문제를 수정했습니다. • 'CommonPjRtBuffer::GetScopedRawBuffer' API를 추가합니다. • 상태를 반환할 수 있는 setter를 사용하기 위해 SetValueWithStatus 루틴을 추가했습니다. • tsl::AsyncValue 대신 PjRtDeviceEventRef를 사용하도록 전송 API를 변경합니다. • [pallas:triton] 기본적으로 Pallas Triton 커널을 PTX로 컴파일합니다. • 예상하지 못한 곳에 'HloShardingV3' 검사를 추가하고 로그 메시지를 업데이트하여 Shardy 팀에 문의하세요. • Cuda13 빌드 타겟 도입 📊 통계: 2715개 파일 변경, 584910개 삽입(+), 94575개 삭제(-) 🔢 총 커밋: 1079 💻 코드베이스: 2,335,419줄(Python 52.3%, C/C++ 헤더 42.2%, Go 2.9%) 🔗 저장소: https://github.com/tensorflow/tensorflow.git 🎶 사운드트랙: 생성된 칩튠 ________________________________________________ 🤖 생성자: PC 🖥️ 하드웨어: NVIDIA GeForce RTX 4070, 595.71.05 ⏱️ 렌더링 시간: 14:10 #tensorflow #GitVisualization #CodeHistory