bitcoin

$93799.023048 USD

-0.60%

ethereum

$1777.401774 USD

-1.97%

tether

$1.000343 USD

-0.03%

xrp

$2.252855 USD

3.38%

bnb

$602.185977 USD

0.02%

solana

$146.346959 USD

-0.63%

usd-coin

$1.000013 USD

-0.01%

dogecoin

$0.177703 USD

-1.16%

cardano

$0.697358 USD

-1.11%

tron

$0.245113 USD

-2.74%

sui

$3.522709 USD

-2.79%

chainlink

$14.667769 USD

-0.49%

avalanche

$21.472475 USD

-3.60%

stellar

$0.284731 USD

-2.25%

unus-sed-leo

$9.077708 USD

0.32%

加密货币新闻

使用模型上下文协议有效地管理上下文

2025/04/28 14:32

在本教程中，我们通过构建ModelContextManager来指导您实现模型上下文协议（MCP）

```python

``python

import torch

导入火炬

import numpy as np

导入numpy作为NP

import typing

导入打字

from dataclasses import dataclass

从数据级导入数据级

import time

进口时间

import gc

导入GC

from tqdm.notebook import tqdm

来自tqdm.notebook导入tqdm

from sentence_transformers import SentenceTransformer

从stone_transformers导入句子词术语

from transformers import GPT2Tokenizer, FLAN_T5ForConditionalGeneration, AutoTokenizer, AutoModelForSeq2SeqLM

从变形金刚导入GPT2Tokenizer，Flan_T5ForConditionAlgeneration，AutoTokenizer，AutomodelForseq2Seqlm

import math

导入数学

MAX_TOKENS = 8000

max_tokens = 8000

DEVICE = 'cuda' if torch.cuda.is_available() else 'cpu'

设备='cuda'如果torch.cuda.is_available（）else'cpu'

NUM_CHUNKS = 50

num_chunks = 50

CHUNK_SIZE = 100

chunk_size = 100

RELEVANCE_THRESHOLD = 0.1

相关性_threshold = 0.1

IMPORTANCE_FACTOR = 1.0

Questional_factor = 1.0

RECENCY_FACTOR = 0.5

recency_factor = 0.5

VISUALIZE_CONTEXT = True

Visualize_Context = true

BATCH_SIZE = 32

batch_size = 32

class ContextChunk(typing.NamedTuple):

班级上下文chunk（Typing.NamedTuple）：

content: str

内容：str

embedding: np.array

嵌入：np.array

importance: float = 1.0

重要性：float = 1.0

timestamp: float = time.time()

时间戳：float = time.time（）

metadata: dict = None

元数据：dict =无

def __post_init__(self):

def __post_init __（self）：

if self.metadata is None:

如果self.metadata无：

self.metadata = {}

self.metadata = {}

class ModelContextManager:

类ModelContextManager：

def __init__(self, context_chunks:typing.List[ContextChunk]=None, max_tokens:int=MAX_TOKENS, token_limit:int=0, gpt2_tokenizer:GPT2Tokenizer=None):

def __init __（self，context_chunks：typing.list [contextchunk] = none，max_tokens：int = max_tokens，token_limit：int = 0，gpt2_tokenizer：gpt2_tokenizer：gpt2tokenizer = none）

self.max_tokens = max_tokens

self.max_tokens = max_tokens

self.token_limit = token_limit

self.token_limit = token_limit

self.context_chunks = context_chunks or []

self.context_chunks = context_chunks或[]

self.used_tokens = 0

self.used_tokens = 0

self.last_chunk_index = 0

self.last_chunk_index = 0

self.total_chunks = 0

self.total_chunks = 0

if gpt2_tokenizer is None:

如果gpt2_tokenizer无：

self.gpt2_tokenizer = GPT2Tokenizer.from_pretrained("gpt2")

self.gpt2_tokenizer = gpt2tokenizer.from_pretrataining（“ gpt2”）

else:

别的：

self.gpt2_tokenizer = gpt2_tokenizer

self.gpt2_tokenizer = gpt2_tokenizer

self.sentence_transformer = SentenceTransformer('all-mpnet-base-v2')

self.sentence_transformer = sencencetransformer（'all-mpnet-base-v2'）

def add_chunk(self, chunk_text:str, importance:float=1.0):

def add_chunk（self，chunk_text：str，重要性：float = 1.0）：

encoded_input = self.gpt2_tokenizer(chunk_text, return_tensors='pt')

encoded_input = self.gpt2_tokenizer（chunk_text，return_tensors ='pt'）

self.used_tokens += int(encoded_input[0].shape[1])

self.used_tokens += int（encoded_input [0] .shape [1]）

chunk_embedding = self.sentence_transformer.encode(chunk_text, batch_size=BATCH_SIZE)

chunk_embedding = self.sentence_transformer.encode（chunk_text，batch_size = batch_size）

new_chunk = ContextChunk(content=chunk_text, embedding=chunk_embedding, importance=importance)

new_chunk = contextChunk（content = chunk_text，embedding = chunk_embedding，重要性=重要性）

self.context_chunks.append(new_chunk)

self.context_chunks.sappend（new_chunk）

self.last_chunk_index += 1

self.last_chunk_index += 1

self.total_chunks += 1

self.total_chunks += 1

print(f"Added chunk with {int(encoded_input[0].shape[1])} tokens and importance {importance}. Total used tokens: {self.used_tokens}, total chunks: {self.total_chunks}")

print（f“添加了{int（encoded_input [0]。shape [1]）}令牌和重要性{quiental}。

def optimize_context_window(self, query:str, min_chunks:int=3):

def optimize_context_window（自我，查询：str，min_chunks：int = 3）：

if len(self.context_chunks) <= min_chunks:

如果len（self.context_chunks）<= min_chunks：

return []

返回 []

query_embedding = self.sentence_transformer.encode(query, batch_size=BATCH_SIZE)

query_embedding = self.sentence_transformer.encode（query，batch_size = batch_size）

chunks_to_keep = []

chunks_to_keep = []

remaining_tokens = self.max_tokens - self.used_tokens

剩余_tokens = self.max_tokens- self.used_tokens

if remaining_tokens < 0:

如果剩下的_tokens <0：

print("Warning: token limit exceeded by %s tokens" % -remaining_tokens)

打印（“警告：令牌限制超过％s令牌”％ - remaining_tokens）

for i in range(min_chunks, len(self.context_chunks) - 1, -1):

对于我的范围（min_chunks，len（self.context_chunks）-1，-1）：

chunk = self.context_chunks[i]

块= self.context_chunks [i]

if i == len(self.context_chunks) - 1:

如果i == len（self.context_chunks） - 1：

chunks_to_keep.append(i)

chunks_to_keep.append（i）

continue

继续

chunk_importance = chunk.importance * IMPORTANCE_FACTOR

chunk_importance =块。

chunk_recency = (time.time() - chunk.timestamp) * RECENCY_FACTOR

chunk_recency =（time.time（）-chunk.timestamp） * recency_factor

relevant_scores = np.array([cosine_similarity(chunk.embedding, x) for x in query_embedding])

相关_scores = np.Array（[cosine_simurility（chunk.embedding，x）for query_embedding中的x]）

max_relevant_score = np.max(relevant_scores)

max_relevant_score = np.max（相关_scores）

total_score = chunk_importance + chunk_recency + max_relevant_score

total_score = chunk_importance + chunk_recency + max_relevant_score

if total_score >= RELEVANCE_THRESHOLD:

如果total_score> = sensepance_threshold：

encoded_input = self.gpt2_tokenizer(chunk.content, return_tensors='pt')

encoded_input = self.gpt2_tokenizer（chunk.content，return_tensors ='pt'）

chunk_token_count = int(encoded_input[0].shape[1])

chunk_token_count = int（encoded_input [0] .shape [1]）

if remaining_tokens >= chunk_token_count:

如果剩下的_tokens> = chunk_token_count：

chunks_to_keep.append(i)

chunks_to_keep.append（i）

remaining_

其余的_

免责声明:info@kdj.com

所提供的信息并非交易建议。根据本文提供的信息进行的任何投资，kdj.com不承担任何责任。加密货币具有高波动性，强烈建议您深入研究后，谨慎投资！

如您认为本网站上使用的内容侵犯了您的版权，请立即联系我们（info@kdj.com），我们将及时删除。

2025年04月28日发表的其他文章