vllm-project
diff --git a/‎tests/ut/attention/test_mla_v1.py‎
Lines changed: 0 additions & 3 deletions b/‎tests/ut/attention/test_mla_v1.py‎
Lines changed: 0 additions & 3 deletions
diff --git a/‎vllm_ascend/attention/attention_v1.py‎
Lines changed: 152 additions & 217 deletions b/‎vllm_ascend/attention/attention_v1.py‎
Lines changed: 152 additions & 217 deletions
diff --git a/‎vllm_ascend/attention/mla_v1.py‎
Lines changed: 248 additions & 460 deletions b/‎vllm_ascend/attention/mla_v1.py‎
Lines changed: 248 additions & 460 deletions
diff --git a/‎vllm_ascend/attention/utils.py‎
Lines changed: 0 additions & 24 deletions b/‎vllm_ascend/attention/utils.py‎
Lines changed: 0 additions & 24 deletions
@@ -484,9 +484,6 @@ def test_compute_prefill_context(self, mock_ring, mock_load):
         chunk_ctx.chunk_seq_lens = [torch.tensor([8])]
         chunk_ctx.chunk_seq_lens_npu = [torch.tensor([8])]
         chunk_ctx.starts = [torch.tensor([0])]
-        chunk_ctx.max_chunk_num = 1
-        chunk_ctx.mask_for_non_zero_chunk = [True]
-        chunk_ctx.local_chunked_kv_lens = [[[[8]]]]
 
         prefill_meta = MagicMock()
         prefill_meta.chunked_context = chunk_ctx
 
@@ -20,13 +20,6 @@ class AscendPrefillContextParallelMetadata:
 
     num_computed_tokens_of_pcp_dcp: Optional[list[list[list[int]]]] = None
 
-    local_chunked_kv_lens: Optional[list[Optional[list[Optional[list[Optional[
-        list[int]]]]]]]] = None
-
-    mask_for_non_zero_chunk: Optional[List[bool]] = None
-
-    max_chunk_num: int = 0
-
     q_head_idx_tensor: torch.Tensor = None
 
     q_tail_idx_tensor: torch.Tensor = None
@@ -115,23 +108,6 @@ class AscendCommonAttentionMetadata:
         AscendPrefillContextParallelMetadata] = None
 
 
-def extract_req_dcp_by_chunk_pcp(lst,
-                                 chunk_idx,
-                                 dcp_size,
-                                 pcp_rank,
-                                 fill_value=0):
-    num_reqs = len(lst)
-    results: List[List[int]] = []
-    for i in range(num_reqs):
-        if len(lst[i]) == 0 or chunk_idx >= len(lst[i]):
-            # empty req or this req has no corresponding chunk, fill 0
-            results.append([fill_value] * dcp_size)
-            continue
-        dcp_values = lst[i][chunk_idx][pcp_rank]
-        results.append(dcp_values)
-    return results
-
-
 def filter_chunked_req_indices(
     seq_len: torch.Tensor,
     mask_for_non_zero_chunk: Optional[List[bool]],