@@ -368,10 +368,10 @@ def generate(self):
368
368
id = llama_cpp .llama_sample_token_mirostat_v2 (self .ctx , candidates_p , llama_cpp .c_float (self .params .mirostat_tau ), llama_cpp .c_float (self .params .mirostat_eta ), llama_cpp .c_float (mirostat_mu ))
369
369
else :
370
370
# Temperature sampling
371
- llama_cpp .llama_sample_top_k (self .ctx , candidates_p , top_k )
372
- llama_cpp .llama_sample_tail_free (self .ctx , candidates_p , llama_cpp .c_float (self .params .tfs_z ))
373
- llama_cpp .llama_sample_typical (self .ctx , candidates_p , llama_cpp .c_float (self .params .typical_p ))
374
- llama_cpp .llama_sample_top_p (self .ctx , candidates_p , llama_cpp .c_float (self .params .top_p ))
371
+ llama_cpp .llama_sample_top_k (self .ctx , candidates_p , top_k , min_keep = llama_cpp . c_size_t ( 1 ) )
372
+ llama_cpp .llama_sample_tail_free (self .ctx , candidates_p , llama_cpp .c_float (self .params .tfs_z ), min_keep = llama_cpp . c_size_t ( 1 ) )
373
+ llama_cpp .llama_sample_typical (self .ctx , candidates_p , llama_cpp .c_float (self .params .typical_p ), min_keep = llama_cpp . c_size_t ( 1 ) )
374
+ llama_cpp .llama_sample_top_p (self .ctx , candidates_p , llama_cpp .c_float (self .params .top_p ), min_keep = llama_cpp . c_size_t ( 1 ) )
375
375
llama_cpp .llama_sample_temperature (self .ctx , candidates_p , llama_cpp .c_float (self .params .temp ))
376
376
id = llama_cpp .llama_sample_token (self .ctx , candidates_p )
377
377
# print("`{}`".format(candidates_p.size))
0 commit comments