updated

kenoharada · kenoharada · commit f45358c2d49d · 2024-09-13T19:59:59.000+09:00
diff --git a/llm_api_utils.py b/llm_api_utils.py
@@ -32,15 +32,17 @@ def get_llm_response(model_name: str, params_: dict, messages: list[dict]) -> st
     
 
 @retry(wait=wait_fixed(90), stop=stop_after_attempt(10))
-async def get_llm_response_async(model_name: str, params: dict, messages: list[dict]) -> str:
+async def get_llm_response_async(model_name: str, params_: dict, messages: list[dict]) -> str:
+    params = params_.copy()
     if model_name in OPENAI_MODEL_NAMES:
         if 'max_tokens' in params:
-            params_copy = params.copy()
-            params_copy['max_completion_tokens'] = params_copy['max_tokens']
-            del params_copy['max_tokens']
-            return get_gpt_respnose(model_name, params_copy, messages)
-        return get_gpt_respnose(model_name, params, messages)
+            params['maxcompletion_tokens'] = params['max_tokens']
+            del params['max_tokens']
+            return get_gpt_respnose_async(model_name, params, messages)
+        return get_gpt_respnose_async(model_name, params, messages)
     elif model_name in ANTHROPIC_MODEL_NAMES:
+        if 'max_tokens' not in params:
+            params['max_tokens'] = 8192
         return await get_claude_response_async(model_name, params, messages)
     elif model_name in GEMINI_MODEL_NAMES:
         return await get_gemini_response_async(model_name, params, messages)