Skip to content

Commit 603b6cd

Browse files
committed
update model cards (#338)
* add qianfan models * add check_models * remove longtext * update chat-completions * fix lint * fix ernie-speed * update model card
1 parent ec9d29a commit 603b6cd

File tree

3 files changed

+27
-29
lines changed

3 files changed

+27
-29
lines changed

docs/sdk/README.md

+10-6
Original file line numberDiff line numberDiff line change
@@ -23,12 +23,16 @@ import erniebot
2323
models = erniebot.Model.list()
2424

2525
print(models)
26-
# ernie-3.5 文心大模型(ernie-3.5)
27-
# ernie-turbo 文心大模型(ernie-turbo)
28-
# ernie-4.0 文心大模型(ernie-4.0)
29-
# ernie-longtext 文心大模型(ernie-longtext)
30-
# ernie-text-embedding 文心百中语义模型
31-
# ernie-vilg-v2 文心一格模型
26+
# ernie-3.5 文心大模型(ernie-3.5)
27+
# ernie-lite 文心大模型(ernie-lite)
28+
# ernie-4.0 文心大模型(ernie-4.0)
29+
# ernie-longtext 文心大模型(ernie-longtext)
30+
# ernie-speed 文心大模型(ernie-speed)
31+
# ernie-speed-128k 文心大模型(ernie-speed-128k)
32+
# ernie-tiny-8k 文心大模型(ernie-tiny-8k)
33+
# ernie-char-8k 文心大模型(ernie-char-8k)
34+
# ernie-text-embedding 文心百中语义模型
35+
# ernie-vilg-v2 文心一格模型
3236

3337
# Set authentication params
3438
erniebot.api_type = "aistudio"

docs/sdk/models.md

+12-8
Original file line numberDiff line numberDiff line change
@@ -2,11 +2,15 @@
22

33
ERNIE Bot支持的所有模型如下:
44

5-
| 模型名称 | 说明 | 功能 | 支持该模型的后端 | 输入token数量上限 |
6-
|:--- | :--- | :--- | :--- | :--- |
7-
| ernie-3.5 | 文心大模型3.5版本。具备优秀的知识增强和内容生成能力,在文本创作、问答、推理和代码生成等方面表现出色。 | 对话补全,函数调用 | qianfan,aistudio | 3000 |
8-
| ernie-turbo | 文心大模型。相比ernie-3.5模型具备更快的响应速度和学习能力,API调用成本更低。 | 对话补全 | qianfan,aistudio | 3000 |
9-
| ernie-4.0 | 文心大模型4.0版本,具备目前系列模型中最优的理解和生成能力。 | 对话补全,函数调用 | qianfan,aistudio | 3000 |
10-
| ernie-longtext | 文心大模型。在ernie-3.5模型的基础上增强了对长对话上下文的支持,输入token数量上限为7000。 | 对话补全,函数调用 | qianfan,aistudio | 7000 |
11-
| ernie-text-embedding | 文心百中语义模型。支持计算最多384个token的文本的向量表示。 | 语义向量 | qianfan,aistudio | 384*16 |
12-
| ernie-vilg-v2 | 文心一格模型。 | 文生图 | yinian | 200 |
5+
| 模型名称 | 说明 | 功能 | 支持该模型的后端 | 输入token数量上限 | 输出token数量上限 |
6+
|---------------------- |--------------------------------------------------------------------------------------------------------------------------------------- |-------------------- |------------------- |------------------------------------------------------------------------------------------------- |------------------- |
7+
| ernie-3.5 | 文心大模型3.5版本。具备优秀的知识增强和内容生成能力,在文本创作、问答、推理和代码生成等方面表现出色。 | 对话补全,函数调用 | qianfan,aistudio | message中的content总长度、functions和system字段总内容不能超过20000个字符,且不能超过5120 tokens | 2048 |
8+
| ernie-lite | ERNIE Lite是百度自研的轻量级大语言模型,兼顾优异的模型效果与推理性能,适合低算力AI加速卡推理使用。 | 对话补全 | qianfan,aistudio | message中的content总长度和system字段总内容不能超过11200个字符,且不能超过7168 tokens | 1024 |
9+
| ernie-4.0 | 文心大模型4.0版本,具备目前系列模型中最优的理解和生成能力。 | 对话补全,函数调用 | qianfan,aistudio | message中的content总长度和system字段总内容不能超过20000个字符,且不能超过5120 tokens | 2048 |
10+
| ernie-longtext | 文心大模型。在ernie-3.5模型的基础上增强了对长对话上下文的支持,输入token数量上限为7000。 | 对话补全,函数调用 | qianfan,aistudio | message中的content总长度、functions和system字段总内容不能超过20000个字符,且不能超过5120 tokens | 2048 |
11+
| ernie-speed | ERNIE Speed是百度自研高性能大语言模型,通用能力优异,适合作为基座模型进行精调,更好地处理特定场景问题,同时具备极佳的推理性能 | 对话补全 | qianfan,aistudio | message中的content总长度和system字段总内容不能超过24000个字符,且不能超过6144 tokens | 2048 |
12+
| ernie-speed-128k | ERNIE Speed是百度自研高性能大语言模型,通用能力优异,适合作为基座模型进行精调,更好地处理特定场景问题,同时具备极佳的推理性能。 | 对话补全 | qianfan,aistudio | message中的content总长度和system字段总内容不能超过516096个字符,且不能超过126976 tokens | 4096 |
13+
| ernie-tiny-8k | ERNIE Tiny是百度自研的超高性能大语言模型,部署与精调成本在文心系列模型中最低 | 对话补全 | qianfan,aistudio | message中的content总长度和system字段总内容不能超过24000个字符,且不能超过6144 tokens | 2048 |
14+
| ernie-char-8k | 百度自研的垂直场景大语言模型,适合游戏NPC、客服对话、对话角色扮演等应用场景,人设风格更为鲜明、一致,指令遵循能力更强,推理性能更优。 | 对话补全 | qianfan,aistudio | message中的content总长度和system字段总内容不能超过24000个字符,且不能超过6144 tokens | 2048 |
15+
| ernie-text-embedding | 文心百中语义模型。支持计算最多384个token的文本的向量表示。 | 语义向量 | qianfan,aistudio | 384*16 | |
16+
| ernie-vilg-v2 | 文心一格模型。 | 文生图 | yinian | 200 | |

erniebot/src/erniebot/resources/chat_completion.py

+5-15
Original file line numberDiff line numberDiff line change
@@ -58,7 +58,7 @@ class ChatCompletion(EBResource, CreatableWithStreaming):
5858
"ernie-3.5-8k": {
5959
"model_id": "completions",
6060
},
61-
"ernie-turbo": {
61+
"ernie-lite": {
6262
"model_id": "eb-instant",
6363
},
6464
"ernie-4.0": {
@@ -91,7 +91,7 @@ class ChatCompletion(EBResource, CreatableWithStreaming):
9191
"ernie-3.5-8k": {
9292
"model_id": "completions",
9393
},
94-
"ernie-turbo": {
94+
"ernie-lite": {
9595
"model_id": "eb-instant",
9696
},
9797
"ernie-4.0": {
@@ -459,18 +459,7 @@ async def acreate(
459459
return transform(ChatCompletionResponse.from_mapping, resp)
460460

461461
def _check_model_kwargs(self, model_name: str, kwargs: Dict[str, Any]) -> None:
462-
if model_name in ("ernie-turbo",):
463-
for arg in (
464-
"functions",
465-
"stop",
466-
"disable_search",
467-
"enable_citation",
468-
"tool_choice",
469-
):
470-
if arg in kwargs:
471-
raise errors.InvalidArgumentError(f"`{arg}` is not supported by the {model_name} model.")
472-
473-
if model_name in ("ernie-speed", "ernie-speed-128k", "ernie-char-8k", "ernie-tiny-8k"):
462+
if model_name in ("ernie-speed", "ernie-speed-128k", "ernie-char-8k", "ernie-tiny-8k", "ernie-lite"):
474463
for arg in (
475464
"functions",
476465
"disable_search",
@@ -530,10 +519,11 @@ def _set_val_if_key_exists(src: dict, dst: dict, key: str) -> None:
530519
model,
531520
{
532521
"ernie-bot": "ernie-3.5",
533-
"ernie-bot-turbo": "ernie-turbo",
522+
"ernie-bot-turbo": "ernie-lite",
534523
"ernie-bot-4": "ernie-4.0",
535524
"ernie-bot-8k": "ernie-3.5-8k",
536525
"ernie-longtext": "ernie-3.5-8k",
526+
"ernie-turbo": "ernie-lite",
537527
},
538528
)
539529

0 commit comments

Comments
 (0)