Skip to content

Releases: EM-GeekLab/NexusGate

v0.7.4

04 Mar 00:11
a394871

Choose a tag to compare

What's Changed

  • fix(adapters): forward extra_body params and return reasoning_content properly by @pescn in #75
  • fix: handle streaming usage chunk and soft-deleted provider filtering by @pescn in #76
  • feat(models): archived model display and URL encoding fix by @pescn in #77
  • fix: 兼容上游 reasoning 字段并统一输出 reasoning_content by @pescn in #78

Full Changelog: v0.7.0...v0.7.4

v0.7.0

07 Feb 09:50
57aeafe

Choose a tag to compare

🚀 NexusGate v0.7.0

✨ 新功能

Playground:Chat UI 与多模型对比测试

全新的 Playground 模块,提供即时模型测试与对比能力,无需离开 NexusGate 即可快速验证模型效果。

Chat 对话

  • 三栏布局:会话列表 | 聊天区域 | 参数侧边栏
  • 支持模型与 API Key 选择,通过 NexusGate 网关发起请求
  • SSE 实时流式输出,支持中断生成
  • 会话自动持久化到数据库,支持历史会话加载与管理
  • 可配置参数:System Prompt、Temperature、Top P、Top K、Max Tokens、Stop Sequences、Frequency/Presence Penalty
  • 支持将当前对话一键保存为测试用例

Compare 对比测试

  • 创建可复用的测试用例模板(消息 + 参数)
  • 选择多个模型同时运行,并行请求
  • 结果并排展示,包含关键指标:Token 用量、TTFT、响应耗时
  • 运行结果自动刷新,支持查看历史运行记录

后端

  • 新增 5 张数据库表(conversations、messages、test_cases、test_runs、test_results)
  • 完整的 CRUD Admin API(/api/admin/playground/*
  • 外键约束配置 CASCADE / SET NULL 删除策略
  • 测试运行创建使用数据库事务保证原子性

🌐 国际化

  • 新增约 80 个中英文 i18n 词条,覆盖 Playground 全部界面文案

Full Changelog: v0.6.1...v0.7.0

v0.6.1

06 Feb 20:23
454e721

Choose a tag to compare

🚀 NexusGate v0.6.1

✨ 新功能

告警系统与 Grafana 集成

  • 全新的告警管理系统,支持多种通知渠道(Webhook、邮箱、飞书)
  • 可配置告警规则,覆盖预算、错误率、延迟、配额等维度
  • 告警历史记录与追踪
  • Grafana 集成:支持连接配置、告警规则同步(通过 Provisioning API 映射为 PromQL)、仪表板管理
  • 连接 Grafana 后,内置告警引擎自动将评估委托给 Grafana
  • 前端导航结构调整:模型配置移至 /models(提供商 + 注册表),系统设置移至 /settings(告警 + Grafana)

KQL 搜索引擎

  • 完整的 KQL (Kibana Query Language) 搜索引擎,用于查询 Completion 日志(#54
  • 后端词法分析/语法解析/编译管道,将 KQL 查询翻译为参数化 SQL
  • 支持聚合查询:countavgsumminmaxp50/p95/p99
  • 支持时间序列直方图、CSV/JSON 导出
  • 前端集成搜索栏,支持时间范围选择和查询输入

按提供商配置 HTTP 代理

  • 每个上游提供商可独立配置网络代理(URL + 启用/禁用开关)
  • 使用 Bun 原生 fetch() 代理支持,无需额外依赖
  • 支持 http、https、socks5 等代理协议
  • 代理配置贯穿故障转移、嵌入、连接测试等完整请求链路

提供商编辑功能

  • 提供商卡片新增编辑按钮,支持创建后修改所有配置项
  • 编辑对话框包含代理配置区域

🐛 Bug 修复

  • 修复软删除模型后重新创建同名模型失败的唯一约束错误(改为原子化恢复已删除记录)
  • 修复文档站点 SPA 导航报错(__tsr/staticServerFnCache/ 404),通过添加预渲染入口页解决

⚡ 性能优化

  • Docker 多架构构建大幅提速:前端和文档在 CI 环境中预构建,Docker 内仅编译后端
  • 静态资源(JS/CSS/HTML)无架构依赖,只需构建一次即可用于 amd64/arm64

🔧 构建与 CI 改进

  • 修复 Docker 构建中 .dockerignore 递归匹配、bun ci postinstall 失败等问题
  • 文档站点预渲染在 CI 中正常运行(Docker 环境内因 Vite preview server 竞态条件导致 ECONNREFUSED)
  • 新增 scripts/generate-docs-shell.cjs 作为本地 Docker 构建的文档 fallback
  • Dockerfile 支持三层检测:预构建前端+文档 → 仅编译后端 / 预构建文档 → 编译后端+前端 / 完整构建

Full Changelog: v0.5.0...v0.6.1

v0.5.0

31 Jan 11:00
f823a58

Choose a tag to compare

🚀 NexusGate v0.5.0

✨ 新功能

多 API 格式适配器架构

  • 全新的适配器模式,支持多种 LLM API 格式互相转换
  • 支持 OpenAI ChatOpenAI ResponsesAnthropic Messages 三种 API 格式
  • 新增 x-api-key header 支持,兼容 Anthropic SDK

Vision Language Model (VLM) 支持

  • 完整支持图片输入,跨所有 API 格式
  • 修复 Responses API 中的 VLM schema/adapter 不匹配问题

Function Calling / Tool Use 支持

  • 完整支持 Function Calling 和 Tool Use 功能
  • 前端可视化展示工具调用结果

请求去重 (Request Deduplication)

  • 通过 X-NexusGate-ReqId header 实现幂等请求
  • Redis 支持的 in-flight 请求追踪
  • 自动返回已完成请求的缓存响应

Prometheus 监控 & Grafana 集成

  • 内置 /metrics 端点,导出完成数、令牌用量、延迟直方图、成本等指标
  • Overview 页面可选嵌入 Grafana 仪表盘,支持视图模式切换
  • 预置 Grafana Dashboard JSON,包含成本分析、趋势对比、模型性能矩阵
  • 支持环境变量或数据库配置仪表盘 URL,含旧格式自动迁移

速率限制 (Rate Limiting)

  • 基于令牌桶算法的速率限制服务
  • 支持 RPM (每分钟请求数) 和 TPM (每分钟令牌数) 限制
  • API Key 级别的细粒度速率配置
  • 前端速率限制配置与使用量展示

Overview 仪表盘

  • 新增 Overview 页面,展示 API 调用统计
  • 支持时间范围筛选和数据可视化

多 Provider 故障转移

  • 自动故障转移和重试机制
  • 加权负载均衡支持
  • 指数退避与抖动

Kubernetes 集成

  • K8s Operator API Key 集成端点
  • 支持自动 API Key 管理

管理员设置 API

  • 通用 key-value 设置存储 (/api/admin/settings)
  • 专用仪表盘管理端点 (/api/admin/dashboards)

文档站点

  • 独立的文档子模块 (fumadocs + TanStack Start)
  • 支持中英文双语
  • CI 自动同步文档更新

🐛 Bug 修复

  • 修复客户端断开时未记录 completion 的问题 (#58)
  • 修复上游 Provider 响应的 JSON 解析安全性 (#64)
  • 修复 Anthropic 适配器透明性和兼容性 (#66)
  • 修复加权负载均衡选择逻辑 (#49)
  • 修复 Grafana 仪表盘中成功率/错误率除零问题
  • 修复 Overview 统计查询的时区问题
  • 修复速率限制的并发和竞态条件
  • 修复 Docker 构建路径和依赖问题

🔧 其他改进

  • 日志框架从 consola 迁移到 loglayer
  • 新增 Python 集成测试套件
  • PR Checks CI 流程
  • 代码格式化和类型安全改进

Full Changelog: v0.4.0-beta.1...v0.5.0

v0.5.0-RC.1

31 Jan 06:24
cc083fa

Choose a tag to compare

v0.5.0-RC.1 Pre-release
Pre-release

What's Changed

  • feat: add Vision Language Model (VLM) support by @pescn in #57
  • fix(api): record completions even when client disconnects by @pescn in #58
  • feat(api): add X-NexusGate-ReqId request deduplication by @pescn in #59
  • feat(api): add Prometheus metrics endpoint by @pescn in #63
  • fix(api): add safe JSON parsing for upstream provider responses by @pescn in #64
  • fix(api): improve Anthropic adapter transparency and compatibility by @pescn in #66

Full Changelog: v0.5.0-rc...v0.5.0-RC.1

v0.5.0-rc

23 Jan 20:00
v0.5.0-rc
4c70250

Choose a tag to compare

v0.5.0-rc Pre-release
Pre-release

🚀 NexusGate v0.5.0-rc

✨ 新功能

多 API 格式适配器架构

  • 全新的适配器模式,支持多种 LLM API 格式互相转换
  • 支持 OpenAI ChatOpenAI ResponsesAnthropic Messages 三种 API 格式
  • 新增 x-api-key header 支持,兼容 Anthropic SDK

Function Calling / Tool Use 支持

  • 完整支持 Function Calling 和 Tool Use 功能
  • 前端可视化展示工具调用结果

速率限制 (Rate Limiting)

  • 基于令牌桶算法的速率限制服务
  • 支持 RPM (每分钟请求数) 和 TPM (每分钟令牌数) 限制
  • API Key 级别的细粒度速率配置
  • 前端速率限制配置与使用量展示

Overview 仪表盘

  • 新增 Overview 页面,展示 API 调用统计
  • 支持时间范围筛选和数据可视化

多 Provider 故障转移

  • 自动故障转移和重试机制
  • 加权负载均衡支持

Kubernetes 集成

  • K8s Operator API Key 集成端点
  • 支持自动 API Key 管理

文档站点

  • 独立的文档子模块 (fumadocs + TanStack Start)
  • 支持中英文双语
  • CI 自动同步文档更新 (需审批)

🐛 Bug 修复

  • 修复 Overview 统计查询的时区问题
  • 修复速率限制的并发和竞态条件
  • 修复 Provider 连接测试 (Anthropic, OpenAI Responses)
  • 修复前端布局问题 (固定 Header、滚动内容区)
  • 修复 React hooks 依赖问题
  • 修复 Docker 构建路径

🔧 其他改进

  • PR Checks CI 流程
  • 代码重构和类型安全改进
  • 依赖更新和 linter 错误修复

Full Changelog: v0.4.0-beta.1...v0.5.0-rc

v0.4.0-beta.1

13 Jan 11:36
048f7a3

Choose a tag to compare

v0.4.0-beta.1 Pre-release
Pre-release

What's Changed

  • chore(deps): bump next from 15.2.4 to 15.4.8 in /docs by @dependabot[bot] in #36
  • Add Embedding model API support with vector display by @pescn in #37
  • feat: refactor model management with providers architecture by @pescn in #41

Full Changelog: v0.3.6...v0.4.0-beta.1

v0.3.6

25 Aug 07:52
0e22f31

Choose a tag to compare

Changes:

  • completions API now pass all unknown fields to upstream

Full Changelog: v0.3.5...v0.3.6

v0.3.5

19 Aug 12:48
f9f52a2

Choose a tag to compare

Changes:

  • Rename OpenAPI spec path to /api/openapi.json

Full Changelog: v0.3.4...v0.3.5

v0.3.4 - 新增中国地区镜像加速

30 Jul 14:57
f71e269

Choose a tag to compare

Changes:

Added Docker artifact repositories for the Chinese users to ensure stability and speed.

为中国大陆地区用户提供国内镜像与下载加速,可通过下面脚本进行安装:

curl -fsSL https://cnb.cool/EM-GeekLab/NexusGate/-/git/raw/main/scripts/quick-start.sh -o quick-start.sh
bash quick-start.sh

Full Changelog: v0.3.3...v0.3.4