Releases: EM-GeekLab/NexusGate
Releases · EM-GeekLab/NexusGate
v0.7.4
What's Changed
- fix(adapters): forward extra_body params and return reasoning_content properly by @pescn in #75
- fix: handle streaming usage chunk and soft-deleted provider filtering by @pescn in #76
- feat(models): archived model display and URL encoding fix by @pescn in #77
- fix: 兼容上游 reasoning 字段并统一输出 reasoning_content by @pescn in #78
Full Changelog: v0.7.0...v0.7.4
v0.7.0
🚀 NexusGate v0.7.0
✨ 新功能
Playground:Chat UI 与多模型对比测试
全新的 Playground 模块,提供即时模型测试与对比能力,无需离开 NexusGate 即可快速验证模型效果。
Chat 对话
- 三栏布局:会话列表 | 聊天区域 | 参数侧边栏
- 支持模型与 API Key 选择,通过 NexusGate 网关发起请求
- SSE 实时流式输出,支持中断生成
- 会话自动持久化到数据库,支持历史会话加载与管理
- 可配置参数:System Prompt、Temperature、Top P、Top K、Max Tokens、Stop Sequences、Frequency/Presence Penalty
- 支持将当前对话一键保存为测试用例
Compare 对比测试
- 创建可复用的测试用例模板(消息 + 参数)
- 选择多个模型同时运行,并行请求
- 结果并排展示,包含关键指标:Token 用量、TTFT、响应耗时
- 运行结果自动刷新,支持查看历史运行记录
后端
- 新增 5 张数据库表(conversations、messages、test_cases、test_runs、test_results)
- 完整的 CRUD Admin API(
/api/admin/playground/*) - 外键约束配置 CASCADE / SET NULL 删除策略
- 测试运行创建使用数据库事务保证原子性
🌐 国际化
- 新增约 80 个中英文 i18n 词条,覆盖 Playground 全部界面文案
Full Changelog: v0.6.1...v0.7.0
v0.6.1
🚀 NexusGate v0.6.1
✨ 新功能
告警系统与 Grafana 集成
- 全新的告警管理系统,支持多种通知渠道(Webhook、邮箱、飞书)
- 可配置告警规则,覆盖预算、错误率、延迟、配额等维度
- 告警历史记录与追踪
- Grafana 集成:支持连接配置、告警规则同步(通过 Provisioning API 映射为 PromQL)、仪表板管理
- 连接 Grafana 后,内置告警引擎自动将评估委托给 Grafana
- 前端导航结构调整:模型配置移至
/models(提供商 + 注册表),系统设置移至/settings(告警 + Grafana)
KQL 搜索引擎
- 完整的 KQL (Kibana Query Language) 搜索引擎,用于查询 Completion 日志(#54)
- 后端词法分析/语法解析/编译管道,将 KQL 查询翻译为参数化 SQL
- 支持聚合查询:
count、avg、sum、min、max、p50/p95/p99 - 支持时间序列直方图、CSV/JSON 导出
- 前端集成搜索栏,支持时间范围选择和查询输入
按提供商配置 HTTP 代理
- 每个上游提供商可独立配置网络代理(URL + 启用/禁用开关)
- 使用 Bun 原生
fetch()代理支持,无需额外依赖 - 支持 http、https、socks5 等代理协议
- 代理配置贯穿故障转移、嵌入、连接测试等完整请求链路
提供商编辑功能
- 提供商卡片新增编辑按钮,支持创建后修改所有配置项
- 编辑对话框包含代理配置区域
🐛 Bug 修复
- 修复软删除模型后重新创建同名模型失败的唯一约束错误(改为原子化恢复已删除记录)
- 修复文档站点 SPA 导航报错(
__tsr/staticServerFnCache/404),通过添加预渲染入口页解决
⚡ 性能优化
- Docker 多架构构建大幅提速:前端和文档在 CI 环境中预构建,Docker 内仅编译后端
- 静态资源(JS/CSS/HTML)无架构依赖,只需构建一次即可用于 amd64/arm64
🔧 构建与 CI 改进
- 修复 Docker 构建中
.dockerignore递归匹配、bun cipostinstall 失败等问题 - 文档站点预渲染在 CI 中正常运行(Docker 环境内因 Vite preview server 竞态条件导致 ECONNREFUSED)
- 新增
scripts/generate-docs-shell.cjs作为本地 Docker 构建的文档 fallback - Dockerfile 支持三层检测:预构建前端+文档 → 仅编译后端 / 预构建文档 → 编译后端+前端 / 完整构建
Full Changelog: v0.5.0...v0.6.1
v0.5.0
🚀 NexusGate v0.5.0
✨ 新功能
多 API 格式适配器架构
- 全新的适配器模式,支持多种 LLM API 格式互相转换
- 支持 OpenAI Chat、OpenAI Responses 和 Anthropic Messages 三种 API 格式
- 新增
x-api-keyheader 支持,兼容 Anthropic SDK
Vision Language Model (VLM) 支持
- 完整支持图片输入,跨所有 API 格式
- 修复 Responses API 中的 VLM schema/adapter 不匹配问题
Function Calling / Tool Use 支持
- 完整支持 Function Calling 和 Tool Use 功能
- 前端可视化展示工具调用结果
请求去重 (Request Deduplication)
- 通过
X-NexusGate-ReqIdheader 实现幂等请求 - Redis 支持的 in-flight 请求追踪
- 自动返回已完成请求的缓存响应
Prometheus 监控 & Grafana 集成
- 内置
/metrics端点,导出完成数、令牌用量、延迟直方图、成本等指标 - Overview 页面可选嵌入 Grafana 仪表盘,支持视图模式切换
- 预置 Grafana Dashboard JSON,包含成本分析、趋势对比、模型性能矩阵
- 支持环境变量或数据库配置仪表盘 URL,含旧格式自动迁移
速率限制 (Rate Limiting)
- 基于令牌桶算法的速率限制服务
- 支持 RPM (每分钟请求数) 和 TPM (每分钟令牌数) 限制
- API Key 级别的细粒度速率配置
- 前端速率限制配置与使用量展示
Overview 仪表盘
- 新增 Overview 页面,展示 API 调用统计
- 支持时间范围筛选和数据可视化
多 Provider 故障转移
- 自动故障转移和重试机制
- 加权负载均衡支持
- 指数退避与抖动
Kubernetes 集成
- K8s Operator API Key 集成端点
- 支持自动 API Key 管理
管理员设置 API
- 通用 key-value 设置存储 (
/api/admin/settings) - 专用仪表盘管理端点 (
/api/admin/dashboards)
文档站点
- 独立的文档子模块 (fumadocs + TanStack Start)
- 支持中英文双语
- CI 自动同步文档更新
🐛 Bug 修复
- 修复客户端断开时未记录 completion 的问题 (#58)
- 修复上游 Provider 响应的 JSON 解析安全性 (#64)
- 修复 Anthropic 适配器透明性和兼容性 (#66)
- 修复加权负载均衡选择逻辑 (#49)
- 修复 Grafana 仪表盘中成功率/错误率除零问题
- 修复 Overview 统计查询的时区问题
- 修复速率限制的并发和竞态条件
- 修复 Docker 构建路径和依赖问题
🔧 其他改进
- 日志框架从 consola 迁移到 loglayer
- 新增 Python 集成测试套件
- PR Checks CI 流程
- 代码格式化和类型安全改进
Full Changelog: v0.4.0-beta.1...v0.5.0
v0.5.0-RC.1
What's Changed
- feat: add Vision Language Model (VLM) support by @pescn in #57
- fix(api): record completions even when client disconnects by @pescn in #58
- feat(api): add X-NexusGate-ReqId request deduplication by @pescn in #59
- feat(api): add Prometheus metrics endpoint by @pescn in #63
- fix(api): add safe JSON parsing for upstream provider responses by @pescn in #64
- fix(api): improve Anthropic adapter transparency and compatibility by @pescn in #66
Full Changelog: v0.5.0-rc...v0.5.0-RC.1
v0.5.0-rc
🚀 NexusGate v0.5.0-rc
✨ 新功能
多 API 格式适配器架构
- 全新的适配器模式,支持多种 LLM API 格式互相转换
- 支持 OpenAI Chat、OpenAI Responses 和 Anthropic Messages 三种 API 格式
- 新增
x-api-keyheader 支持,兼容 Anthropic SDK
Function Calling / Tool Use 支持
- 完整支持 Function Calling 和 Tool Use 功能
- 前端可视化展示工具调用结果
速率限制 (Rate Limiting)
- 基于令牌桶算法的速率限制服务
- 支持 RPM (每分钟请求数) 和 TPM (每分钟令牌数) 限制
- API Key 级别的细粒度速率配置
- 前端速率限制配置与使用量展示
Overview 仪表盘
- 新增 Overview 页面,展示 API 调用统计
- 支持时间范围筛选和数据可视化
多 Provider 故障转移
- 自动故障转移和重试机制
- 加权负载均衡支持
Kubernetes 集成
- K8s Operator API Key 集成端点
- 支持自动 API Key 管理
文档站点
- 独立的文档子模块 (fumadocs + TanStack Start)
- 支持中英文双语
- CI 自动同步文档更新 (需审批)
🐛 Bug 修复
- 修复 Overview 统计查询的时区问题
- 修复速率限制的并发和竞态条件
- 修复 Provider 连接测试 (Anthropic, OpenAI Responses)
- 修复前端布局问题 (固定 Header、滚动内容区)
- 修复 React hooks 依赖问题
- 修复 Docker 构建路径
🔧 其他改进
- PR Checks CI 流程
- 代码重构和类型安全改进
- 依赖更新和 linter 错误修复
Full Changelog: v0.4.0-beta.1...v0.5.0-rc
v0.4.0-beta.1
What's Changed
- chore(deps): bump next from 15.2.4 to 15.4.8 in /docs by @dependabot[bot] in #36
- Add Embedding model API support with vector display by @pescn in #37
- feat: refactor model management with providers architecture by @pescn in #41
Full Changelog: v0.3.6...v0.4.0-beta.1
v0.3.6
v0.3.5
v0.3.4 - 新增中国地区镜像加速
Changes:
Added Docker artifact repositories for the Chinese users to ensure stability and speed.
为中国大陆地区用户提供国内镜像与下载加速,可通过下面脚本进行安装:
curl -fsSL https://cnb.cool/EM-GeekLab/NexusGate/-/git/raw/main/scripts/quick-start.sh -o quick-start.sh
bash quick-start.shFull Changelog: v0.3.3...v0.3.4