Releases: dataelement/bisheng
Releases · dataelement/bisheng
v0.3.7.dev2
What's Changed
QA知识库在metadata里增加main_question 属性
修复知识库的切分bug
v0.3.7.dev1
- 新增数据标注功能
v0.3.6.dev1
- 新增 QA 知识库:支持手动添加 QA 和相似问题到 QA 知识库。QA 知识库可用于双路径问答应用搭建,或者微调数据集构建等场景。
- 支持会话内容数据标注回流:支持在审计中对应用的历史会话内容进行标注,添加 QA 或相似问题 到 QA 知识库,持续优化问答应用效果。
- 新增数据集管理:支持从本地导入或从 QA 知识库导入 2种方式创建数据集,用于模型微调训练。
v0.3.5.dev1
BISHENG 0.3.5 dev1 版
-
新增知识库分段管理功能:支持预览文档分段结果,支持对照原文件修改分段结果,分段结果支持搜索、删除等管理功能(在部署 OCR SDK 情况下,支持通过在原文件上圈选文本框来快速修改分段内容,需要使用SDK 2.4.3版本)>>知识库
-
知识库文档支持自定义正则表达式切分策略,支持通过正则设置“第x章”、“第x条”等具有语义属性的切分策略。
-
助手/技能增加对外发布页面:支持快速复制调用接口的代码、发布为独立页面以及嵌入到第三方网站中。>>发布助手:API 接口、独立页面以及嵌入到第三方网站 、发布技能
- 当前除了调用助手与技能的接口,还提供了知识库相关接口,对该接口进行了升级,修复通过接口创建的知识库在角色授权列表不可见问题。升级后旧接口将失效,更新后的接口文档>>接口文档
known issue:
- 目前 OCR SDK 2.4.3 版本默认配置对于英文扫描文档识别解析时不会返回英文空格,如关注此类场景的朋友,可联系我们获取修改配置的方法。
- Markdown无法表达合并单元格,所以对于有合并单元格的表格在切分结果的展示时有问题(OCR SDK表格识别的效果体验:https://www.dataelem.com/example/view?type=table 使用方法见下图),目前正在讨论方案,对于表格后面可能会选择html或latex等方式表示(需要同时考虑对大模型问答效果的影响,有经验的朋友欢迎贡献建议)。
v0.3.4
v0.3.4.dev3
- 解决新建助手时默认模型与配置不符问题
- 解决docx解析时提示 nltk 依赖缺失的问题
- 修复xinference、minimax 服务提供方bug
v0.3.4.dev2
修复xinference的模型实例化报错问题
v0.3.4.dev1
BISHENG 0.3.4 dev1 版来啦~
- 模型管理功能全面升级改造>>模型管理(模型管理)
a. 兼容多种推理框架:正式支持主流开源 LLM 推理框架(ollama/llamacpp/xinference/vllm)部署模型及在线模型快速接入,并提供模型上下线操作和单日调用量控制能力。
b. 系统配置大幅简化:知识库、助手、评测等功能所依赖的模型可在模型管理中进行可视化配置,内置工具(Dalle3绘画、Bing 搜索、天眼查)秘钥在工具页面中进行可视化配置。
c. 基于以上功能,大幅简化了部署和配置使用毕昇的步骤,部署文档也变得格外清爽:私有化部署(私有化部署) - bisheng-unstructured组件变更为非必须部署,简化部署流程,并且新增对 OCR SDK 的支持(替换原RT中的闭源模型提供文档解析模型的推理服务)。
- 增加 BishengLLM 组件: 可快速选择模型管理中已接入的 LLM,无需重复填写模型地址和 key>>BishengLLM(BishengLLM)
注:鉴于市面上已经存在 Ollama 等一批优秀的开源推理框架,与 bisheng-rt 模块功能存在部分重合,从0.3.4 版本开始,建议各位开发者使用上述开源框架进行各类模型(LLM、Embedding、Rerank)部署,bisheng-rt中闭源模型的能力未来将由 OCR-SDK 替代(本次dev1版本使用OCR SDK暂无法实现知识库问答溯源,一周后的Release版将支持,继续使用RT仍可以进行知识库问答溯源)。
对于暂时不想替换bisheng-rt的用户,可以继续使用,我们提供了相应升级方案,详见:版本升级注意事项(版本升级注意事项)
v0.3.3.dev2 发布
BISHENG 0.3.3 dev2 版
- 支持应用发布为需登录链接:支持通过需登录链接使用单个应用,适合企业内单应用嵌入场景>>发布助手: API 、免登录/需登录链接、发布技能
- 应用支持标签分类及筛选。
- 应用头像支持手动配置。
- QAgenerationchainV2 组件升级:支持自定义 question 和 answer 生成逻辑,放开更多 QA 生成相关参数。>>QAGenerationChainV2
- BishengretreivalQA 组件支持溯源功能。
- 导航栏支持隐藏 Github 和 帮助文档 icon >>Logo与产品名修改方法指南