-
Notifications
You must be signed in to change notification settings - Fork 1.1k
Open
Labels
bugSomething isn't workingSomething isn't working
Description
问题描述
使用本地复杂模型:ollama DeepSeek-r1:7b进行GA对的生成,文本块不是原本的文件内容
桌面设备(请完善以下信息)
- 操作系统:MacBook pro lntel
- 浏览器:谷歌浏览器(Chrome)
- Easy Dataset 版本:1.5.0
使用模型
- 模型提供商:ollama
- 模型名称:qwen2:0.5b-instruct
- 模型提供商:ollama
- 模型名称:DeepSeek-r1:7b
复现步骤
重现该问题的操作步骤:
1.使用Miner u 切片文件成功生成md文件
2.创建项目,并添加以上两个模型,并进行测试
3.使用qwen2:0.5b-instruct模型进行上传文件,并选取五个模块进行自动数据清洗,此时,文本块内容还是正常原文件的内容
4.在项目设置中,更改了提示词配置中的MGA增强答案生成的脚本
5.切换Deepseek-r1:7b的模型成功生成GA对,并且GA对的文体-受众对也是我所需要的,但此时,文本块内容并不是正常原文件的内容,添加了一些不属于原文件的内容(使用系统自带的提示词也是如此)
预期结果
1.使用任何复杂模型(包括 deepseek-r1:7b)生成 GA 对时,应保持文本块内容与原文件一致。
2.模型的处理只应在 GA 对生成 的输出中进行改写、补充和优化,不应直接修改或覆盖原文件的文本块内容。
3.附加的推断、总结或解释类内容应只出现在 GA 对的生成结果中,而不影响原文数据。
截图

其他相关信息
在此处添加关于该问题的其他任何相关背景信息。
Metadata
Metadata
Assignees
Labels
bugSomething isn't workingSomething isn't working