Skip to content

[Bug] #566

@Waint0311

Description

@Waint0311

问题描述
使用本地复杂模型:ollama DeepSeek-r1:7b进行GA对的生成,文本块不是原本的文件内容

桌面设备(请完善以下信息)

  • 操作系统:MacBook pro lntel
  • 浏览器:谷歌浏览器(Chrome)
  • Easy Dataset 版本:1.5.0

使用模型

  • 模型提供商:ollama
  • 模型名称:qwen2:0.5b-instruct
  • 模型提供商:ollama
  • 模型名称:DeepSeek-r1:7b

复现步骤
重现该问题的操作步骤:
1.使用Miner u 切片文件成功生成md文件
2.创建项目,并添加以上两个模型,并进行测试
3.使用qwen2:0.5b-instruct模型进行上传文件,并选取五个模块进行自动数据清洗,此时,文本块内容还是正常原文件的内容
4.在项目设置中,更改了提示词配置中的MGA增强答案生成的脚本
5.切换Deepseek-r1:7b的模型成功生成GA对,并且GA对的文体-受众对也是我所需要的,但此时,文本块内容并不是正常原文件的内容,添加了一些不属于原文件的内容(使用系统自带的提示词也是如此)

预期结果
1.使用任何复杂模型(包括 deepseek-r1:7b)生成 GA 对时,应保持文本块内容与原文件一致。
2.模型的处理只应在 GA 对生成 的输出中进行改写、补充和优化,不应直接修改或覆盖原文件的文本块内容。
3.附加的推断、总结或解释类内容应只出现在 GA 对的生成结果中,而不影响原文数据。

截图

Image

Image

其他相关信息
在此处添加关于该问题的其他任何相关背景信息。

Metadata

Metadata

Assignees

No one assigned

    Labels

    bugSomething isn't working

    Projects

    No projects

    Milestone

    No milestone

    Relationships

    None yet

    Development

    No branches or pull requests

    Issue actions