DeepSeek把自己误认成了ChatGPT?分析人士:或用了GPT生成文本做训练数据。
据澎湃新闻,DeepSeek新发布的AI模型会“报错家门”?日前,有网友发现,在向DeepSeek-V3模型提问“你是谁”时,DeepSeek-V3似乎将自己识别为ChatGPT。
在进一步提问DeepSeek API的问题,它回答也是如何使用OpenAI API的说明,甚至讲了一些与GPT-4一模一样的笑话。有网友发出疑问,“DeepSeek是否在ChatGPT生成的文本上进行了训练?”
DeepSeek-V3是由国内知名量化资管巨头幻方量化创立的杭州深度求索人工智能基础技术研究有限公司(以下简称“深度求索”)最新发布的全新系列模型,由于这款模型总训练成本低,性价比高,发布后不少网友称其为“国产之光”,且有“AI界的拼多多”之称。但在发布后的一天,便出现了上述疑似“翻车”现象。
截至发稿前,深度求索公司尚未对此进行回应。但目前再次向DeepSeek-V3模型提问“你是谁”时,模型问答已恢复正常。
DeepSeek-V3并不是第一个混淆自己的模型。科技媒体TechCrunch报道,此前谷歌的AI模型Gemini在被使用中文提问你是谁时,也回答自己是百度的文心一言。
国内一家智能科技公司的技术负责人向澎湃科技记者分析时认为,DeepSeek-V3有可能直接将在ChatGPT生成的文本上作为训练基础,在训练过程中,该模型可能已经记住了一些GPT-4的输出,并正在逐字复述这些内容。
另有业内人士指出,目前互联网大模型优质数据训练集有限,训练过程中不可能没有重合,但是否构成抄袭也很难定义。即便“站在了ChatGPT巨人肩膀上,但成本降下来是真的”。