专给 ChatGPT“找茬”,OpenAI 训练 CriticGPT 模型以检索输出内容错误
作者:admin 发布时间:2024-06-28 09:02 分类:资讯 浏览:19 评论:0
导读:IT之家6月28日消息,当地时间27日,OpenAI宣布基于GPT-4训练了一个名为CriticGPT的模型,用于查找ChatGPT聊天机器人输出内容中的...
IT之家 6 月 28 日消息,当地时间 27 日,OpenAI 宣布基于 GPT-4 训练了一个名为 CriticGPT 的模型,用于查找 ChatGPT 聊天机器人输出内容中的错误。它可以撰写评论,强调 ChatGPT 生成答案中不准确的地方。
据介绍,CriticGPT 旨在协助人类 AI 训练员完成工作 —— 使用一种名为“从人类反馈中强化学习(IT之家注:Reinforcement Learning from Human Feedback,RLHF)”的技术来训练、改进 GPT-4 的回答。
然而随着 ChatGPT 的准确性日益提升,错误越来越隐蔽,导致 AI 训练员的工作越来越“难做”。OpenAI 对此解释称,这是 RLHF 的基本局限之一 —— 模型逐渐变得比任何可以提供反馈的人都更博学,模型的协调可能也会随之变得越来越困难。
目前,当 CriticGPT 试图从 ChatGPT 的回答中发现错误时,它的一双“鹰眼”就会发挥作用。OpenAI 指出,现实世界中的错误可能遍布答案的多个部分,这是 CriticGPT 未来需要解决的问题。“我们的工作重点是可以在一个地方指出错误,但将来我们也需要解决分散的错误。”
广告声明:文内含有的对外跳转链接(包括不限于超链接、二维码、口令等形式),用于传递更多信息,节省甄选时间,结果仅供参考,IT之家所有文章均包含本声明。
- 上一篇:羊肉泡馍的做法与配料,羊肉泡馍配料
- 下一篇:联想控股公布袁力获委任为独立非执行董事
相关推荐
你 发表评论:
欢迎- 资讯排行
- 最新留言
-
- 傻逼,标题狗,你怎么不死呢
- 亲爱的朋友:您好!中国各地出现了新冠变种毒株JN.1,传播速度比原来的XBB变种加快七到八倍,对免疫逃脱能力也进一步加强,最新的疫苗对它没有保护力,各地死亡人数在持续攀升,很多病患突然猝死。古今中外的预言也说了这几年人类有大灾难,如刘伯温在预言中说 "贫者一万留一千,富者一万留二三”,“贫富若不回心转,看看死期到眼前”, 预言中也告诉世人如何逃离劫难的方法,真心希望您能躲过末劫中的劫难,有个美好的未来,请您务必打开下方网址认真了解,内有躲避瘟疫保平安的方法。网址1:https://d1u7crz1a1vl7x.cloudfront.net/23gj 网址2:bitly.net/xbbbx 网址3:https://github.com/19920513/www/blob/master/README.md?saa#1