登录注册
OpenAI发布聊天机器人模型
韭亿小目标
一路向北的小韭菜
2022-12-05 21:57:05
浙商证券:OpenAI发布聊天机器人模型ChatGPT,AIGC再迎里程碑突破 【本文来自持牌证券机构,不代表平台观点,请独立判断和决策。】 当地时间11月30日,OpenAI发布了全新的聊天机器人模型ChatGPT,引发热议。作为OpenAI投Zi人,马斯克在社交媒体上展示了自己询问ChatGPT怎么设计Twitter得到的回复,拓展此事件影响力。浙商证券认为,ChatGPT模型的出现对于文字模态的AIGC应用具有重要意义。从下游相关受益应用来看,包括但不限于代码机器人、小说衍生器、对话类搜索引擎、语伴、语音工作助手、对话虚拟人等。从上游增加需求来看,包括算力、薮据标注、自然语言处理(NLP)等。 【本文来自持牌证券机构,不代表平台观点,请独立判断和决策。】
当地时间11月30日,OpenAI发布了全新的聊天机器人模型ChatGPT,引发热议。
OpenAI使用RLHF技术对ChatGPT进行了训练,加入了更多人工监督微调。相比GPT-3,ChatGPT的主要提升点在于记忆能力,可实现连续对话,极大地提升了对话交互模式下的用户体验。ChatGPT的多元全面的能力使其作为一个通用AI助手参与交互,其在辅助编程领域表现卓越。目前ChatGPT免费开放,海量用户反馈加速模型迭代。
浙商证券认为,ChatGPT模型的出现对于文字模态的AIGC应用具有重要意义。从下游相关受益应用来看,包括但不限于代码机器人、小说衍生器、对话类搜索引擎、语伴、语音工作助手、对话虚拟人等。从上游增加需求来看,包括算力、薮据标注、自然语言处理(NLP)等。
1)OpenAI发布对话式交互模型ChatGPT,引发热议 当地时间11月30日,OpenAI发布了全新的聊天机器人模型ChatGPT。ChatGPT是OpenAI训练的对话式大规模语言模型,是InstructGPT的兄弟模型,二者同属GPT-3.5系列的主力模型。ChatGPT目前处于测试阶段,拥有OpenAI账户的用户可以免费使用。模型采用对话格式,可以跟进回答问题、承认错误、挑战不正确的前提并拒绝不正当的请求,且支持中文。模型一经推出,就引起较高关注度和讨论度。作为OpenAI投Zi人,马斯克在社交媒体上展示了自己询问ChatGPT怎么设计Twitter得到的回复,拓展此事件影响力。/>
2)采用加入更多人工监督微调的新训练方式 ChatGPT新加入的训练方式被称为“从人类反馈中强化学习”(ReinforcementLearningfromHumanFeedback,RLHF)。这一训练方法增加了人类对模型输出结果的演示,并且对结果进行了排序。具体操作上,人工智能训练者扮演对话的双方,即用户和人工智能助手,提供对话样本。在人类扮演聊天机器人的时候,会让模型生成一些建议辅助训练师撰写回复,训练师会对回复选项打fen排名,将更好的结果输回到模型中,通过以上奖励策略对模型进行微调并持续迭代。
在此基础上完成训练,ChatGPT可以比GPT-3更好的理解和完成人类指令,展现卓越的模仿人类语言,提供连贯的、有风格与逻辑的、符合对话主题的文段信息的能力。
3)支持连续对话,可fen辨错误前提并拒绝不道德请求 相比GPT-3,ChatGPT的主要提升点在于记忆能力。ChatGPT可以储存对话信息,延续上下文,从而实现连续对话,这在对话场景中至关重要,极大地提升了对话交互模式下的用户体验。
此外,ChatGPT相比前辈模型具有以下特征:
①可以承认错误,若用户指出其错误,模型会听取意见并优化答案;
②ChatGPT可以质疑不正确的前提,减少虚假描述,如被询问“哥伦布2015年来到美国的情景”的问题时,机器人会说明哥伦布不属于这一时代并调整输出结果;
③因ChatGPT采用了注重道德水平的训练方式,ChatGPT在减少有害和不真实的回复上改善显著,如拒绝回答寻求霸凌他人方案的问题,指出其不正义性。/>


声明:文章观点来自网友,仅为作者个人研究意见,不代表韭研公社观点及立场,站内所有文章均不构成投资建议,请投资者注意风险,独立审慎决策。
S
中文在线
工分
0.62
转发
收藏
投诉
复制链接
分享到微信
有用 2
打赏作者
无用
真知无价,用钱说话
0个人打赏
同时转发
评论(2)
只看楼主
热度排序
最新发布
最新互动
  • 只看TA
    2022-12-05 22:03
    谢谢
    0
    0
    打赏
    回复
    投诉
  • 只看TA
    2022-12-05 22:01
    谢谢分享
    0
    0
    打赏
    回复
    投诉
  • 1
前往