
web测评
2023/04/10阅读:79主题:萌绿
【速围观】ChatGPT原理是什么?技术小白就能看懂的ChatGPT原理介绍
大家好啊,欢迎关注Ai星际,在这里将为你持续提供有关于AI行业的最新资讯与服务,今天先与大家简单的分享一下ChatGPT的原理。
ChatGPT是一种对话系统自然语言生成模型。它基于GPT模型,可以根据输入的文本生成易于理解的自然语言输出。
ChatGPT包含多个训练步骤,包括使用GPT大模型进行预训练、有监督学习初始化模型、训练奖励模型和使用强化学习优化模型等。这些步骤共同构建了ChatGPT功能强大的对话系统。
这货已经在网上火了近半年,各种花式骚操作让人眼前一亮。我自己现在也在用ChatGPT来辅助写代码改bug,效果溜的简直没边了!真是上班8.0,摸鱼7.9。

它是基于GPT模型改进优化而来的,主要应用于对话场景。它本身也是一个大型语言模型,可以生成各种文本类型,但是ChatGPT特别专注于对话的生成。
通过上下文的理解,ChatGPT能够像人类一样自动生成文本对话。下面这张图是OpenAI官方介绍的ChatGPT原理图,接下来我会按照这几步为大家解释。

文字接龙GPT大模型
GPT系列模型的核心思路就是让AI通过学习大规模通用数据中的文本接龙,即掌握基于上下文内容生成后续文本的能力。
这种训练方法不需要人类标注数据,只需要给出一段文本的前文和遮住其后续文本,然后将AI生成的回答与语料库中的下文内容进行比对来训练AI。
ChatGPT作为GPT系列的第三代,是在GPT3.5模型的基础上做的优化,该模型在万亿级别的通用文字数据集上进行了训练,几乎可以完成自然语言处理的绝大部分任务,例如完形填空、阅读理解、语义推断、机器翻译、文章生成和自动问答等等。
比如,如果我们告诉GPT“花谢花飞花满”,它就能够生成最可能的下一个字的结果。但由于下一个字有各种可能性,比如“花满天”、“花满地”、“花满园”都是可行的,因此GPT每次输出的结果都会不同。

有人类监督的GPT训练初始模型
虽然GPT能够学习文字接龙,但它仍然不知道如何给出有用的回答。例如当问GPT“世界上最高的山是哪座山?”时,它会生成一系列通顺的答案,如“你能告诉我吗?”,“珠穆朗玛峰”,和“这是个好问题”。然而,“珠穆朗玛峰”才是更符合人类期望的答案。

研究人员发现,仅靠学习文字接龙,GPT无法给出有用的答案。因此他们采用了“有监督训练”的方法,即让人类提供特定问题的正确答案,以引导AI产生符合人类期望的回答。
这种方法可以让AI往人类希望的方向进行文字接龙,提供正确且有用的答案。在这个过程中,研究人员只提供了数万条数据进行训练,而不是为所有问题和答案都提供参考。
由于GPT本身就有能力生成正确的答案,这些数据主要是为了告诉AI人类的偏好,并为其提供一个方向上的引导。这样我们就得到了一个简化版的ChatGPT模型。

引入Reward模型,优化GPT的学习
为了改善 ChatGPT 模型的性能,我们可以采用 AlphaGo 的自我对弈思路,大量对话练习来提升模型回答问题的能力。但 GPT 没有围棋那样的规则,如何判断其回答的好坏呢?
这时就需要一个「老师模型」,即 Reward 模型来辅导 GPT 的学习。Reward 模型可以根据人类评分标准,对GPT回答的问题进行评估和反馈,帮助它逐渐纠正错误、提高表达效果。为了训练这个模型,研究人员让GPT给出多个答案,并由人类按优先级排序,然后基于这些评价数据训练了一个符合人类期望的 Reward 模型。
这种方法既能让模型不断地自我完善,提高其对话质量,又可以让人类更加方便地参与到机器学习的过程中。

AI指导AI,强化学习优化模型
现在的AI都成熟了,可以自我指导自己了。为了实现AI指导AI,我们需要用上强化学习技术。这种方法就是让AI不断尝试、发现错误并改进,以此来逐步提高自己的能力。
AI可以通过实践不断成长,越学越好,越来越强。这种方法非常有效,因为它可以让AI自动地从错误中吸取教训,并快速适应新情况、新挑战。

在前两步训练得到的模型的基础上,我们现在可以开始建立完整版的ChatGPT。具体来说,我们给ChatGPT 随机提出一个问题,并根据Reward模型(老师模型)对回答进行评分。
然后AI就可以根据这个评分去调整自己的参数,以便在下一轮问答中表现更好。
重复这个过程,ChatGPT会不断地自我学习和完善,最终成为一个强大的AI对话系统。这种方法非常有效,因为它可以让AI不断改进、自我完善,从而逐渐提高自己的能力,成为一个真正有用的AI工具。

总结
ChatGPT是一个文字接龙高手,擅长对话。它似乎能够产生自然流畅的回答,但实际上这些回答有时缺乏逻辑和正确性,往往是“胡说八道”,闹出了不少笑话。
虽然ChatGPT的表现可能令人失望,但它还有很大的改进空间。通过引入更多的数据和更复杂的算法,我们可以让ChatGPT变得更加智能,理解更深层次的语义和逻辑关系。
尤其是最近闹的沸沸扬扬的GPT-4,最终我们可以期待ChatGPT会成为一款真正实用的AI工具,提供高质量、准确、丰富的答案,来满足人们生活中的各种应用需求。

Ai星际
![]()
驾驭智能未来,引领新时代
作者介绍

web测评
web测评,做一枚开源有态度的程序猿。