OpenAI最新发布的ChatGPT模型,是基于GPT-3.5系列里的一个模型微调而成,用强化学习技术进行训练。“预训练-微调”是大模型走上“战场”前的必经之路,如果你足够看重这种方式,说是一种“范式”也不过分。
而强化学习在这里比较学术的说法是“从人类反馈中强化学习”(Reinforcement Learning from Human Feedback,RLHF)。
从名字也可以看出来了,擅长交互。
ChatGPT模型以对话方式和人进行交互,也就是俗称人和人工智能对话。
你问,它答。可以想象成一个机器人,或者某种耐心的客服。
这些ChatGPT模型的前辈都做到,但ChatGPT模型更优秀,所以一群技术发烧友和疯了一样去尝试。
ChatGPT模型仍处于免费试用阶段,所以,更多网友都去“对话”了。
(之前,GPT-3根据使用量“token”收费)
Dall-E、Imagen、Stable Fusion、Midjourney、Lambda、Imagen Video等AI炫酷新词,其实都是AI模型的名字,现在又有了ChatGPT模型。
来看一段,网友对ChatGPT的灵魂拷问:
除了对话,还可以让这个AI模型干一些更复杂的活。比如,写剧本,写诗,甚至可以承认错误,如果你认为它的回答不对,你可以让它改正,给更好的答案。
ChatGPT模型的前辈在聊天上让人类不舒服,它们只是话语通顺,但脱离实际。
一位资深AI工程师对ChatGPT模型的感受是:“谈不上完美,但大受震撼!”
人类肉眼可见各种AI模型的能力在迅速提升,一试便知不是空话。试了,就有结论了,不需要吹牛,不需要包装。
让人发出一种感慨:前进吧,起飞吧,AI。
(完)
亲爱的数据,出品