Andrej Karpathy 新帖子:
「人们对“向 AI 提问”的意义往往有着过于夸大的理解。AI 本质上是通过模仿人类标注者提供的数据训练出来的语言模型。与其将“向 AI 提问”视为某种神秘行为,不如将其看作“向互联网上的普通数据标注员提问”。
当然,这其中存在一些例外,例如在某些领域(如代码、数学、创意写作),公司通常会聘请技术熟练的数据标注员(所以你可以将其理解为在向这些人提问)。此外,当涉及到强化学习时,上述说法并不完全准确。不过,我之前曾撰文指出,强化学习反馈(RLHF)几乎称不上是真正的强化学习,而“真正的强化学习”仍处于早期阶段,并且主要局限于那些容易定义奖励函数的领域(例如数学等)。
总的来说(尤其是现阶段),你并不是在向某种神奇的 AI 提问,而是在向一位普通的数据标注员提问。只是这些标注员的平均特质被有损压缩成了一个统计型 token 运转器,也就是大语言模型。当然,这依然是非常有用的。这篇帖子是因为有人建议用 AI 来解决诸如治理国家之类的问题而引发的。总结一下:你并不是在问 AI,而是在问其平均数据标注员的某种混合精神。」
「当你询问例如“阿姆斯特丹十大景点”之类的问题时,某些雇佣的数据标注员可能在某个时刻见过类似问题,用谷歌和 Trip Advisor 等工具研究了 20 分钟,整理出一份包含 10 个景点的列表,这份列表随后就被视为正确答案,用于训练 AI 针对该问题的回答。如果所问的具体地点不在微调训练集中,神经网络会根据预训练阶段(互联网文档的语言建模)获得的知识,推断出一份统计上具有相似氛围的景点列表。」