零时古怪 - 中国第一时事资讯综合门户

零时古怪资讯网
提供最新的热点新闻资讯
首页 > 热点

前特斯拉AI总监盛赞DeepSeek RL技术突破人类限制

前特斯拉AI总监盛赞DeepSeek。如果只是模仿人类玩家,AI无法超越人类,但纯强化学习算法却能突破这种限制。

前特斯拉AI总监盛赞DeepSeek

近日,斯坦福大学李飞飞等人推出了S1模型。随后,李飞飞的学生、OpenAI早期成员与前特斯拉AI总监录制了一期长达3小时的视频,详细介绍了从神经网络的起源到GPT-2、ChatGPT再到最近的DeepSeek-R1等大模型的发展历程。视频讲解通俗易懂,即使没有技术背景的人也能轻松理解。

前特斯拉AI总监盛赞DeepSeek RL技术突破人类限制

在视频中,Andrej Karpathy对最近爆火的DeepSeek-R1论文进行了深入介绍,指出其性能与OpenAI的模型不相上下,并推动了强化学习技术的发展。他还高度评价了纯强化学习的学习能力,但也提到这种方法非常擅长“欺骗”模型,阻碍了其成为专业技术的步伐。Karpathy提出了一个名为“瑞士奶酪”的大模型能力框架,提醒人们不要完全依赖这些模型。

前特斯拉AI总监盛赞DeepSeek RL技术突破人类限制

Karpathy表示,在不久的将来,人们可能会看到能够执行长期任务的“智能体”,而人类将成为数字领域中智能体任务的监督者。

特别声明:以上文章内容仅代表作者观点,不代表本站观点或立场。如有关于作品内容、版权或其它问题请于作品发表后与我们联系。

分享到:更多 ()
来源:来源:网易 编辑:

评论

留言/评论 共有条点评
昵称:
验证码:
匿名发表