币圈网报道:
安德鲁·巴托(Andrew Barto)和理查德·萨顿(Richard Sutton)因其在强化学习方面的基础工作而获得了计算机上的最高荣誉,但并没有浪费任何时间使用他们的新平台来发出有关行业不安全AI开发实践的警报。
两人被宣布为2024 ACM A。M.图灵奖在星期三,经常被称为“计算机奖”,并伴随着由Google资助的100万美元的奖金。
他们不简单地庆祝自己的成就,而是立即批评了自己认为危险的AI技术部署。
巴托告诉《金融时报》。 “工程实践已经发展为试图减轻技术的负面影响,我看不出正在开发的公司所实践的。”
他们的评估比喻了当前的AI开发实践,例如“建造桥梁并通过使用它来对其进行测试”,而无需进行适当的安全检查,因为AI公司试图优先考虑业务激励措施而不是负责任的创新。
二人的旅程始于1970年代后期,当时萨顿(Sutton)是马萨诸塞大学巴托(Barto)的学生。在整个1980年代,他们开发了强化学习,这是一项技术,即AI系统通过奖励或罚款通过反复试验学习 - 很少有人相信这种方法。
他们的作品最终达到了1998年的开创性教科书“强化学习:简介,“被引用了将近8000次,成为了一代人AI研究人员的圣经。
ACM总裁Yannis Ioannidis在一个中说:“ Barto和Sutton的工作表明了在我们领域中采用多学科方法来解决长期挑战的巨大潜力。”公告。 “强化学习继续增长,并为进一步的计算和许多其他学科提供了巨大的潜力。”
100万美元的图灵奖是随着强化学习的继续推动机器人技术,芯片设计和大型语言模型的创新,从人类反馈(RLHF)成为Chatgpt等系统的关键培训方法。
尽管如此,两人的警告与计算机科学领域的其他知名人士的关注不断增加。
Yoshua Bengio本人是Turing Award的获得者,公开支持他们的立场布鲁斯基.
他说:“恭喜Rich Sutton和Andrew Barto获得了Turing奖,以表彰他们对ML的重要贡献。” “我也支持他们:在没有正确的技术和社会保障措施的情况下向公众发布模型是不负责任的。”
他们的位置与杰弗里·欣顿(Geoffrey Hinton)的批评,另一位Turing Award奖得主(称为AI的教父)以及AI高级研究人员和高管的2023年声明,包括Openai首席执行官Sam Altman,呼吁减轻AI的灭绝风险作为全球优先事项。
前Openai研究人员提出了类似的担忧。
扬·莱克(Jan Leike)最近辞去了Openai Alignment Initiatives的负责人的职务,并加入了竞争对手AI Company Anthropic,指出安全重点不足,写道:“建造比人类更聪明的机器是一项固有危险的努力。”
莱克说:“在过去的几年中,安全文化和流程已经倒退了闪亮的产品。”
另一位前OpenAI安全研究人员Leopold Aschenbrenner称该公司的安全实践“怪异地“与此同时,保罗·克里斯蒂安诺(Paul Christiano)以前也领导了OpenAI的语言模型一致性团队,他建议可能有一个”10-20%的机会AI接管,[或大多数人都死了。”
尽管警告了,但Barto和Sutton对AI的潜力保持了谨慎乐观的看法。
在面试借助Axios,两者都建议目前对AI的恐惧可能会被夸大,尽管他们承认可能有重大的社会动荡。
巴托告诉阿克西奥斯说:“我认为,如果要谨慎行事,这些系统有很多机会可以改善生活和社会的许多方面。”
萨顿将人工通用情报视为分水岭的时刻,将其构建为在没有生物学进化的情况下向世界引入新的“思想”的机会,这绝对是为人类在未来与知名机器互动的大门。
编辑塞巴斯蒂安·辛克莱(Sebastian Sinclair)