AI教母李飞飞最新讨论人工智能:为什么世界模型是下一个大事件

|版权所有 星号获取最新见解|发布者:Web3 天空之城 城主说|著名科技播客Lenny’s Post 最近采访了被誉为“人工教母”的李飞飞博士。智能。”riー・feifeifuェイの最新世界モデル、マーブルがサークル内でsukurinに登场しました。在这次新的采访中,他谈论了人工智能从“寒冬”到爆发的历史,特别是他开创性的 ImageNet 项目如何帮助引发了深度学习革命。在这次采访中,我们探索当前人工智能技术的局限性,并将其带入语言模型之外的下一个前沿:世界模型和空间智能。李飞飞还介绍了他创立的公司 World Labs 及其首款产品 Marble,并分享了关于机器人的未来、创始人的旅程以及以人为中心的人工智能开发理念。工作算法,而 GPU 是现代人工智能的黄金配方。快进到 ChatGPT,它仍然使用这三种成分。” • “超越语言,体现人工智能(即机器人技术) 理解世界的关键是空间智能。这是一个世界模型。” • “机器人更像是自动驾驶汽车,而不是大型语言模型。自动驾驶汽车是一个在二维表面上移动的金属盒子,目标是不接触任何东西。机器人是一个三维物体,在三维世界中运行,其目标是触摸物体。” • “人工智能没有任何人造之处。它受到启发、被创造,最重要的是,它影响着人类。人工智能现在做什么以及将来做什么取决于我们。” • “没有任何技术可以剥夺人类的尊严。人类尊严和自主权必须成为任何在人工智能中发挥作用的技术的开发、实施和治理的中心。 ”完整视频:时间戳章节:00:00:00 进化人工智能的教母:人工智能的乐观愿景和负责任的个人行动 00:09:37 追溯人工智能的历史:从“寒冬”到 ImageNet 的诞生和深度学习的基础 00:23:53 超越 AGI:人工智能的当前限制、创新需求和全球智能模型空间的核心价值 00:40:45 构建具身智能的挑战:数据、物理系统、全球实验室大理石模型的兴起 00:50:52 大理石的实际应用、3D模型与视频的区别、创始人的竞争谨慎 01:04:47 勇敢的职业选择精神:创立HAI、专注使命、人工智能的仁慈框架 “AI冬天”的到来:诞生。 ImageNet 和现代人工智能的黄金配方。如今,每家公司都竞相称自己为“人工智能公司”,但不到十年前,情况却恰恰相反。回忆起当年的事,李菲菲有些感慨地说。近日:“从2015年中到2016年中,一些科技公司避免使用‘人工智能’这个词,因为他们不确定这是否是一个负面术语。大约在2017年左右,企业开始称自己为人工智能公司。”这一转变的背后是由李飞飞开创的数据驱动的革命。 21世纪初,人工智能领域正处于所谓的“寒冬期”。尽管研究人员拥有各种复杂的数学模型,但他们普遍面临一个问题:训练所需的数据缺失。作为一名年轻教师,李飞飞深知人类的学习本身就是一个大数据的过程。 “我突然意识到,人类的学习和进化实际上是一个大数据学习的过程。大数据是让人工智能成为现实的一个非常重要但被忽视的元素。”基于这个想法,她和她的学生在 2006 年启动了雄心勃勃的 ImageNet 项目。其目标是提供具有大量标记图像数据的机器可以帮助人类儿童观察世界。就是模拟观察和学习的过程。经过艰苦努力,他们创建了一个包含 1500 万张图像、涵盖 22000 个概念的庞大数据库,并将其开源。转折点出现在 2012 年。杰夫·辛顿 (Jeff Hinton) 教授领导的多伦多大学团队使用 ImageNet 数据、用于 NVIDIA 游戏的两个 GPU 和深度神经网络算法,在当年的 ImageNet 挑战赛中取得了毁灭性的结果。这一刻被广泛认为是现代人工智能的“大爆炸”时刻。 “技术、大数据、神经网络和GPU这三者的结合是现代人工智能的黄金配方。”李飞飞强调。 “人工智能公开披露的时代就是ChatGPT的时代。如果你看看将ChatGPT带到世界的元素,这三个元素至今仍在使用。”从两个游戏 GPU 到数千个集群作为计算能力的一部分,这个“黄金配方”至今仍然为整个行业提供动力。人工智能的现状和下一个前沿:超越世界语言模型尽管大规模语言模型(LLM)取得了惊人的成就,但李飞飞清楚地认识到它们能力的局限性。他指出,下一代人工智能仍然无法完成许多人类认为理所当然的任务。 “今天我们要建立一个模型,播放一些办公室的视频,然后让它数一下椅子的数量。一个小孩子可以做到这一点,但人工智能做不到。”更不用说能够从牛顿这样的观察中推导出普遍的物理定律,或者拥有同情人类的情商。在他看来,人工智能的创新还远未结束,下一步是超越文本来理解物理世界。 “人类已经利用他们的空间智能和对世界的理解来做许多超越语言的事情他解释说:“除了语言之外,连接附加智能、连接具身人工智能(即机器人)、连接视觉智能的关键是空间智能,它帮助我们理解世界。”世界模型,顾名思义,是让我们能够理解、推理、交互、创造三维或四维世界(包括时间)的基础模型。这不仅是实现先进机器人智能的重要缺失环节,而且能够显着增强人类在科学发现、设计和创造等领域的能力。空间智能是人类认知的重要组成部分,就像沃森和克里克必须依靠空间想象力推导出双三维螺旋DNA结构一样。二维首款产品 Marble,这是一款创新应用程序,允许用户生成他们所创造的完整 3D 世界通过简单的短信和图像自由探索和互动。李飞飞表示:“Marble 与 Sora 等视频生成模型有着本质的区别。视频是一种被动观看的二维流,而 Marble 生成的是一个具有固有三维结构的可导航、可交互的空间。“我们非常希望创作者、设计师和开发者能够有一个模型,为他们提供一个三维结构的世界,供他们在工作中使用。”Marble 的应用场景已经迅速兴起。在虚拟电影制作领域,制作周期可以缩短 40 倍。游戏开发人员可以使用它来快速生成各种游戏环境。机器人研究人员可以使用它来创建丰富的模拟场景来训练 AI 代理。我什至认为,一个心理学家团队正在探索使用 Marble 为患者创建特定的沉浸式环境。和他们打交道。这证实了创新的经典法则:“下一个伟大的产品首先看起来像一个玩具。”机器人挑战和“惨痛教训” 机器人通常被视为人工智能的下一个大目的地,而世界模型是构建它们“大脑”的关键。然而,通向通用机器人的道路充满挑战。 AI领域有一个著名的“惨痛教训”。也就是说,具有大量数据的简单模型总是比具有较少数据的复杂模型表现得更好。不过,李飞飞指出,这个教训不能简单地在机器人领域复制。最大的障碍是数据。 “语言模型有一个完美的设置,其中训练数据是单词,最终结果是文本。但在机器人技术中,你想要的是动作,而训练数据(如在线视频)在 3D 世界中缺乏动作。”这个训练目标与数据的形状无关。状态之间的不一致是机器人学习的核心问题。福尔特此外,机器人是物理系统。 “机器人更像是自动驾驶汽车,而不是大型语言模型,”李飞飞说。 “自动驾驶汽车是一个在二维表面上运行的金属盒子,其目的不是触摸任何东西。机器人是在三维世界中运行的三维物体,其目的是触摸物体。” 2005年第一辆自动驾驶汽车原型诞生已经近20年了,这个问题仍然没有完全解决。机器人的复杂程度远远超过这意味着它的发展是一个漫长的旅程,包括硬件、软件、供应链和应用场景。以人为本:人工智能的终极责任与未来愿景 在突破科技边界的同时,李飞飞始终坚持以人为本。他是斯坦福大学以人为中心的人工智能研究所(HAI)的联合创始人。该研究所致力于构建以人类福祉为中心的人工智能发展框架。 “没有什么“关于人工智能,”他在国会作证时说道。“它受人启发,合格,由人创造,最重要的是,它影响人。”她坚信技术本身就是一把双刃剑,其最终走向完全取决于人类的决定。面对各行各业普通人共同的恐惧:“AI会取代我的工作吗?”他的回答充满力量和乐观。 “任何技术都不应剥夺人们的尊严。人的尊严和自主必须成为任何技术的开发、实施和治理的中心。”他鼓励艺术家利用人工智能作为增强创造力的工具,并鼓励包括农民和护士在内的所有公民积极参与有关人工智能发展的社会辩论,以确保该技术用于解决现实世界的问题,而不是加剧不平等。“非常重要的是,每个人,甚至像我这样的工程师,都必须真正相信人工智能的存在。”从点燃深度学习革命的火花,到构建理解物理世界的“世界模型”,再到倡导以人为本的治理框架,李飞飞的旅程一直遵循着一个简单的信条:技术的最终目标是增强人类,而不是取代人类,为全人类的尊严和共同未来服务。她领导了 ImageNet 的创建,他认识到人工智能需要大量标记良好的数据才能变得更加智能,这一数据集成为了斯坦福人工智能实验室 (SAIL) 当前构建和扩展人工智能模型的突破口,许多人工智能领域最优秀的人才都来自于此。她还是斯坦福大学以人为中心的人工智能研究所的联合创始人,该研究所致力于开发人工智能。它在确定地址时起着重要作用。他还曾担任 Twitter 董事会成员。 《时代》杂志将她评为人工智能领域 100 名最具影响力的人物之一。她也是联合国咨询委员会的成员,所以我可以继续说下去。在我们的谈话中,李飞飞简短地分享了人工智能领域如何发展到今天的故事。其中包括一个令人震惊的提醒:九十年前,称自己为人工智能公司基本上对一个品牌来说是死刑,因为没有人相信人工智能真的有效。今天的情况完全不同了。每家公司都是人工智能公司。我们还讨论了他对人工智能将如何影响未来人类、当前技术将带我们走向何方以及他为何如此热衷于人工智能的想法。安布伊建立一个世界模型以及世界模型到底是什么。最令人兴奋的是全球首款大型全球模型Marble的推出。它的推出恰逢该播客的推出,任何人都可以通过访问 Marble.worldlabs.ai 来体验它。这太疯狂了。请检查一下。李菲菲是一个了不起的人,但她对世界的影响却没有得到足够的关注。因此,我们很高兴她加入并与更多人分享她的智慧。菲菲,非常感谢您邀请我,欢迎来到播客。李飞飞:我很高兴来到这里,莱尼。我更高兴你能来到这里。蕾妮:我很高兴与你交谈。我想谈的事情有很多。您一直处于我们现在目睹的人工智能爆炸的中心。我们谈论了很多历史,但我认为很多人甚至不知道这是如何开始的。首先,为了给你一些想法,以下是来自《连线》的一些想法:让我读一下关于你的引言。在简介中,你sha你正在做的所有其他 cEpic 事情,但我认为这是设置背景的好方法。飞飞是一小群科学家中的一员,他们最近在人工智能方面取得了令人瞩目的进展,这个小组可能小到可以围坐在厨房的桌子旁。很多人称您为人工智能教父。与许多人工智能领导者不同,您看好人工智能。我不认为人工智能会取代我们。我不认为它会夺走我们所有的工作。你不会认为它会杀了我们。所以我认为从那里开始会很有趣。您如何看待人工智能随着时间的推移对人体的影响?李飞飞:是的。莱尼,首先让我澄清一下。我不是一个乌托邦主义者。这并不是说我不相信人工智能会对工作和人们产生一些影响。事实上,我是一个人道主义者。我认为人工智能现在和将来所做的一切都取决于而不是取决于人。因此,我相信技术对人类来说是净利益。如果你看一下悠久的文明史,我认为人类从根本上来说是一个创新的物种。如果你看看从几千年前到现在的文字记录,人类一直都在创新。我们自己创新工具。有了它,我们将改善我们的生活,改善我们的工作,建设我们的文明。我认为人工智能也是其中的一部分。这就是乐观的来源。的。然而,任何技术都是一把双刃剑。如果我们作为一个物种、作为一个社会、作为一个社区、作为个人不做正确的事,我们也会完蛋。莱尼:有这样一个词。我想这就是你在国会演讲中所说的。人工智能没有任何人造之处。它是受人启发的。它是由人创造的,最重要的是,它影响着人。没问题,但是这条线多棒啊。李飞飞:我很兴奋。我从 20 多年前开始研究人工智能,并一直在教授学生过去20年。我提醒几乎所有的研究生,当他们离开我的实验室时,他们的领域被称为人工智能,但其中没有任何人造的东西。莱尼:回到我之前所说的,这完全取决于我们,但是您认为我们在前进的过程中需要做什么?我们需要什么才能把它做好?我们怎样才能让事情步入正轨?你知道这是一个很难回答的问题,但是应该回答什么呢?另外,您有什么建议?你认为我们应该做什么?你有多少时间?我们如何调整人工智能?李飞飞:我觉得无论做什么,人都应该是有责任感的人。这是我们教给孩子的,也是我们作为成年人应该做的,无论你参与人工智能的开发、实施还是应用。也许我们中的许多人,特别是作为工程师,担任各种角色,作为负责任的个人,应该担心这一点,事实上我们应该非常担心。我认为没有如今每个人都应该担心人工智能,因为它会影响他们的个人生活。它将影响您的社区、社会和子孙后代。作为一个负责任的人来照顾他是第一步也是最重要的一步。走出“人工智能冬天” Lenny:好的。那么让我们退后一步,回到人工智能的起源。大多数人都听说过并开始关注今天所说的人工智能。我不知道几年前ChatGPT什么时候出来的,也许是三年前。李飞飞:三年前,我距离高三还有一个月的时间。莱尼:我明白。会是ChatGPT的到来吗?这是你心目中的里程碑吗?你觉得怎么样?我明白。我完全同意。但很少有人知道,这件事已经酝酿了很长时间。以前叫机器学习,现在一切都叫人工智能。许多人已经为此努力了很长时间。以及PE的“AI冬天”我们快要放弃的日子已经到来了。大多数人认为这个想法行不通并放弃。他们的工作确实是让我们走出人工智能冬天的火花,而且很快就会到来。你掌管着一个我们只谈论人工智能的世界,正如你刚才所说,人工智能将影响我们所做的一切。因此,我认为听听他对 ImageNet 之前的世界是什么样子的看法、他为创建它所做的事情、为什么它如此重要以及从那时起发生了什么,会很有趣。李飞飞:我的整个职业生涯都在人工智能领域度过,所以很难记得人工智能对每个人来说都是陌生的。对我来说,这是从我十几岁的时候就开始的个人好奇心。我对它现在成为我们文明的变革力量感到非常满意。一般都是文明级别的科技。所以那一段路程大概花了三十年,或者二十多年,二十多年。我很满意。那么我们从哪里开始呢?我什至都不是f第一代人工智能研究员。事实上,第一代可以追溯到 20 世纪 50 年代和 1960 年代。此外,艾伦·图灵在 20 世纪 40 年代走在了时代的前面,他大胆地向人类提出了这样的问题:“机器会思考吗?”当然,我有一个具体的方法来测试这个概念。它是一个思考机器,一个会话聊天机器人。按照他们的标准,我们现在拥有了思考机器。莱尼:但这只是轶事灵感。李飞飞:这个领域真正开始于20世纪50年代,当时计算机科学家发现如何使用计算机程序和算法来创建可以完成只有人类认知才能完成的事情的程序。这是1956年达特茅斯学院创始人的一次研讨会的开始。有一位教授,约翰·麦卡锡,后来来到斯坦福大学,创造了“人工智能”这个词。 20世纪50年代、1960年代、1970年代和1980年代是人工智能探索的早期阶段。陆军预备役。我们有逻辑系统和专家系统。他还首次进行了神经网络的研究。然后是80年代末、90年代和2000年代初。事实上,机器学习大约在 20 年前就开始了。它是计算机编程和统计学的融合。这种结合给人工智能带来了一个非常非常重要的概念。也就是说,纯粹基于规则的程序无法解释我们想象的计算机所具有的巨大认知能力。因此,我们需要使用机器来学习模式。希望如果机器能够学习这些模式,它们将能够做更多的事情。例如,如果你给它三只猫,希望它除了机器之外还能识别这三只猫。希望机器能够识别第四只猫、第五只猫、第六只猫以及所有其他猫。对于人类和其他有感知能力的动物来说,这是一种重要的学习能力。作为一个领域,我们了解机器学习。这是直到公元21世纪初期的情况恩图里。其实我进入人工智能领域的时候是2000年左右。那一年我在加州理工学院完成了博士学位。所以我是第一代机器学习研究人员的一员。我们已经在探索机器学习的概念,特别是神经网络。我记得我在加州理工学院选修的第一门课程叫做神经网络。但我们仍处于所谓的“人工智能冬天”,公众对此并没有太多关注。我们没有很多钱,但我们有很多想法。莱尼:很多人称您为人工智能教母。事实上,你们的工作是让我们走出人工智能冬天的火花。李飞飞:从2015年年中到2016年年中,一些科技公司避免使用“人工智能”这个词,因为他们不确定这是否是一个负面术语。该公司在 2017 年左右开始称自己为人工智能公司。 Lenny:有这样一个短语。我想你在通报情况时也是这么说的国会。人工智能没有任何人造之处。它是受人启发的。它是由人创造的,最重要的是,它影响着人。李飞飞:我并不是认为人工智能不会对就业和人产生影响。事实上,我认为人工智能现在做什么以及未来做什么取决于我们。这取决于人。我相信技术对人类来说是净利益,但我相信所有技术都是一把双刃剑。如果我们作为社会和个人不做正确的事,我们也会遇到麻烦。 ImageNet 的诞生和现代人工智能的黄金配方 Lenny:您有一个革命性的想法,即可以训练机器像人类一样思考,但它缺乏人类小时候必须学习的数据。李飞飞:我认为有两件事让我的职业生涯更接近现代人工智能的诞生。也就是说,人类是视觉性很强的动物,所以我们选择了看待人工智能通过视觉智能的镜头。我们稍后会详细讨论这一点,但我们的大部分智力都基于视觉、感知和空间理解,而不仅仅是语言本身。我认为它们是互补的。因此,我决定专注于视觉智能,在我的博士研究和早期教学生涯中,我和我的学生致力于解决北极星问题。这是物体识别问题的解决方案。这是因为对象认知是感知世界以及或多或少在对象层面上解释、推理和与世界交互的基础。我们并不在分子水平上与世界互动。我们不像有时那样与世界互动,但很少这样做。例如,如果你要拿一个茶壶,你不要说:“好吧,这个茶壶是用100块瓷器做的,把这100块瓷器给我。”将其视为一个对象并与之交互。所以说对象真的非常重要。所以我是第一批重新搜索者将其识别为北极星的问题。但问题是我是一个人工智能的学生,作为一个人工智能研究者,各种数学我都做过。包括神经网络和贝叶斯网络的模型。它包含大量的模型。有一个独特的问题:没有可用于训练这些模型的数据。作为一个领域,我们非常关注这些模型,但我们意识到人类学习以及进化实际上是一个大数据学习过程。人类通过许多经验来学习并持续学习,进化实际上是一个大数据学习的过程。如果你观察时间,就会发现动物在体验世界的过程中不断进化。因此,我和我的学生推断,使人工智能成为可能的一个非常重要但被忽视的元素是大数据。然后我在2006年和2007年启动了ImageDap项目。我们雄心勃勃。我想重新更新有关互联网上物体的图像数据。事实上,那时的互联网比现在小得多。所以我认为这个野心至少不是那么牵强。现在,认为少数研究生和教授可以做到这一点完全是幻想。莱尼:但这就是我们的工作。李飞飞:为了训练机器,我们需要使用尽可能多的物体图像信息。然而,对象很难学习。单个物体在图像中的呈现方式有无限的可能性。要使用数千个对象和概念来训练计算机,您需要向其展示数百万个示例。我们以其他研究人员的工作为基础,包括从事 WordNet(一种特殊形式的词典编纂形式)的语言学家的工作,并对来自互联网的 1500 万张图像进行了仔细分类,创建了 22,000 个概念的分类法。我们将它们集成到 ImageNet 中并向研究界开放。我们每年都会举办 ImageNet 挑战赛并鼓励每个人参与。我们继续我们自己的调查。然而,许多人认为 2012 年是深度学习的开始或现代人工智能的诞生。这是一年中的一年。这是因为由 Jeff Hinton 教授领导的多伦多研究小组参加了 ImageNet 挑战赛,并使用 ImageNet Big Data 和 MVDia 两个 GPU 成功创建了第一个神经网络算法,尽管该算法尚未从根本上或完全解决,但代表了解决对象识别问题的重大进步。而这三者(技术、大数据、神经网络和GPU)的结合就是现代人工智能的黄金配方。快进到引入人工智能的时刻:ChatGPT。如果我们看看 Chat 为世界带来 GPT 的元素,从技术上讲,这三个元素仍然在使用。今天的数据是互联网规模的,主要是文本,神经网络架构比 2012 年复杂得多,但仍然是神经网络和更多的 GPU,但仍然是 GPU。因此,这些这三个要素仍然是现代人工智能的核心。太棒了。莱尼:我从来没有听过完整版。我喜欢它以两个 GPU 开始。我喜欢这个。是的。我现在不知道,但有数千个,对吗?它的威力要大一个数量级。是的。我刚买了这两款 GPU,它们就像游戏 GPU。你会去 GameStar 这样的地方,人们会用它来玩游戏。正如你所说,这就是模型变得更加智能的方式。我基本上在我的播客上采访了一些世界上发展最快的公司,比如 Mercor、Surge 和 Scale。他们只是这样做并继续为实验室这样做,提供越来越多关于他们最感兴趣的标记数据。李飞飞:我记得 Scale 早期的 Alex Wong。我想我们可能还保留着您启动 Scale 时留下的电子邮件。他非常友好。解释 ImageNet 如何与 Scale 配合使用。他们不断向我发送电子邮件,讲述这件事对他们的影响。我很高兴看到这一点。蕾妮:安从你刚才谈到的内容中,我最喜欢的另一个收获是,这是做事时高度代理的一个例子。这就像推特模因。只是有些事情你可以做。你好,这是我。我们可能需要加快人工智能的发展。当时,它被称为机器学习,但这是大多数人使用的术语吗?李飞飞:我觉得它们可以互换使用。一定。例如,我记得那些公司,科技公司。我不会点名,但我记得早期的谈话,可能是从 2015 年中期到 2016 年中期。一些科技公司避免使用“人工智能”这个词,因为他们不确定这是否是一个贬义词。事实上,我记得鼓励每个人使用“人工智能”这个词。因为对我来说,人工智能是人类在追求科学技术的过程中提出的最勇敢的问题之一。我为这句话感到非常自豪。然而,有些人我们一开始我不确定。 Lenny:人工智能是哪一年开始成为贬义词的?李飞飞:2016年。我想那是10年前的事了。那就是改变。有些人开始称之为人工智能。但如果你看看硅谷的科技公司并遵循他们的营销术语,我认为这些公司在 2017 年左右开始称自己为人工智能公司。 Lenny:太棒了。世界变化非常快。是的。如今,你不能不称自己为mysmo一家人工智能公司。李飞飞:我知道。莱尼:整整九年了。是的。我的天啊。那么,关于这个故事,早期的故事,还有什么是人们不知道的吗?在我们讨论事情的进展和您正在做的工作之前,您认为有什么重要的事情吗?李飞飞:就像整个故事一样,我当然知道我被认为是故事的一部分,但也有很多英雄和调查员。我们谈论的是几代研究人员。甚至在我的世界里,有很多人激励着我,我在书中提到了他们。但我觉得在我们的文化中,尤其是在硅谷,我们倾向于将一项成就归因于另一项成就。虽然这是一个人的成就,但我认为这是有价值的。但请记住。人工智能是一个已有 70 年历史的领域,我们在这方面拥有几代人的经验,但没有人、没有人能够独自实现这一目标。人工智能的现状和下一个前沿:世界模型伦尼:好的。那么让我问你这个问题。我们似乎总是处于通用人工智能(AGI)的边缘。 AGI 是一个模糊的术语,人们使用它就好像 AGI 即将到来一样。它接管了一切。你好吗?你喝什么?您认为我们离通用人工智能还有多远?您认为按照目前的轨迹,我们能实现这一目标吗?您认为我们需要更多的进步吗?您认为我们目前的方法可以实现这一目标吗?李飞飞:Lenny,这句话非常有趣。我不知道有没有人定义过人工智能。定义范围从具有某种超能力的机器到在社会中经济上可行的参与者的机器。换句话说,赚取生活工资。这是人工智能的一般定义吗?作为一名科学家,我非常认真地对待科学并进入这个领域,因为我受到一个大胆问题的启发:“机器能否像人类一样思考和行动?”对我来说,这一直是人工智能的北极星。从这个角度来看,我看不出人工智能和通用人工智能有什么区别。我认为我们在这部分目标方面做得很好,比如对话式人工智能。然而,我认为我们还没有实现人工智能的所有目标。我想知道我们的祖先阿兰·图灵是否还活着。你让他将人工智能与一般人工智能进行对比,蒂姆,我会感到畏缩所以,因为我不想f所有人都陷入了深入研究人工智能和一般人工智能的定义的陷阱,我觉得一般人工智能更多的是一个营销术语,而不是一个科学术语。作为一名科学家和工程师,人工智能是我的北极星,也是我所在领域的北极星。如果每个人都可以随心所欲地称呼我,我会很高兴。莱尼:让我换个方式问吧。如前所述,ImageNet 和 AlexNet 的组件至今仍然存在。它基本上是 GPU、数据、标记数据、模型算法等。此外,上述模型似乎是这一轨迹上的重要一步。您是否认为这些相同的组件可以用来创建(我不知道)一个比我们现在拥有的智能 10 倍并改变世界各地生活的模型?您认为哪些方面还需要取得更大进展?我知道我们将讨论全球模式,这是其支柱之一。我认为有一个,但你认为还有其他吗?这是是一个瓶颈还是这只会推动我们前进并需要更多的数据、更多的计算能力、更多的 GPU?李飞飞:不,我绝对这么认为。我认为我们需要更多创新。我认为当前模型架构的缩放法则,随着更多的数据、更多的 GPU 和更大的规模,在这方面仍然有很多工作要做。但毫无疑问,还需要更多的创新。人类历史上还没有哪个深层次的科学领域达到了一定程度就说:“我完了,我已经停止创新了。”虽然人工智能是人类文明中最年轻的科学技术领域之一,但我们仅仅触及了表面。例如,正如我之前所说,我们将转向全球模式。今天我们将创建一个模型,播放一些办公室的视频,然后让模型数一下椅子的数量。这是即使是小孩子也能做到的事情。或者说有很多小学生能做而人工智能做不到的事情目前这是人工智能做不到的。更不用说思考像艾萨克·牛顿这样的人如何观察天体的运动并推导出方程或方程组。更重要的是,它支配着所有物体的运动。如今的人工智能不可能具备这种水平的创造力、推理能力和抽象能力。接下来,我们来看看情商。当你看到学生走进教师办公室时,与他们谈论他们的动机、热情、他们学习的内容以及他们正在努力解决的问题。当今的聊天机器人功能强大,但它们的对话无法获得当今人工智能的情感认知智能水平。所以有很多事情可以改进。我不认为创新已经结束。 Lenny:Demas 最近接受了 DeepMinds/Google 的一次非常有趣的采访。然后问他们:你们觉得怎么样?我们距离人工智能还有多远?会是什么样子呢?你没看到吗?有一种非常有趣的方法来解决这个问题。看看你是否能找到全部爱因斯坦的进步提供了截至 20 世纪末最现代模型的所有信息。到目前为止,我们从未离这个目标更近过。不,不是。李飞飞:其实情况更糟。让我们为人工智能提供牛顿没有的所有数据,包括现代天文物体的仪器数据。然后,它将其发送给人工智能,该人工智能创建一组 17 世纪的物体运动定律方程。目前的人工智能还无法做到这一点。莱尼:好吧,我们还没有接近,这就是我的意思。好吧,现在我们来谈谈世界模型。对我来说,这是真正出色的例子之一,说明您如何领先于人们的发展方向。因此,我们很早就了解到人工智能和神经网络需要大量干净的数据来学习。您长期以来一直在谈论全球模型的想法。创办一家公司来建造它。基本上,有一个语言模型。这是不同的。这是一个全球模型。让我们dis诅咒它是什么。现在,当我准备这次谈话时,埃隆也在谈论世界模型。黄仁勋还谈到了全球模式。我知道谷歌也在研究这个问题。我在这儿。你从事这项工作已经很长时间了。实际上,您刚刚发布了一些我们将在播客播出之前讨论的内容。我们先来说说什么是世界模型。为什么它如此重要?李飞飞:我很高兴有更多的人在谈论这件事。我一直在思考如何才能真正加速人工智能的发展。这就是我的一生。近年来,研究站点中出现的大规模语言模型和 OpenAI 对于像我这样的研究人员来说非常有趣。我记得 GPT2 大概是在 2020 年下半年发布的。我曾经是,现在仍然是斯坦福大学以人为中心的人工智能研究所的全职联席主任。那一刻,我记得普通大众并没有意识到认识到大规模语言模型的力量,但作为研究人员,我们可以看到未来。我与 Percy Leanne 和 Chris Bardeen 等 NLP 同事进行了很长时间的交谈。我们讨论了这项技术的重要性。斯坦福人工智能研究所,即以人为中心的人工智能研究所(HIAI),是第一个建立底层模型综合研究中心的机构。我们 Percy Leanne 和许多研究人员发表了第一篇关于基础模型的学术论文。这对我来说非常令人兴奋。当然,我来自视觉智能领域,但我一直在思考我们如何能够超越语言,因为人类已经拥有很多超越语言的空间智能和对世界的理解。想象一下非常混乱的紧急情况,例如火灾、交通事故或自然灾害。如果你置身于现场并思考人们如何组织起来拯救人们预防新的灾难和扑灭火灾,很多都是行动,是对物体、世界、人的自发理解和态势感知。语言是其中的一部分,但仅靠语言往往不足以扑灭大火。那么它是什么?我一直在思考这个问题,但我也对机器人技术进行了大量研究。将语言之外的额外智能与具体人工智能(即机器人技术)和视觉智能连接起来的关键是理解世界。我意识到空间智能是为了理解。然后,我想是在 2024 年,我在 TED 上发表了一场关于世界模型中的空间智能的演讲。 2022 年,我根据机器人技术和计算机视觉研究开始概念化这个想法。我变得非常清楚的一件事是,我们希望与最优秀、最聪明的工程师合作,尽快使这项技术成为现实。这就是我们成立一家名为 World Labs 的公司的原因。 “世界”二字在我们公司因为我们坚信世界建模和空间智能。 Marble 发布:任何人都可以创造的世界 Lenny:人们非常习惯聊天机器人,这是一种大规模的语言模型。思考世界模型的一个简单方法是,它基本上描述了一个场景并生成了一个场景。一个无尽探索的世界。我将链接到您发布的内容,以便稍后进行解释,但这只是一个简单的解释吗?李飞飞:那是一部分,莱尼。我认为理解世界模型的一个简单方法是:使用这个模型,任何人都可以通过图像或文本等提示在自己的脑海中创建任何世界,然后通过在那个世界中浏览、行走、收集物体、喷射、改变、改变和推理来与那个世界进行交互。例如: Lenny:如果消费它的人,消费这个世界模型输出的代理,是一个机器人,那么机器人可以规划它的路径并帮助它组织,例如厨房。李飞飞:所以世界模型是一个基础,可以用来o 推理、互动和创造世界。莱尼:非常好。因此,机器人被认为是人工智能研究人员的下一个重点关注点,也是影响世界的机器人。你在这里所说的是,机器人在现实世界中发挥作用缺少一个关键要素:对世界如何运作的理解。李飞飞:是的。首先,我认为有趣的不仅仅是机器人。但我认为你同意你刚才所说的一切。我认为世界建模和空间智能是重要的缺失部分。内置人工智能。我也不认为我们应该低估海洋对于人类的智能体现。人类可以通过人工智能的智能来提高。人类是语言动物,就像现在一样,但如果人工智能帮助他们执行语言任务,包括软件工程,人类将会得到极大的改善。我认为我们不应该,也许也不会谈论,低估人类作为具体的代理人,他们可以真正发挥作用。就像机器人一样,从世界模型和空间智能模型中获益。莱尼:这里最大的进步是机器人。如果一切顺利的话,这将是一个大问题。我想象我们每个人都会有机器人为我们做各种事情并帮助我们应对灾难。当然,游戏就是一个很好的例子,你可以从无到有地创建一个无限可玩的游戏。然后创造力就会变得有趣,你就会有乐趣,有创造力,梦想着新的、神奇的、安全的世界和环境。 狂野 李飞飞:还有设计。人类设计的范围从机器到建筑、住宅,甚至科学发现。其中有很多。我想以DNA结构的发现为例。如果我们回顾 DNA 发现史上最重要的部分之一,那就是罗莎琳德·富兰克林拍摄的 X 射线衍射照片。这是一张飞机的二维照片,照片的结构看起来像一个二维的照片。分数交叉。您可以在 Google 上搜索这些照片。但通过这张二维平面照片,人类,特别是两个关键人物,詹姆斯·沃森和弗朗斯·克里克,能够在三维空间中进行推理,并推断出 DNA 的高度三维双螺旋结构以及其他信息。它的结构不应该是二维的。它的结构不能用二维思维来推断。我们需要从三个维度思考并利用人类的空间智能。因此,即使在科学发现中,空间智能或人工智能辅助的空间智能也很重要。莱尼:这是一个很好的例子。克里斯·迪克森说:我想是的。下一件大事一开始看起来就像是一个玩具。我记得ChatGPT刚出来的时候,Sal Mom发推文说:这是我们用的一个很棒的东西,看看吧。它现在是历史上增长最快、改变世界的产品。很多时候,看起来只是“这很酷,玩起来很有趣”的事情d 使世界变得不同。李飞飞:是的。我们已经认识很多年了。但现在他们是世界实验室的投资者。精彩的。机器人挑战和“惨痛教训” 莱尼:好的。我问他我应该问他什么。它建议询问为什么这个困难的教训不太可能适用于机器人。首先,解释一下 IA 和机器人历史上的惨痛教训。李飞飞:在入门书上,我已经阅读了很多内容,但我在理查德·萨顿 (Richard Sutton) 的文章中学习了世界上所有的事情,并从根本上了解了 Premio Turing。我最近做了很多强化学习。理查德·迪乔(Richard dijo)是米拉斯·哈西亚(Richard Dijo)的历史学家,特别是人工智能算法开发的历史,它是简单的模型与许多数据的最终结果,是与数据相关的复杂模型的一部分。事实上,这篇文章是在几年后发表的。ImageNet 的介绍。对我来说这不是痛苦。这是一个很好的教训。 Creé ImageNet 是基于纸质基础的宏数据。是不是因为机器人上的困难?首先,我认为我们必须认识到我们今天所取得的成就。机器人是一种实验入门。这项研究远不如语言建模等成熟。许多人仍在尝试不同的算法,其中一些算法利用了大数据。这就是为什么我认为大数据将继续在机器人技术中发挥作用。但机器人技术的难点是什么?有几个方面。 Lenny:一是,数据很难获取。李飞飞:数据的获取要困难得多。你可以说它有网络数据。因此,在线视频正在被用于最新的机器人研究中。我认为在线视频发挥了作用。但作为从事计算机视觉工作的人,空间整数智能、机器人技术,鉴于语言模型的价值,我非常羡慕语言领域的同事。因为他们有一个完美的设置,他们的训练数据是单词,最终是标记,并且他们生成一个生成文本的模型。因此,我们想要得到的东西(让我们称之为目标函数)和训练数据中的东西完美匹配。但机器人技术不同。就连空间智慧和能量都不同。需要机器人操作。 Lenny:但是训练数据缺乏 3D 世界中的作用。李飞飞:这正是机器人在3D世界中要做的事情。因此,需要寻找不同的方法来贴合所谓的“凿孔”。我们有什么,大量的在线视频?与一些互补的数据、远程操作或合成数据、以及与数据中的“lecciones duras”的髋关节机器人有关的重要信息。我认为仍然有希望,因为我们正在做的全球建模工作会透露很多信息。对于机器人。但我认为我们必须小心。因为我们还处于早期阶段,数据还没有完全了解,“惨痛教训”还没有得到检验。我认为我们应该非常现实地看待机器人技术的“惨痛教训”的另一个方面是,与语言和空间模型相比,机器人仍然是物理系统。因此,机器人更像是自动驾驶汽车,而不是大规模语言模型。这非常重要。这意味着机器人不仅需要大脑,还需要身体和应用场景才能发挥作用。回顾自动驾驶汽车的历史,我的同事 Sebastian Thrun 说道:我的汽车在 2006 年或 2005 年赢得了斯坦福大学举办的第一届 DARPA 挑战赛。距离那辆自动驾驶汽车的原型公布已经过去 20 年了。 Lenny:我能够在内华达沙漠中驾驶我的 Waymo 130 英里,现在我可以在旧金山的街道上驾驶它,但我还没有完成。瑟尔未来还有更多。李飞飞:这是一个20年的旅程,汽车auTonomos是更简单的机器人。这些只是在二维表面上滑动的金属盒子,不应接触任何东西。机器人是一种三维物体,在三维世界中移动以触摸物体。所以这个旅程将会有很多方面和元素。当然,有些人会认为第一个自动驾驶汽车算法早于深度学习时代。换句话说,深度学习可以加速大脑的运转。我认为这是真的。这就是我对机器人技术感兴趣的原因。这就是我进入空间智能领域的原因,它让我感到兴奋。但与此同时,汽车工业也非常成熟。产品化还包括成熟的用例、供应链和硬件。所以现在是考虑这些问题的非常有趣的时刻。但可以肯定的是,本是对的。我们或许仍会吸取一些惨痛的教训。莱尼:当你做这份工作时,大蒜,你有没有您是否对大脑的工作原理以及它为我们做的这么多事情感到惊讶,就其复杂性而言,就像机器可以移动而不会撞到东西或跌倒一样,这样我们就可以更加尊重我们已经拥有的东西?李飞飞:是的。它的运行功率约为 20 瓦。这比我现在拥有的要好。房间里所有的灯泡都灭了。然而,我们能做的事情是有限的。事实上,我认为你在人工智能领域工作越多,你就越尊重人类。 Marble Lenny的诞生及应用:我们来谈谈你们刚刚推出的产品。大理石真是一个可爱的名字。我们将讨论它是什么以及为什么它很重要。尝试一下确实如此。我简直不敢相信。提供任何人都可以看到的链接。李飞飞:什么是漫威?我很兴奋。首先,Marble 是 World Labs 发布的首批版本之一。世界实验室已发布。 World Labs 是一家基础且尖端的建模公司。该公司由四位联合创始人资助,拥有 stro技术背景。我的联合创始人是贾斯汀·约翰逊、克里斯托弗·拉斯纳和本·米尔登霍尔。我们都来自人工智能、计算机图形学、计算机视觉的研究领域。我们相信,空间智能和世界建模同样重要,甚至更重要,并且与语言模型相辅相成。因此,我们想利用这个机会,打造一个汇聚前沿模型和产品的深度技术实验室。简而言之,Marble 是一个基于尖端模型构建的应用程序。我们花了一年多的时间构建了世界上第一个可以生成真实 3D 世界的生成模型。这是一个非常非常困难的问题。这是一个非常困难的过程。我们拥有一支由优秀技术专家组成的高素质团队创始团队。大约一两个月前,我们第一次了解到您可以创建一个可以使用文本和图像甚至使用多种请求和导航的世界简单的图像。如果您向 Google 注册,您将可以选择执行此操作,并且还可以移动它。然而,我们已经在此基础上进行了相当长的一段时间了。它仍然非常美丽。我想把它送到有需要的人手中。 Lenny:我们发现很多创作者、设计师、思考机器人模拟的人、思考可导航、交互式、沉浸式世界的不同用例的人以及游戏开发人员,都会发现这很有用。李飞飞:这会有帮助。这就是我们第一步开发 Marble 的原因。同样,这还处于非常早期的阶段。然而,这是世界上第一个实现这一目标的模型。而且这是世界上第一个可以直接通知用户的产品。我们称之为培育两个世界。莱尼:嗯,我正在玩它,这太疯狂了。这就像在中土世界中创建一个由小郡组成的世界,你可以在其中无尽地漫步,基本上就是这样。而且还是没有人重新,还没人。但这太疯狂了。你可以去任何地方。还有一个反乌托邦的世界。我只是看所有这些例子。是的。其实我最喜欢的是我不知道这是一个特性还是一个bug。事实上,在渲染所有纹理之前,您可以在某一时刻看到世界。我希望您能大致了解一下这个模型的情况。李飞飞:基本上,很高兴听到。是的。因为这就是我作为一名研究员正在学习的东西。因为带你进入那个世界的关键是对其特征的有意可视化。它不是模型的一部分。事实上,模型直接生成世界。但我们正在努力寻找将人们带入这个世界的方法。许多工程师研究了不同的版本,但最终他们最终决定了这一点。您不是唯一的人,很多人都告诉我们他们非常喜欢这种体验。对于我们来说,我们很高兴知道这种有意展示的功能确实让用户满意,而不仅仅是大硬核模型。莱尼:嗯,他们添加这一点是为了让人们更容易理解正在发生的事情并使其更有趣。哇,这很有趣。这让我开始思考大规模语言模型以及它们的想法和行为,尽管有所不同。李飞飞:是的。莱尼:这也让我想起了《黑客帝国》。这就像一次完整的《黑客帝国》体验。不知道这是否是你的灵感来源。李飞飞:我之前说过,这个项目有很多工程师参与。这或许就是他的灵感来源。莱尼:你来了。这是你的,它在你的潜意识里。是的。现在,对于任何想和我们一起玩或使用它的人。例如,您现在可以使用哪些应用程序?此次推出的目的是什么?李飞飞:是的。我们认为世界建模具有非常普遍的适用性,但我们也看到了一些非常有趣的用例,例如虚拟电影制作,因为您需要一个可以将相机与之对齐的 3D 世界。这样,您就可以定位正确地在摄像机上捕捉演员表演时的图像。我们已经看到了它令人难以置信的用途。事实上,我不知道你是否看过以 Marble 为特色的发布视频。由虚拟制片人制作。我们正在与索尼合作。他们使用大理石场景来录制这些视频。因此我们与技术美术师和导演合作,他们表示这将制作时间缩短了 40 倍。事实上,必须是40倍。事实上,这是不可避免的,因为我们只有一个月的时间来完成这个项目。而且……他们尝试拍摄很多东西。因此,Marble 极大地加速了视觉效果和电影的虚拟制作。这是一个使用示例。我们已经看到人们拍摄 Marble 场景,导出网格,并将其用于他们的游戏中,无论是 VR 游戏还是游戏,他们开发的一些有趣的游戏。我们曾经展示过一个机器人模拟的例子,由于我过去和现在仍然是一名从事机器人培训的研究人员,所以最大的挑战之一就是创建用户。综合数据用于训练机器人。这些合成数据一定非常多样化。他们来自不同的背景,需要不同的工作对象。实现这一目标的一种方法是在计算机上模拟它们。莱尼:否则,人类就必须为机器人建造所有资源。李飞飞:需要更多时间。因此,研究人员帮助我们使用 Marble 创建了这些合成环境。我们还收到了一些关于用户希望如何使用 Marble 的意外反馈。例如,一个心理学家团队给我们打电话,想用 Marble 来进行心理学研究。事实证明,他们研究的一些精神病患者需要了解他们的大脑如何对具有不同特征的不同潜水做出反应。例如,凌乱的、干净的,或者任何你能想到的。像这样的沉浸式场景对于研究人员来说很难获得,并且需要花费太多的时间和金钱来创建。借助 Marble,您几乎可以立即获得大量实验环境tly。我们目前看到了多个用例,VFX、游戏开发人员、模拟开发人员和设计师对此感到非常兴奋。 Lenny:这符合人工智能领域的发展格局。该播客还介绍了人工智能领域的其他领导者。并且始终尽早发布信息,以便您可以找出关键用例。 ChatGPTBT 的一位代表表示,当他们第一次推出 ChatGPT 时,他们想做的只是浏览 TikTok,看看人们如何使用它以及他们在谈论什么。这让他们有信心利用资源,并帮助他们了解人们真正想要如何使用它。我喜欢最后一个用例,例如治疗。我在想象一些恐高症、害怕看人、恐高症、以及如何对付蛇和蜘蛛之类的事情,但这……太棒了。李飞飞:其实昨晚有一个朋友打电话给我,问我恐高的问题,是否应该使用大理石。太好了哟你能够清楚地思考这一点。莱尼:因为我在想象类似暴露疗法的东西。例如,这对于暴露疗法来说是完美的。非常好。那么让我问你一个问题。我之前就应该问这个问题,但我认为它提出了以下问题:它与 VO-3 或其他视频生成模型有何不同?我知道,但这就是迄今为止人们所看到的。我们认为解释它与我们使用过的所有视频人工智能工具的不同之处可能会有所帮助。李飞飞:Warnap的观点是,空间智能从根本上来说很重要,而空间智能不仅仅与视频有关。事实上,这个世界并不是被动地观看视频通行证。我喜欢柏拉图如何用洞穴的寓言来解释这个愿景。他要求人们以一种不那么人性化的方式想象一个囚犯被绑在山洞里的椅子上,观看整场戏剧在他眼前上演。但即使现场戏剧就在我面前,现场戏剧呃,演员就是演员。在他背后。它只是被照亮,以便动作的阴影反射在洞穴的墙壁上。囚犯的目标和使命是找出正在发生的事情。 Lenny:E.这是一个非常极端的例子,但是它说明了观点是要理解三维世界或者四维世界。李飞飞:从两个维度去理解。所以对我来说,空间智能比简单地创建一个平坦的二维世界要深刻得多。对我来说,空间智能是创造、推理、交互和理解深层空间世界的能力,无论是在两个、三个还是四个维度,包括动力学等等。这就是世界实验室关注这一点的原因。当然,创建自己的视频的能力也可以成为其中的一部分。事实上,就在几周前,我们推出了世界上第一代可以在单个 H-100 GPU 上进行现场演示的实时视频。所以我们的部分技术就包括这个。但大理石有很大不同费伦特。因为我们真的希望创作者、设计师和开发人员手中拥有模型,为他们提供一个可以在工作中使用的三维结构世界。这就是大理石如此不同的原因。 Lenny:在我看来,这是一个可以做很多事情的平台。该视频正如您所描述的那样,是一个非常有趣且很酷的独立视频。你可以做到,就是这样,就是这样。继续前行。 Vidaifei:顺便说一句,Marble 允许您以视频格式导出。我的意思是,从字面上看,就像你说的,你可以去一个世界,假设这是一个霍比特人洞。事实上,尤其是作为一个创作者,你可以在导演的头脑中对如何移动摄像机有非常具体的方式,对吗?然后您可以将其从 Marble 导出为视频。创始人的旅程以及对才华横溢的莱尼的建议:建造这样的东西需要什么?你的团队有多大?您将使用多少个 GPU?有什么可以分享的吗?我不知道它有多私密,但创造一些东西需要什么就像你在这里发布的内容一样?李飞飞:这需要很大的脑力酸度。所以我们谈论的是每个大脑 20 瓦。从这个角度来看,这是一个很小的数字,但实际上令人难以置信的是,我们花了 5 亿年的进化才赋予了这些能力。目前我们有一个大约30人的团队。我们主要是研究员或研究工程师。但我们也有设计师和产品人员。事实上,我们坚信我们想要创建一家植根于空间智能深层技术的公司。但我们实际上正在构建一系列产品。这就是我们整合研发和营销的原因。当然,它使用了大量的GPU。这就是技术团队。莱尼:那是技术团队。黄仁勋听到这个消息一定会很高兴。恭喜您上线。我们知道这是一个重要的里程碑。我知道这需要付出很大的努力。所以我只想祝贺你和你的团队。告诉我们您创建公司的历程。那么你就是这家公司的创始人公司。干得好。多少年前?几年前,也许两三年前?李飞飞:一年前。莱尼:我明白。 18个月。有没有什么事情是你希望在开始之前知道的,或者是你希望在 18 个月前就秘密告诉菲菲的?李飞飞:我仍然希望我知道科技的未来。事实上,是我。我认为这是基本优势之一。只是我们通常可以比大多数人更快地预见未来。但仍然,不,未知和即将发生的事情是非常令人兴奋和美妙的。但我知道你问我这个问题的原因主要是关于技术的未来。也许你更……你看,我20岁的时候并没有创办这么大的公司。当我 19 岁时,我开始做干洗生意,但规模很小。莱尼:我们需要谈谈这个。李飞飞:然后我们资助谷歌云人工智能,然后我们资助斯坦福大学的研究所,这些是不同的事情。作为一个有蜜蜂的创始人走上了一条精心磨练的道路,我感觉自己比一个20岁的创始人更有准备,但当我想到AI领域的竞争有多大时,我仍然感到惊讶、惊讶,甚至有时偏执,无论是在模型方面,还是在技术本身方面,还是在人才方面。当我创办公司时,并没有关于某些人才有多昂贵的令人难以置信的故事。所以这些事件继续让我感到惊讶,我必须非常关注它们。莱尼:你所说的竞争是人才的竞争和事物发展速度的竞争。是的。是的。你提到了这一点,我想回到这一点,但当我回顾你的职业生涯时,我发现你已经去过所有重要的地方,人类聚集在一起,实现了今天正在发生的许多进步。显然我们谈论的是ImageNet,而且斯坦福大学的SAIL实验室也正在进行大量研究。 Google Cloud 取得了很多进步。世界卫生大会t 带您到这些地方?例如,对于那些想要提升自己的职业生涯并成为未来中心的人来说,是否有线索将他们从一个地方拉到另一个地方,并将他们拉向那些群体?这可能对人们有帮助。李飞飞:莱尼,那真是太棒了。这是个好问题。因为我也想了很多。当然,我也谈到了引领我走向人工智能的好奇心和热情。这更像是一颗科学北极星,如果人工智能成为现实,我真的不介意。这是其中的一部分。但我想我感谢自己最终选择在某些地方工作,包括世界实验室的成立。我是一个在智力上非常勇敢的人,可能是因为我父母的基因。我必须说,我们在雇用年轻人时考虑到了这一点。因为我认为如果一个人想要实现改变,这是一个非常重要的品质。这意味着,当您想有所作为时,您必须承认您正在创造或从事某些工作。新事物。人们还没有这样做。如果你有这种自我意识,你就需要允许自己变得勇敢和勇敢。例如,当我来到斯坦福大学进入学术界时,我非常接近所谓的终身教职,这意味着在普林斯顿大学永久工作,但我选择来到斯坦福大学,因为我热爱我的母校普林斯顿大学。当时斯坦福大学人才济济,硅谷的生态系统也非常好,我愿意冒着重新开始终身教职的风险。我即将成为第一位女性高管。销售。事实上,我想做那种工作,因为当时我是一名非常年轻的老师,我对那个社区很感兴趣。我没有花太多时间思考我所有的失败。当然,我很幸运有高水平的教授支持我,但我只是想有所作为。所以这和去谷歌非常相似。我想与像 Jeff Dean 和 Jeff Hinton 这样的人一起工作很棒的演示和很酷的人,还有 WorldLab。我也有同样的热情,并相信拥有相同使命的人们能够取得令人难以置信的成就。这就是我引导我思考的方式。不要对一切可能出错的事情想太多。插头。 Renee:我认为这是重要因素之一。这是关于减少对负面因素的关注,更多地关注人员、使命和你所热衷的事情。你怎么认为?李飞飞:是的。我想告诉所有人工智能领域的年轻人才、工程师和研究人员,你们中的一些人已经申请了世界实验室。我很荣幸你们大家都考虑到了这一点。尽管当今许多年轻人在决定工作时会考虑各个方面,也许他们在某个时候会想要这样做,但我有时想鼓励年轻人专注于重要的事情。招聘经理,当你看到令人难以置信的年轻人才,他们如此专注于考虑工作的每一个小方面和方面时,也许最重要的是,你的热情所在,aps往往只是处于辅导模式,并不一定要雇用你。您是否与该使命保持一致?你相信这个团队吗?重点关注您可以产生的影响以及您可以合作的工作类型和团队。莱尼:这很难。从事人工智能领域工作的人们面临着巨大的压力。现在发生了太多事情,给他们带来了太大的压力,太多的新闻,太多的事情,太多的 FOMO。这是真的。我可以看到压力。因此,这个建议非常重要。因此,这不在于哪家公司得分最快或谁获胜,而在于什么让你在工作中感到真正的成就感。我不知道。以人为本:人工智能的责任和未来的愿景 Renee:听着,我相信人文与人工智能研究所(HAI)目前正在斯坦福大学进行人机交互研究。你在那儿做什么?我认为该网站上仍然发生这种情况。李飞飞:人道人工智能研究所(HAI)是我和一群教授共同创立的,包括John H. Mendy教授、James Randi教授和Chris Manning教授。 2018 年初,我完成了在 Google 的最后一次学术休假。这给了我留在这个行业的机会。这对我来说是一个非常重要的决定,但我从谷歌的经历中学到的一件事是,人工智能将成为一种文明或一种技术。我突然意识到这对人类有多么重要,并于当年(2018年)在《纽约时报》上发表了一篇文章,讨论需要为人工智能的开发和应用制定一个指导框架。这个框架必须建立在人性和以人为本的基础上。我觉得斯坦福大学这个位于硅谷中心的世界一流大学,催生了从英伟达到谷歌的巨头,应该成为构建以人为本的人工智能框架并将其转化为研究、教育、政策和生态系统工作实践的思想领袖。这就是我创立 HAI 的原因。六七年后,该研究所成为世界上最大的人工智能研究机构,开展以人为本的研究、教育、生态系统、宣传和政策影响。它汇集了来自斯坦福大学八个学院的数百名教授,从医学到教育、可持续发展、商业、工程、人文和法律。我们支持跨学科领域的研究人员,从数字经济学到法律研究、政治学、药物发现和新算法等。事实上,我们也非常关注政治。因为当我们创办 HAI 时,我们意识到硅谷没有与华盛顿特区对话,也没有与布鲁塞尔或世界其他地区对话。鉴于这项技术的重要性,我们需要让每个人都参与进来。因此,我们创建了多个程序从国会训练营到人工智能指数报告和政策简报。我们特别参与其中。这包括支持特朗普第一届政府期间通过的《国家人工智能研究云法案》,以及参与州一级有关人工智能监管的辩论。所以我们正在努力工作,我仍然是领导者之一,尽管我很少参与运营方面的工作。我们不仅开发这项技术,而且我们以正确的方式使用它。莱尼:我不知道你还在做别的事。查尔,当你说话时,我记得李芒格说过要非常认真地对待简单的想法。我觉得你已经用不同的方式做到了这一点并且坚持了下来。多年来,他在很多方面产生的影响令人难以置信。我将跳过闪电提问环节,但我想问你最后一个问题。你还有什么?您还有什么想与我们的听众分享或留下的吗?李菲菲:我对 artifi 感到非常兴奋社会情报。我想回答我环游世界时每个人问我的问题。如果你是一名音乐家、一名教师、一名高中教师、一名护士、一名会计师、一名农民,你可以用人工智能扮演什么角色?或者它会占据我的生活吗?或者我的工作。我认为这是人工智能最重要的问题。我发现,在硅谷,我们倾向于发自内心地沟通,不是与人、像我们在硅谷的人或不像我们在硅谷的人,而是与我们所有人。我们倾向于使用“无限生产力”、“无限休闲”或“无限力量”等词语。但归根结底,人工智能是关于人类的。当我被问到这个问题时,我的回答引起了共鸣:我们都可以在人工智能中发挥作用。这取决于你做什么和想要什么,但任何技术都不应剥夺我们人类的尊严。人的尊严和自主权必须成为制定、实施和治理的中心所有技术的存在。因此,如果您是一位年轻艺术家并且热衷于讲故事,请拥抱人工智能作为一种工具。从hecho,采用Marble。我希望它对你来说是一个工具。因为你讲述故事的方式是独一无二的,世界现在需要它。但你如何讲述你的故事呢?你如何使用你的故事?这个令人难以置信的工具对于以最独特的方式讲述您的故事非常重要。这个声音需要被听到。即使你从农业中退休,人工智能仍然很重要,因为你是公民。您可以加入社区。我们需要对人工智能的使用和应用有发言权。您与您能够接触到的人合作,并鼓励每个人使用人工智能来让他们的生活更轻松。如果你是一名护士,至少在我的职业生涯中,我希望你将大量的精力投入到医学研究领域。由于护士过度紧张和过度劳累,我们认为医护人员应该得到人工智能的重大改进和支持智能技术,例如提供更多信息的智能摄像头和机器人辅助。随着社会老龄化,我们需要更多的支持来照顾人们。因此,人工智能可以发挥这个作用。莱尼:所以我想说的是,对于每个人,甚至像我这样的工程师来说,真正相信人工智能可以发挥作用非常重要。多么美妙的结局啊。这与我们已经开始的关于人工智能将在我们的生活中扮演的角色以及我们如何承担个人责任的对话非常吻合。最后一个问题,哪里可以找到弹珠?如果我想加入世界实验室,我应该去哪里?网址是什么?人们去哪里?李飞飞:你可以在世界实验室网站上找到。为了我们研究的进展。我有一个技术博客。在那里您可以找到一种名为 Marble 的产品。您可以在那里注册。从那里您可以找到我们的工作机会链接。你知道,我们在旧金山。我们喜欢与世界上最优秀的人才一起工作。莱尼:那太好了。非常感谢您访问我们。李飞飞:谢谢你,莱尼。
特别提示:以上内容(包括图片、视频,如有)由自有媒体平台“网易账号”用户上传发布。本平台仅提供信息存储服务。
注注意:以上内容(包括图片和视频,如有)由网易号用户上传并发布,网易号是一个仅提供信息存储服务的社交媒体平台。

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注