“AI教母”李飞飞团队诞生了一个全球最快独角兽公司。
近日,据报道,著名计算机科学家、美国国家工程院院士、美国国家医学院院士李飞飞创办的AI公司 World Labs,日前已完成两轮融资,最新一次融资额约1亿美元,公司最新估值已达10亿美元(约合72.6亿元人民币)。
成立于今年4月的World Labs,致力于发展 AI 的空间智能,以解决AI在三维空间感知和理解方面的难题。短短三个多月,World Labs投资方囊括了硅谷知名风投a16z、AI基金Radical Ventures等头部机构。
现年48岁的李飞飞,在最新一场斯坦福大学的演讲中表示,通用人工智能(AGI)和空间智能将填补“视觉”和“动作”之间的空白。“机器很快就能够像人类一样识别视觉对象。”
长期主导斯坦福大学 AI 研究的李飞飞,如今也加入到全球 AI 创业热潮,躬身入局推进AGI的未来。
“AI 教母”成长史:坚信数据对 AI 的重要性
李飞飞的名字,在 AI 学术界可以说是无人不晓。
李飞飞早年出生于北京,在成都长大,曾就读于知名的成都七中。直至1992年,16岁的李飞飞随父母赴美,后来一边在洗衣店帮忙,一边读完普林斯顿物理学学位。
家族因抗日战争迁徙影响了她的成长背景,包括父母和外祖父母。在家庭的影响下,父亲激发其探索欲,母亲则通过大量阅读培养了她跨学科视野和批判性思维,为日后的AI研究奠定了基础。
但在1999年,李飞飞在普林斯顿大学的学习生涯即将结束时,她要面临科学抱负与现实生活之间的抉择。
一方面,母亲的健康状况恶化,家庭的经济压力增大,使李飞飞不得不重新考虑自己的职业规划;另一方面,华尔街巨头提供的高薪职位和医疗保险对家庭来说无疑是一个大诱惑,但这也意味着李飞飞可能要放弃自己热爱的科学研究。
在母亲的开导下,李飞飞选择了继续追求自己的科学梦想,在母亲的鼓励下坚定了自己的道路。
普林斯顿大学期间,李飞飞选择了物理专业,但随后在研究生阶段转向计算机科学和神经科学,并在加州理工学院主要攻读电子工程博士学位,这种“交叉融合”的学习为她日后的AI研究奠定了基础。
同时在这一期间,李飞飞开始关注 AI 领域,尽管当时AI处于寒冬期,但她坚信,数据对AI的重要性。
博士毕业后,李飞飞加入了斯坦福大学 AI 实验室,开始了她的学术研究生涯。2006年,李飞飞获得了加州理工大学的博士学位,在伊利诺伊大学厄巴纳-香槟分校担任助理教授的职位。
在攻读博士期间,当时业界围绕计算机视觉和算法有这样的一个认知,许多研究人员认为,算法是计算机视觉的中心,如果把机器智能与生物智能做类比,那么算法就相当于机器的突触,或者说是大脑中错综复杂的神经回路。
李飞飞意识到了这种研究思路的局限性:如果训练算法的数据不能很好地反映现实世界,那么即使是最好的算法也无法很好地完成工作。李飞飞的想法是构建一个能够完全反映真实世界的数据集。
于是在偶然的机会,李飞飞结识了语言学家克里斯蒂安·费尔鲍姆,WordNet 项目的领导者。费尔鲍姆向李飞飞介绍了 WordNet ,由心理学和认知科学领域的先驱乔治·阿米蒂奇·米勒创立的项目。米勒在心理学研究中对语言的结构及其在人类认知过程中的所扮演的角色产生了浓厚的兴趣,设想在更大规模上描绘出语言的结构图。
在交谈中,费尔鲍姆提及了一个计划,旨在通过视觉示例,如照片或图表,来阐释WordNet中的每一个概念。尽管这个计划最终未能实现,但它激发了李飞飞的兴趣,成为了后来ImageNet项目的灵感来源。
2007年,李飞飞在斯坦福大学启动了ImageNet项目。
ImageNet是一个用于视觉对象识别软件研究的大型可视化数据库,包含超过1400万张图像、涵盖21800个类别的图像识别数据库。ImageNet的数据库结构基本上是金字塔型,包括目录、子目录和图片集,每一个节点(Node)相当于一个项目(Item)或子类别(Subcategory),且每个节点含有至少500个对应物体的可供训练的图片/图像。
2009年6月,ImageNet的初始版本正式发布,收录了1500万张图片,覆盖了22000个不同类别。这些图片从近10亿张候选图片中筛选出,并由来自167个国家的近5万名贡献者进行标注。
2010年,为了提升 ImageNet 的名气,李飞飞举办了ImageNet 大规模视觉识别挑战赛 (ILSVRC),旨在激发学术界和工业界的创新,推动计算机视觉技术的发展。
在ImageNet竞赛两年后的2012 年,发生了一件更大的事情:多伦多大学的 Geoffrey Hinton,Ilya Sutskever 和 Alex Krizhevsky 提交了一个名为 AlexNet 的深度卷积神经网络架构——至今仍在研究中使用——实现了准确率 10.8% 的大幅提升,高出第二名 41%。
而这一事件实现了我们今天看到的 AI 繁荣。Geoffrey Hinton后来因研发深度学习而获得图灵奖,而Ilya Sutskever则联合奥尔特曼(Sam Altman)创立了OpenAI——如今 AI 热潮的起点。
因此,ImageNet数据集项目是如今生成式 AI 技术的底层设施,包括ChatGPT技术也受益于ImageNet的数据支持,并且已成为很多深度学习算法和模型的重要测试平台。
2016年11月,李飞飞于接受了谷歌公司的邀请,出任副总裁并担任Google Cloud AI首席科学家。
李飞飞认为,谷歌在 AI 领域有着先进和丰富的应用场景。同时,谷歌为研究人员提供了充足的资源和支持,包括先进的计算设施、丰富的数据资源以及广泛的合作机会。这意味着,在谷歌,李飞飞能够接触到前沿的技术和广泛的应用场景,进一步推动她的研究工作。
在谷歌期间,李飞飞利用自己在计算机视觉、认知神经科学、计算神经科学和大数据分析等领域的深厚造诣,为谷歌的AI技术贡献了重要力量。在谷歌期间,李飞飞可能还与其他团队和部门建立了紧密的合作关系,共同推动谷歌在AI领域的创新和发展。
2018年底,李飞飞离开谷歌,全身心专注于斯坦福大学的 AI 研发工作,担任斯坦福大学教授和斯坦福AI实验室的负责人。
李飞飞创业3个月,公司估值高达70亿元
此次李飞飞的World Labs创业过程极其低调,没有官网,没有公开招聘,甚至公司名字直到此次融资才被外界所知。
早在2024 年1月,李飞飞离开美国斯坦福大学,开始为期两年的休假,彼时她在领英上将自己的状态改为“新手”和“新工作”,一度令人费解。
如今,真相浮现,World Labs正是这份“新工作”,这也是李飞飞的第一次创业,聚焦于 AI 的“空间智能”。
所谓,空间智能是指人们或机器在三维空间中的感知、理解和交互能力。这一概念最早由美国心理学家霍华德·加德纳(Howard Gardner)在多元智能理论中提出,让在大脑中形成一个外部空间世界的模式,并能够运用和操作。
空间智能让人有能力以三度空间的方式来思考,使人知觉到外在和内在的影像,也能重现、转变或修饰影像,从而能够在空间中从容地游走,随心所欲地操弄物件的位置,以产生或解读图形的讯息。
从广义上看,空间智能不仅包括对空间方位的感知能力,还包括视觉辨别能力和形象思维能力。而对于机器而言,空间智能则是指其在三维空间中的视觉数据处理能力,能够精准做出预测,并基于这些预测采取行动。这种能力使得机器能够像人类一样在复杂的三维世界中导航、操作和决策,从而超越传统二维视觉的局限。
今年4月举行的TED演讲上,李飞飞坦言,视觉能力引发了寒武纪大爆发,神经系统的进化带来了智能。“我们想要的不仅仅是能看会说的 AI,我们想要的是能做的 AI。”
在李飞飞看来,空间智能是“解决 AI 技术难题的关键法宝”。
为此,她展示一张猫咪伸出爪子要把玻璃杯推向桌子边缘的照片。她进一步解释称,人类大脑在这一瞬间可以评估玻璃杯的几何形状、在3D世界中的位置、与桌子和猫的关系,并且能预测接下来会发生什么,采取行动制止。“大自然创造了观察与行动的良性循环,这得益于空间智能。”
在她看来,通过增强AI的空间推理能力,可以实现更复杂的物理世界互动和导航。而空间智能的发展需要建立在先进的技术基础之上,包括三维视觉感知技术、时空数据处理与分析、深度学习等,这些技术将使机器能够像人类一样感知和理解三维空间,从而做出更加智能的决策和行动。
李飞飞表示,空间智能和语言智能将能够为具身智能赋能,以发展AGI。在具身智能领域,她带领的研究团队曾在2023年推出一项新成果VoxPoser,利用大语言模型(LLMs)和视觉语言模型(VLMs)来驱动机器人,并展示了根据口头指令让机械臂执行各种任务的演示视频,包括打开抽屉但要小心花瓶、拔掉充满电的手机、制作三明治等。
李飞飞强调,未来的AI应该具备空间智能,能够理解和与3D世界互动,这将推动AI的能力超越当前的水平。
“AGI旨在创造出能够在各种环境和任务中表现出人类水平智能的系统,而空间智能则是实现AGI的关键步骤之一。”李飞飞坦言。
有风险投资人描述了李飞飞创业公司的最新动向:World Labs正在开发一种能够理解三维物理世界的模型,本质上是对物体的物理特性、空间位置和功能的理解和模拟。
目前,李飞飞的项目受到VC圈的追捧。同时,李飞飞团队还在不断研发新的算法和技术,探索空间智能在自动驾驶、机器人导航、智能家居、虚拟现实等领域的应用,以进一步提升空间智能的表现和应用效果。
一场以李飞飞发起的“空间智能”新时代才刚刚开始。
AI 批量“生产”独角兽,警惕“泡沫爆发”
ChatGPT爆火600余天引发的新一轮 AI 创业热潮席卷全球,并且正以迅猛速度批量“生产”独角兽(估值超过10亿美金的初创公司)。
今年7月,95后团队创立、英伟达投资的 AI 创业公司Cohere完成5亿美元D轮融资,由思科、AMD、富士通、加拿大养老金投资管理公司PSP Investments及加拿大出口信贷机构EDC联合投资,估值达到惊人的55亿美元(约合人民币399.34亿元)。
无独有偶。
本月,成立仅1年的 AI 初创公司Skild AI完成3亿美元A轮融资,投资方包括孙正义的日本软银集团、贝佐斯旗下基金、Sequoia Capital(红杉资本)、光速创投、Coatue等,投后估值达到15亿美元。
另外,成立仅仅6个月Cognition Labs今年4月获一轮1.75亿美元融资,估值达到惊人的20亿美元。然而,虽然其团队研发了全球第一位接近人类的 AI 程序员 Devin,但整个公司却未产生任何实际营收,处于亏损状态。
在国内,大模型明星公司百川智能7月25日确认完成A轮融资,总融资金额达50亿元人民币,投资方包括阿里、小米、腾讯、亚投资本、中金、北京市人工智能产业投资基金、上海人工智能产业投资基金、深创投等机构,并且将以200亿估值开启B轮融资;月之暗面今年初也完成新一轮超过10亿美元融资,投资方包括红杉中国、小红书、美团和阿里,最新估值高达200亿元。
所以,AI 依然是2024年创投行业的热潮领域。
PitchBook数据显示,仅在过去三个月里,投资机构就向美国 AI 初创企业投入了超过 270 亿美元,全球在该领域的投资额约为 500 亿美元。
有投资人向钛媒体AGI坦言,很多企业高管和创业者都不愿意错过这一轮 AI 热潮。比如,原魅族高级副总裁杨颜日前成立新公司深圳群青,要做新一代AI交互终端。
但是,这股 AI 热潮正在形成投资“泡沫”,因此有人开始敲响“泡沫爆发”的警钟。
红杉资本合伙人最新发布的报告显示,AI行业需要创造 6000 亿美元的年收入才能维持下去;高盛也对生成式 AI 表示怀疑,认为科技巨头计划在未来几年在AI资本支出上花费1万亿美元,但几乎没有任何实质性的、可见的成果来证明这些投入是值得的。
就大名鼎鼎的OpenAI,作为 AI 领域佼佼者,预计今年营收为34亿美元,但投入研发就高达84亿美金,据称今年OpenAI将亏损50亿美元。
Mapsignals 首席投资策略师Alec Young表示:“最令人担忧的是,所有 AI 基础设施支出的投资回报率在哪里?投入的资金相当惊人。也许几年后就能收回成本。但我认为投资者意识到回报需要时间才能实现,而超大规模企业的收入在短期内会因投入巨额资金而受到损害。”
巨量资金涌入AI赛道,某种程度上也带来超高回报、超高风险的可能性。但是我们依然需要警惕,这场 AI “泡沫”即将爆发,会给 AI 创业潮最后留下一个什么样的世界。
(本文首发于钛媒体App,作者|窦悦怡、林志佳,编辑|林志佳、胡润峰)
声明:该文观点仅代表作者本人,中加头条系信息发布平台,我们仅提供信息存储空间服务。
发表评论 取消回复