5月23日,36氪举办「颠覆·AIGC」产业发展峰会。本次峰会汇聚产业力量,共同探讨企业、行业在面临变革时的应对策略,分享思考,探索和发现产业中最具潜力的企业与最具价值的技术,在激荡的环境中探寻前行的方向。
圆桌论坛:ChatGPT的第一性原理:通往AGI的路上还有哪些系统性机会?
3位嘉宾分别从AIGC+电商行业、AIGC+数字化转型,以及资本视角,对于不同领域如何看待大模型浪潮下的机遇与挑战、如何推动AIGC应用大范围商业落地,以及着眼于未来AI2.0的发展方向充分阐述了各自的观点。
乐言科技创始人兼CEO沈李斌谈到:我们如果要判断是否需要探索一个场景,评估它是否有价值是一方面,另一方面也需要去把握节奏,即判断现在是否是合适的时机、这个技术是否能支撑服务要求的体验,以及率先入场是否能将技术壁垒变成生态壁垒。
乐言科技创始人兼CEO沈李斌
松禾资本董事总经理闫阳认为:纵观全球科技创新数十年的磅礴发展历程,越是颠覆性的创新越需要「第一性原理」的演绎思维与实际行动。毋庸置疑,通用人工智能与AIGC为现今的世界注入了无与伦比的强大科技源动力,希望所有参与这场盛宴的伙伴们都要好奇不息、思考不止、探索不停,寻美而求真,为这个行业的发展贡献积极力量。
松禾资本董事总经理闫阳
中科智云CTO李源表示:机器视觉领域的深度学习模型同样具备智能涌现的可能,而处理大规模样本至关重要。中科智云的X-Brain平台结合预训练模型和小样本技术,可实现强大的样本自标注。我们将继续训练图像领域的大模型,降低大模型的训练和运营成本,为行业应用创造新机遇。
中科智云CTO李源
以下是圆桌论坛实录,经36氪摘编:Ben:各位嘉宾、各位观众大家好,我是36氪分析师Ben,非常荣幸地介绍本场圆桌的三位嘉宾,也请每位嘉宾做一个简单的自我介绍。
沈李斌:乐言科技为电商行业提供AI SaaS+ 全链路数智化解决方案,包括智能客服机器人、跨境出海电商工具、智能CRM、低代码RPA、电话机器人等AI产品。我们近期也推出了原创研发的国产行业大模型体系。很多人问我,ChatGPT是否会给客服机器人带来冲击,我觉得其实并不会,这部分之后我会详细谈。
闫阳:大家好,先简单介绍一下我们的团队,松禾资本成立于1996年,到现在已经有27年的历史。松禾资本早期以科技投资、产学研孵化、科技成果转化为特色,启航于深圳,目前在上海、北京、广州、深圳和川渝都有办公室。我们团队早期成员的背景也比较多元化,早期基本都是围绕大型企业和高校院所做一些孵化投资,同时也做一些陪伴。
李源:大家中午好,中科智云是一家人工智能科技公司,专注提供数字化生产与运营的行业算法平台,助力建造、交通、工业等领域实现数字化转型。我们围绕公司的核心平台X-Brain,进行模型训练。比如在工业领域,我们提供人工智能巡检、自动化机械操作、设备无人化操作等方案。我们是图像赛道,AIGC其实给我们很多启发,我们认为GPT这样的大模型,其中的思维和实践经验也可以应用到机器视觉上面。早在2年前,我们就在机器视觉的工具平台上提供大规模预训练模型,并实现了小样本标注,达到主动学习的标注,取得了不错的效果。
Ben:今天这场圆桌的主题是用第一性原理来看实现AGI的路径上存在哪些系统性的机会。作为终端消费者的立场来看,虽然大模型已经火了半年时间,但是我能够用到的还是简单对话和简单绘图之类的功能,希望各位从自己身处产业一线的经验来谈一下,目前大模型和AIGC可能给行业带来哪些变量?
沈李斌:和创业公司在做通用大模型,赛道竞争比较激烈。反观深耕行业大模型应用的垂直赛道,现在可能是一个暗流涌动的状态,实际上在一些领域已经取得了非常大的进展,包括法律、金融等。我分享一下在电商赛道,我们所做的一些事情。基于乐言电商GPT大模型,我们已经开发五到六个AIGC应用,目前使用这些应用的商家有上千家,实现了在日常工作中将大模型能力整合至业务里。
对企业来说,大模型应用可以分为两方面,一方面是用于提升C端消费者体验,另一方面是提高运作效率。
首先,从C端体验来说,本来就有数万商家在使用我们的客服机器人,基于判别式AI技术做的客服机器人性能还不错,至少能回答70%的问题,但是针对一些开放式问题和生成式问题,原先的模型很难进行处理。目前我们补上了这块短板,生成式能力的提升使得以前回答不了的问题得到了解决,目前也已经看到了比较好的反馈。
其次,从提高内部工作效率的方面来讲,我们有一部分业务是做出海电商。对商家而言,制作商品详情页的难度较大,一个原因是拿到的中文素材比较简短,其二是将这些素材转换为泰语、英语等外语时存在翻译上的困难,其三是呈现的素材需要符合电商平台的调性。针对以上问题,我们基于大模型的语出了我们的预期,我能感受到行业模型上是暗潮汹涌,有能力入场的公司都在飞快演进。
闫阳:在回答主持人这个问题之前,我想强调一下「第一性原理」在AGI/AIGC上的重要性。「第一性原理」现在被很多人提起,它是一种源于物理学与哲学的思维方式,也是一种非常有意思且极为重要的思维方式,与传统的归纳思维不同,它强调极致深入的演绎推理。越是颠覆式的创新,越需要「第一性原理」的思维,而传统的归纳思维只能实现在现有状态下的改进和优化,对应到科技创新领域,就是围绕着他人的成果修修补补,做一些扩展或者延伸,不可能有颠覆性的自主原创,这一点特别重要。
结合「第一性原理」与AGI,大模型今年火了,但这是对绝大部分公众层面的“火”,而藏在高校院所、行业巨头和一些优秀创业公司里的资深技术专家,已经在几年前、十年前甚至十几年前就开始寻着人工智能技术的演变路径做AGI相关的积累和贡献。相比这些技术专家,我相信很多政府机构管理者、企业经营者、C端用户、B端甲方客户,以及投资人们,对短时间内火起来的AGI大模型等新鲜事物实际上是陌生的,那么面对这样一个颠覆性的大模型技术所带来的变革新浪潮,更需要大家用「第一性原理」的思维去思考问题,而不是简单的用已有的经验和认知去归纳、总结甚至决策,这一点极为重要。我想再次强调的是,这场宏大盛宴的所有参与方都应利用「第一性原理」去思考问题并指导行动,要好奇不息、思考不止、探索不停,否则大概率会成为过眼云烟,抓不住时代赋予我们的宝贵机会。
回到具体问题上,在当下AGI颠覆性变革时代,主要有三点重要的变量。一是大幅提高了生产力水平。举个例子,互联网中出现了很多可以帮助我们解答各种疑问,以及在学习或工作中能够提升效率的新工具,如大家熟悉的OpenAI公司的ChatGPT和GPT-4、谷歌的Bard,以及百度的文心一言等,这些工具可以帮助大家提高生产效率及质量;另一方面从我日常的投资工作来看,与松禾资本很多优秀被投企业沟通下来,其实他们都已经不同程度的将大模型技术应用到实际的产品研发中,加速了各自在新材料、新药物、新工艺研发工作中的效率。
第二点是极大降低了AI的应用门槛。举个例子,B端产业客户一个比较共同性的问题就是“AI不好用”以及“AI用不起”。过去若干年中,传统AI平台化解决方案的交付模式是,AI公司拿到B端客户的需求后进行定制化开发,最终以集成训练模型的形式给到客户。这种模式最大的弊端就是需要客户具备较强的对AI技术的理解和开发能力,并且IDC机房的搭建十分消耗成本。大模型下的算法生成模式不需要额外编程和调试,可吸引更多下游用户投入模型迭代,可以更有性价比的去使用AI技术,对其业务进行赋能。
第三点是全面革新用户的交互与体验。比如前面嘉宾提到的交互聊天问答模式、设计类工具交互模式、汽车智能座舱中的人车交互系统,以及数字人·虚拟人在服务场景中的应用等,这些都是C端用户能比较直观感受到的新事物。回到B端领域,举个例子,松禾天使基金被投企业「识渊科技」将深度学习应用到智能制造行业,利用通用人工智能技术打造了无代码的交互式平台,使得工业客户仅通过文字和图片对业务场景进行描述,几轮对话和交互下来,就可以生成准确的任务流程,效果非常好。
李源:主办方提的第一性原理很重要,我们公司主要重点放在机器视觉应用领域。chatGPT大模型首先是很令人震撼的,它向通用人工智能迈了很大一步。另外我们也看到背后的东西,在2020年6月份GPT3发布的时候,我们就开始研究它,实际上最让人震撼的是它揭示了量变到质变的过程。
我们认为这是一种涌现现象,即本身这个模型很简单,但是所表现出来的性能是让人吃惊的。至于从GPT3到现在,这一年为什么会有这样的结果,这里面就是一个从量变到质变的过程。
我们在机器视觉领域,也在想有没有这样的可能性。前不久有一篇论文,facebook发布的 Segment Anything 再次验证了原理,即深度学习模型同样具备这种量变导致质变的能力,其中大篇幅是在分析怎么标注样本,怎么处理大规模样本,这说明了样本的重要性。
中科智云很早便认识到样本的重要性,我们的X-Brain平台结合预训练模型和小样本技术,可实现泛化能力很强的样本自标注,只需不到传统模式的10%样本,即可达到同等精度的算法提升,算法所需训练时间也缩短到传统模式的10%。中科智云将会沿这个思路,继续训练图象领域的大模型,降低大模型的训练和运营成本,为行业应用创造新机遇。
Ben:通过各位嘉宾的分享,我们可以看到大模型带来的变化确实在发生。基于这些变化,请各位嘉宾分享一下,下一阶段哪些领域可能发生更大的突破,这样的突破可能会给哪些创业公司带来一些比较系统的机会?
沈李斌:我联想到了1997、1998年互联网早期发展的时候,当时存在各种机会,只要你想做并且有能力去做好,把控节奏就有可能创造历史。我们当下的大模型发展带来的机会也是系统性的,我觉得每个能创造价值的场景都是值得做的,所以我们如果要判断是否需要探索一个场景,评估它是否有价值是一方面,另一方面也需要去把握节奏,即判断现在是否是合适的时机、这个技术是否能支撑服务要求的体验,以及率先入场是否能将技术壁垒变成生态壁垒。从生成式的角度来说,生成质量的可控性和安全性以及公序良俗的对齐比较困难。特别是国内的To C应用没有想象中发展那么快速的情况下,To B应用在目前的状态下机会反而更多,通过短期迅速发展来积累技术和能力,可以反哺到C端场景。
频如何结合行业内部知识去可控生成,我觉得无论从技术还是应用场景的角度而言都是一个系统性的机会。
闫阳:我认为预先落地的行业机会和应用,是要以受众对象比较能接受的方式,可以真正走进大众视野的机会和应用,比如设计或文本类生成式工具、智能问答客服等,这些领域的应用近期会先落地或者先加速迭代,使其成为一个强有力的产品。大模型实际上成为了AI时代的操作系统,而从“为人类提供及时准确的价值”这一范畴来讲,下一阶段的突破应该在各种工具类软件方面。
国内创业公司在利用技术革新,打破传统场景下的同质化竞争方面具有比较大的机会,主要体现在基于大模型这一新的基础设施,针对中间层和应用层的开发,将大模型技术快速抵达垂直场景,例如自动驾驶(仿真引擎、AIGC模拟场景)、金融科技(欺诈预测、交易预测)、医药健康(药物中间体、蛋白质结构、基因等预测)、工业智造(虚拟工厂、生产过程模拟测试)场景中的合成数据,以及数据内容(文本、图片、音频生成)的构建。此外,我们认为一个特别有意义的机会是AIGC对各种工业仿真/设计软件行业的巨大变革,大模型对于CAX的效率提升将会非常显著。
大模型时代下,我们如何打破长期以来国外巨头在工业软件赛道中的垄断格局,需要中国企业充分利用AGI等带来的技术革新机遇,加速追赶,一举弯道超越。松禾天使基金在CAE领域的被投企业「十沣科技」便是物理仿真+AI这一交叉领域的优秀代表,我们对其充满期待。
但这几个月以来,以ChatGPT为代表的AI大模型给大众留下的一个显著印象是“交互感带来的直观冲击大于绝对的使用准确”,也就是“能用、有趣”。未来所有领域的突破应该真正实现从“能用+有趣”到“好用+准确”的革新,这一点对于创业公司的长期发展至关重要。
李源:无论生成式模型,还是大模型,对于创业团队来说既是机遇,也是挑战。机遇在于,原先很多人希望是通过算法或技术解决AI的落地难题,现在我们可以很明确,通过大模型或多模态模型也可以解决。但也是一个挑战,因为现在技术对资本很依赖,要想自己训练一个大模型的投入成本非常高。虽然很多打补丁技术可以降低训练成本,但要完全掌握它,还是需要比较高的投入。
那从技术角度来看,研究如何低成本训练和运用这样的大模型,也是一个机会。具体应用可以有很多层次,比如刚才提到的生成模型,我们可以用在各个行业。中科智云是一家ToB的企业,我们很多客户是工厂建筑工地等,比如在建筑领域,我们可以通过生成模型快速地构建建筑效果图,原来一张效果图需要花费一周时间,现在10到20分钟可以生成多张效果图;也可以用生成模型生成建筑的BIM。很多场景都可以尝试,但核心底层基座必须自己能够掌握。
Ben:现在大家看待大模型类似于“iphone时刻”,让人觉得很兴奋,那相较于去年很火的元宇宙和web3,大模型的商业化前景现在能否被明确判断?
沈李斌:我觉得大模型的商业化前景本身不存在疑问,相较元宇宙来说,大模型能被大家看到的应用更加切合实际,我们能切实地感受到大模型在替代生产力这方面的能力。但是在诗和远方之外仍然有很现实的问题,比如生成式模型存在天然的弱点,其可控性差、安全性差、前期投入比较巨大,这些都对技术路线和商业路径的选择提出了非常大的挑战,对商业化前景的担忧也集中于此。我觉得两三年之后,大模型能力达到一定程度时,其对生产力的替代所创造的价值是没有疑问的,但困难的是在当前阶段每个行业、每个赛道状况都不一样,融资情况不一样,潜在竞争也不一样,所以需要结合每个行业的具体情况去把握,比如这个赛道是否有大厂入场、投入什么样的资源在做、作为初创企业在这个赛道上能够根据天花板、团队能力,筹到多少钱,在大模型上可以花多少钱做到什么样的程度等等,无论在商业上,在技术产品前瞻性的预测把控上,要做出正确的判断,都是非常大的挑战。可能在2月份的时候我们会有一些想法,我们看到一些非共识的东西,我们抓住机会去行业赛道进行布点,但到4月份之后,我们之前说的东西现在变成了一种共识,大家对垂直赛道的理解促使比赛立刻进入了下半场状态。上半场是发展特别快的,可能因为大家受过移动互联网的熏陶,对商业认知会更
闫阳:这是一个非常有趣的类比。在「第一性原理」的演绎推理思维指导下,我们也需要一定的类比归纳思维,两种思维相互结合、相互补充。曾经繁荣蓬勃的移动互联网时代,以iPhone为代表的智能终端,准确的说是从中衍生出来的各种应用软件(APP)无疑是引爆行业巨大发展的源动力;而现在通用人工智能技术的出现,使AI赋能千行百业变为可能,极大降低用户的使用门槛,可以以最符合用户直觉的方式来使用AI类型的产品。通用人工智能技术可以理解成对软件形态的一种巨大重构,使其成为AI时代的操作系统,从这个角度来说,移动互联网时代下的iPhone APP完全可以和现在以AGI大模型为基础的各种应用相类比。
回想当年调研和投资移动互联网时代下的创业项目过程中,我发现很多APP创业公司存在三个主要的问题。第一个问题就是“伪需求”,第二个问题是产品的深度和广度不够,而第三个问题是公司整个商业模型中的“赚钱账”没算清楚。现在大模型时代下的行业机会,上面这些问题毋庸置疑同样是需要创业者重视的。
AGI行业的先行者在未来商业化进程中,要像iPhone APP开发者一样,以实际行业问题为导向否则会产生伪需求。AGI中把“G”去掉本质上还是AI,而这些年AI在C端和B端的一些行业落地已经显现,并且产生了很好的实际效果。我们认为AGI绝对是技术上的颠覆,但不是行业场景上的颠覆,而是再加速和再赋能。因此。AGI的出现并不需要创业者急匆匆的去创造一些“新需求”,因为新需求大概率不是“真需求”,把已经存在的真需求做的更好似乎是正确的方向。
同时,创业者要兼顾好产品与服务的深度(例如进入核心场景,真正有效的解决行业关键问题)和广度(例如更多的用户使用到更多的设备上),这样才能让AGI技术真正落到实处,赋能千行百业。最后就是“会算账”,以B端为例,创业者要在AGI大模型、中间层和应用层开发,以及场景数据提供、相匹配的硬件设备等不同部分之间做好平衡,既能保持技术和产品的领先势头,也能赚到钱。
李源:我还是从技术角度,我觉得大模型的商业化肯定没有问题,机会也很多。但我们要搞清楚是谁的机会,谁的商业化产品是谁的问题。现在来看,创业公司要打造自己的AGI产品门槛很高。从我们的技术路线角度来看,研究如何低成本训练和运用这样的大模型,恰恰是一个机会。中科智云从2014年起,便在AI行业模型以及行业预训练模型下的小样本学习领域进行深耕,已经积累了丰富的行业经验,特别是在图像自监督模型领域也有着丰富的积累,为构建行业大模型打下了坚实的基础。目前我们基于公司X-Brain平台已建成了建筑、航空等多个行业的专有模型,也在与各行业的合作伙伴携力打造更多行业大模型。
Ben:非常感谢三位嘉宾精彩的分享,也感谢台下的各位观众,今天圆桌论坛就到这里,谢谢大家。