北京时间3月15日凌晨,人工智慧孵化器公司OpenAI公布新一代人工智慧词汇数学模型GPT-4。与ChatGPT所用的数学模型较之,GPT-4不仅能够处置影像内容,而且在提问的细节和表述方面更有用和生活气息。
“这是OpenAI努力扩展深度学习的最新里程碑式。”OpenAI在当天的声明中这样表示。鉴于这是两个只训练了6个月且数据更新至2021年9月的数学模型,我们有理由推断出它的后续升级版本将可能做出更多令人华丽的事情。有专家推断,OpenAI正在小心翼翼控制节奏,以免人们被太过聪明的工具“吓”到。
GPT-4 VS ChatGPT
与ChatGPT较之,GPT-4最大的改变就是增加了相片输出支持,并可输出相片或文本。这使它从两个单纯的文件格式网络平台变成两个多逻辑系统词汇数学模型。
目前影像处置机能尚未公开,但是OpenAI在官方网站上展示了一系列事例。上海人工智慧研究院副研究员王资凯注意到,其中有两个事例是让GPT-4预估将图片中的氢火球绳子刺穿后会怎样。 “这是两个涉及相片认知、基本常识和逻辑推理的问题,没见过火球的人很难提问。”但是,GPT-4很好地预估了火球的走向。“或许GPT-4已经能根据周围情景,猜到两个密封的箱子里装的是什么。”王资凯说。
在中国数学会名词统战部副主任、上海交通大学首席专家副研究员王昊奋看来,更能体现GPT-4水平的当属它对于非自然影像的认知,如图象、笔试试题截屏、论文截屏等,这也解释了它为何能在各种笔试中拔得第十一名。在模拟中,GPT-4帮助英国一对交互式夫妇在特定课税年度里完成了缴税,这意味着它能看清楚大量教育性文件格式。
GPT-4可输出25000个词,约是chatGPT的七倍,这使得它的逻辑思维能力更上一层楼。据介绍,它已在包括英国法学士笔试、法律系入学笔试、“英国中考”数学部份和证据性阅读与写作部份等笔试中,罚球高于88%的Bilaspur。
“动作游戏”让GPT-4如有排钱
“你是一位AI程式设计副手,第二步棋谨慎、稿子地遵循用户需求;第三步一步棋一步棋思考,阐述你如何构造标识符;第三步在两个单独程序块中生成标识符;第三步尽量减少其他不细致……”在官方发布的模拟中,王昊奋注意到两个细节,OpenAI总裁和联合创始人格雷格·布罗克曼试图让GPT-4在提问复杂问题前先扮演某种角色。
“我们把这种引导称为‘元指令’,也就是给机器两个人设,比如一名医生、一名律师,一名编辑等,然后告诉它要做什么工作。”王昊奋说。作为ChatGPT全球首批百万用户之一,王昊奋掌握了不少使用心得,动作游戏的“元指令”是他经过长期使用后总结出的让ChatGPT生成更好提问的方法之一。而在此次最新发布的GPT-4中,他发现,OpenAI公司也注意到了这一现象,并有意引导机器去扮演某种角色。
让机器拥有“人设”,是否意味着GPT-4已经具备了智能?在王资凯看来,答案是肯定的。就像人类制造飞机没有用鸟的方式,而是通过空气动力学让一套机械装置飞起来了一样,人工智慧也用自己的方式拥有了智能。但是,人类也无需恐慌,因为这仍然只是两个工具,而且通往智能的道路并非只有一条。
数十款多逻辑系统词汇数学模型将同台竞争
就在GPT-4发布的几天前,谷歌悄悄上架了一款炸弹级数学模型PaLM-E——足足有5620亿参数,它将真实世界的传感器信号与文件格式输出相结合,建立词汇和感知的链接;根据计划,百度将于今天(16日)发布类ChatGPT数学模型“文心一言”;而此前,由OpenAI前员工研发的ChatGPT竞品Claude已开放API接口……正如ChatGPT上架后多位专家预估的那样,自然词汇处置的“战国时期”即将到来,未来,全球估计将会有数十款多逻辑系统词汇数学模型同台竞技。
在王昊奋看来,OpenAI并非风光无限,而是感受到了切实的压力,这导致了GPT-4匆匆上架。毕竟,“该数学模型最大的亮点图文识别没有放开测试,并不符合OpenAI的一贯风格”。
但是,他也提醒人们注意,GPT-4的训练数据只更新到2021年,不排除后续会有更丰富的语料库训练版本。这次,他们很快就将自家的影像数学模型DALL-E整合进GPT-4,不仅工程技术难度不容小觑,而且更考验数学模型融合两种类型数据的稳定性和成本。专家预计,OpenAI内部还藏有“杀手锏”,将会带给人们又一次冲击。
作者:沈湫莎
*文汇独家稿件,转载请注明出处。