2023 年,OpenAI 引领了科技圈久违的兴奋,创业者感到有奔头的同时,却也随着 AI 模型的一再进化,感受到了压力。
在春节前夕,算力、模型、应用等领域的大模型创业者,齐聚在一场创业者社群的活动上,切磋各自在不断进化的大模型中找到的空间。面对呼之欲出的 GPT-5 和 Llama3,他们也有新的思考。
站在模型层面,差异化很难,方向几乎是明确的——增强推理能力和多模态。也有技术路线的分野,比如阿里云通kaiyun体育全站 开云官方网站义实验室智能对话负责人李永彬透露,目前在思考是否能把搜索增强这样的外挂能力,做到模型里,进一步提升模型的可用性。
但站在应用层,多的是非共识和机会。比如,跑得最快的一批创业者,已经实现了一定程度的商业闭环,得出的结论甚至有些意外:「大模型含量」不宜过高。
这群下场做大模型的实干家也谈到了行业内最真实的情况。智谱 AI COO 张帆道出,今天的榜单其实不反映线 名都进不了。他认为,这种情况下,2024 年一定会发生从模型为王到价值为王的变化。
但是对于很多问题,60 分和 0 分差不多。因为在一些应用场景,没办法拿 60 分的产品上线 分,客户可能也不会买单。
AlphaGeometry: An Olympiad-level AI system for geometry|图片来源:DeepMind 官网
就在两周前,谷歌 DeepMind 推出的 AlphaGeometry(阿尔法几何)AI 系统,已经能在 30 道国际奥数题中做对 25 道,接近人类水平(人类金牌得主平均做对 25.9 道)。像这样能解决奥数级别的几何问题,被视为迈向更先进、更通用 AI 的重要里程碑。在 IDEA 研究院张家兴看来,「奥数就是复杂问题,问题的描述很复杂,求解过程、证明过程也很复杂」,能解决复杂问题是模型变得更通用的表现之一。
通过算法创新提高模型的学习能力,把像 RAG 这样的外挂知识库囊括进去,从而减少对模型数据训练的依赖。换言之,通过算法创新,以期让模型像人类学习一样,看一本书就可以理解知识,而不需要看所有书来理解一个问题。
在这一点上,GPT-5 提供了很好的示范。智谱kaiyun体育全站 开云官方网站 AI 张帆认为,更强大的推理能力让处理复杂任务成为可能,同时也带来了非常强的泛化能力。模型会在各个行业场景都能有很好的 Zero-Shot、One-Shot 能力(给模型一个例子甚至不给例子,它就可以涌现出对应的能力),从而减少对训练数据的依赖。通过小数据集的训练,就可以把模型引入到更多更垂直的领域。如此一来,可以降低客户使用模型的门槛,增加其可用性。
在这一话题的讨论上,与会者一方面认为,ChatGPT 也不是规划出来的,技术路线可能是干出来的,能用今天的技术落地往前走、不断改进是前提。另一方面,尽管路线之争的存在,但也不是不能调和的,有很多中间的路线可以走,是连续的。比如,张家兴分享了 IDEA 内部的实践,称称目标识别等计算机视觉特征是可以作为多模态大模型的输⼊,实践下来的效果⾮常好。
从左到右分别是阿里云创业孵化事业部总经理李中雨;智谱 AICOO 张帆;百川智能联合创始人、总裁洪涛;元璟资本管理合伙人刘毅然;IDEA 研究院认知计算与自然语言讲席科学家张家兴、通义实验室对话智能负责人李永彬 | 阿里云
在「模型为王」的愿景下,的确会出现提前让模型「看题」、「背题」来获得高分的情况。但更重要的是,当涉及到千行百业的不同场景,很难用一套标准来评价模型的可用性。
大模型应用则是一个个垂直优化的过程,底层模型哪部分用开源版、哪部分微调、调整哪些问题,再视情况优化功能和应用。创业者需要充分懂技术,再做产品的封装,这个过程存在很大优化空间和机会。
探索AI应用的第一条原则——TPF(技术产品匹配),,指的是在现有大模型技术不完美时,先明确「这样一个技术适合什么样的产品」,而不是产品经理洞察市场有什么需求,回来就开始做。
今天最大的挑战不是找到『什么不行』,这件事不难,人人都能够做到。难的是能找到它『什么行』,找到模型能力和业务的最大公约数,变成正向循环。」智谱 AI 张帆认为,这会成为 2024 年大模型落地的重点。
做 AI 应用的创业者甚至觉得以当前大模型技术成熟度,AI 应用「含大模型量」不宜过高。
在原有应用里+大模型、探索更好的工作流,是把大模型智力变成生产力最直接的方式。智谱 AI 张帆认为,这也是 2024 年产业关注的重点。
就像移动互联网技术下,出现随时随地刷短视频的用户需求一样,大模型技术下也开始出现一些独有的场景。比如一位 AI 应用投资人现场分享了一款还在定向邀测的海外应用 Can of Soup,一款想象力社交软件。用户利用 AI 生成虚拟图像,发布在网站上,互相评论,还可以邀请朋友进行「想象力」共创、点评,这款产品可以类比为
Coze 的模式是利用背后大模型的递归和迭代的能力和表达力,这是更加原生的智能体,效果也更好。
结合端侧场景的应用也值得期待,尤其机器人领域。说起 2023 年最眼前一亮的应用,张家兴认为是谷歌的 RT-2(Robotics Transformer 2,一款机器人大模型),看到了⽤⾃然语⾔定义任意机器人任务的曙光。他认为,⼤模型在机器⼈领域正在期待 ChatGPT 时刻。
「天上的大模型能否落在地上的设备上面,是值得期待的」他说道。尽管通用的物理世界大模型的价值最大,是科学家梦寐以求的,但在前面加合适的定语,是创业者今天就可以做、也可以有收获的。难点在于,前面怎么加定语,能符合今天的技术阶段,也能把商业化和产品结合在一起,不停向前进。
昆仑万维董事长、CEO 方汉在交流环节分享昆仑万维+大模型的实践|图片来源:阿里云
云计算对传统 IT 的意义,和融合AI的意义完全不同。AI 和云是鱼和水,密不可分,二者的结合是 AI 应用的催化剂。同时,云计算能力的不断演进,包括 GPU 算力、配套的计算存储、网络能力的演进,会对 AI 产生非常大的支撑。
在谈AI原生应用之前,其实有一点被忽略了——AI 是云的原生应用。二者的结合还有很大优化空间」他说道。随着大模型包括 AIGC(应用)更加细分,对算力的需求也会逐渐细分化,而不是简单粗暴地购买算力,这也是阿里云不断探索的事情。
不同的是,变革的「基建」从运营商,变成了现在以阿里云为代表的云计算厂商。在大模型时代,阿里云不仅要自己下场「摸清」大模型上下游的真实情况,更需要在这样的创业者之夜活动中,和大模型行业的「玩家」共同找到行业发展的方向,根据后者不断变化的需求,增加阿里云「AI 基建」的各种能力,来和创业者们一起成长、成功。