大模型的2024：「天上」的技术和「地上」的创业者

行业动态 | 2024-02-08 00:28

　　2023 年，OpenAI 引领了科技圈久违的兴奋，创业者感到有奔头的同时，却也随着 AI 模型的一再进化，感受到了压力。

　　在春节前夕，算力、模型、应用等领域的大模型创业者，齐聚在一场创业者社群的活动上，切磋各自在不断进化的大模型中找到的空间。面对呼之欲出的 GPT-5 和 Llama3，他们也有新的思考。

　　站在模型层面，差异化很难，方向几乎是明确的——增强推理能力和多模态。也有技术路线的分野，比如阿里云通kaiyun体育全站开云官方网站义实验室智能对话负责人李永彬透露，目前在思考是否能把搜索增强这样的外挂能力，做到模型里，进一步提升模型的可用性。

　　但站在应用层，多的是非共识和机会。比如，跑得最快的一批创业者，已经实现了一定程度的商业闭环，得出的结论甚至有些意外：「大模型含量」不宜过高。

　　这群下场做大模型的实干家也谈到了行业内最真实的情况。智谱 AI COO 张帆道出，今天的榜单其实不反映线名都进不了。他认为，这种情况下，2024 年一定会发生从模型为王到价值为王的变化。

大模型的2024：「天上」的技术和「地上」的创业者(图1)

　　但是对于很多问题，60 分和 0 分差不多。因为在一些应用场景，没办法拿 60 分的产品上线分，客户可能也不会买单。

大模型的2024：「天上」的技术和「地上」的创业者(图2)

　　AlphaGeometry: An Olympiad-level AI system for geometry｜图片来源：DeepMind 官网

　　就在两周前，谷歌 DeepMind 推出的 AlphaGeometry（阿尔法几何）AI 系统，已经能在 30 道国际奥数题中做对 25 道，接近人类水平（人类金牌得主平均做对 25.9 道）。像这样能解决奥数级别的几何问题，被视为迈向更先进、更通用 AI 的重要里程碑。在 IDEA 研究院张家兴看来，「奥数就是复杂问题，问题的描述很复杂，求解过程、证明过程也很复杂」，能解决复杂问题是模型变得更通用的表现之一。

　　通过算法创新提高模型的学习能力，把像 RAG 这样的外挂知识库囊括进去，从而减少对模型数据训练的依赖。换言之，通过算法创新，以期让模型像人类学习一样，看一本书就可以理解知识，而不需要看所有书来理解一个问题。

　　在这一点上，GPT-5 提供了很好的示范。智谱 kaiyun体育全站开云官方网站 AI 张帆认为，更强大的推理能力让处理复杂任务成为可能，同时也带来了非常强的泛化能力。模型会在各个行业场景都能有很好的 Zero-Shot、One-Shot 能力（给模型一个例子甚至不给例子，它就可以涌现出对应的能力），从而减少对训练数据的依赖。通过小数据集的训练，就可以把模型引入到更多更垂直的领域。如此一来，可以降低客户使用模型的门槛，增加其可用性。

　　在这一话题的讨论上，与会者一方面认为，ChatGPT 也不是规划出来的，技术路线可能是干出来的，能用今天的技术落地往前走、不断改进是前提。另一方面，尽管路线之争的存在，但也不是不能调和的，有很多中间的路线可以走，是连续的。比如，张家兴分享了 IDEA 内部的实践，称称目标识别等计算机视觉特征是可以作为多模态大模型的输⼊，实践下来的效果⾮常好。

大模型的2024：「天上」的技术和「地上」的创业者(图3)

　　从左到右分别是阿里云创业孵化事业部总经理李中雨；智谱 AICOO 张帆；百川智能联合创始人、总裁洪涛；元璟资本管理合伙人刘毅然；IDEA 研究院认知计算与自然语言讲席科学家张家兴、通义实验室对话智能负责人李永彬｜阿里云

　　在「模型为王」的愿景下，的确会出现提前让模型「看题」、「背题」来获得高分的情况。但更重要的是，当涉及到千行百业的不同场景，很难用一套标准来评价模型的可用性。

　　大模型应用则是一个个垂直优化的过程，底层模型哪部分用开源版、哪部分微调、调整哪些问题，再视情况优化功能和应用。创业者需要充分懂技术，再做产品的封装，这个过程存在很大优化空间和机会。

　　探索AI应用的第一条原则——TPF（技术产品匹配），，指的是在现有大模型技术不完美时，先明确「这样一个技术适合什么样的产品」，而不是产品经理洞察市场有什么需求，回来就开始做。

　　今天最大的挑战不是找到『什么不行』，这件事不难，人人都能够做到。难的是能找到它『什么行』，找到模型能力和业务的最大公约数，变成正向循环。」智谱 AI 张帆认为，这会成为 2024 年大模型落地的重点。

　　做 AI 应用的创业者甚至觉得以当前大模型技术成熟度，AI 应用「含大模型量」不宜过高。

　　在原有应用里+大模型、探索更好的工作流，是把大模型智力变成生产力最直接的方式。智谱 AI 张帆认为，这也是 2024 年产业关注的重点。

　　就像移动互联网技术下，出现随时随地刷短视频的用户需求一样，大模型技术下也开始出现一些独有的场景。比如一位 AI 应用投资人现场分享了一款还在定向邀测的海外应用 Can of Soup，一款想象力社交软件。用户利用 AI 生成虚拟图像，发布在网站上，互相评论，还可以邀请朋友进行「想象力」共创、点评，这款产品可以类比为

　　Coze 的模式是利用背后大模型的递归和迭代的能力和表达力，这是更加原生的智能体，效果也更好。

大模型的2024：「天上」的技术和「地上」的创业者(图4)

　　结合端侧场景的应用也值得期待，尤其机器人领域。说起 2023 年最眼前一亮的应用，张家兴认为是谷歌的 RT-2（Robotics Transformer 2，一款机器人大模型），看到了⽤⾃然语⾔定义任意机器人任务的曙光。他认为，⼤模型在机器⼈领域正在期待 ChatGPT 时刻。

　　「天上的大模型能否落在地上的设备上面，是值得期待的」他说道。尽管通用的物理世界大模型的价值最大，是科学家梦寐以求的，但在前面加合适的定语，是创业者今天就可以做、也可以有收获的。难点在于，前面怎么加定语，能符合今天的技术阶段，也能把商业化和产品结合在一起，不停向前进。

大模型的2024：「天上」的技术和「地上」的创业者(图5)

　　昆仑万维董事长、CEO 方汉在交流环节分享昆仑万维+大模型的实践｜图片来源：阿里云

　　云计算对传统 IT 的意义，和融合AI的意义完全不同。AI 和云是鱼和水，密不可分，二者的结合是 AI 应用的催化剂。同时，云计算能力的不断演进，包括 GPU 算力、配套的计算存储、网络能力的演进，会对 AI 产生非常大的支撑。

　　在谈AI原生应用之前，其实有一点被忽略了——AI 是云的原生应用。二者的结合还有很大优化空间」他说道。随着大模型包括 AIGC（应用）更加细分，对算力的需求也会逐渐细分化，而不是简单粗暴地购买算力，这也是阿里云不断探索的事情。

大模型的2024：「天上」的技术和「地上」的创业者(图6)

　　不同的是，变革的「基建」从运营商，变成了现在以阿里云为代表的云计算厂商。在大模型时代，阿里云不仅要自己下场「摸清」大模型上下游的真实情况，更需要在这样的创业者之夜活动中，和大模型行业的「玩家」共同找到行业发展的方向，根据后者不断变化的需求，增加阿里云「AI 基建」的各种能力，来和创业者们一起成长、成功。

Kaiyun - 开云 (中国体育) 官方网站

大模型的2024：「天上」的技术和「地上」的创业者

联系信息

热点资讯

2024年中国分布式云市场规模达386亿元未来分布式云发展前景广阔[图]

数字化转型：[业务]流程、流程再造–开篇

快捷导航

扫描二维码