记者日前从亚马逊云科技获悉,亚马逊云科技正加快引领数据基座构建必备的三大核心能力,即模型微调和预训练所需的数据处理能力、利用专有数据与模型快速结合以产生独特价值的能力,以及有效处理新数据以助推生成式AI应用持续快速发展的能力,助力企业构建全面的数据基座以充分发挥数据潜力,加速生成式AI技术落地。
在生成式AI时代,数据是企业脱颖而出的关键。亚马逊云科技大中华区产品部总经理陈晓建表示,基础模型依赖于大规模高质量数据集,生成式AI的差异化优势来源于企业的专有数据,生成式AI应用产生的大量新数据也开云网址 kaiyun官方入口需要及时有效地加以管理和利用。
“企业需要的是懂业务、懂用户的生成式AI应用,而打造这样的应用需要从数据做起。”陈晓建说,亚马逊云科技构建数据基座的三大核心能力涵盖从基础模型训练到生成式AI应用构建的重要场景,能够帮助企业轻松应对海量多模态数据,提升基础模开云网址 kaiyun官方入口型能力,在确保用户业务和数据安全的前提下,将数据的独特价值赋予基础模型和生成式AI应用,加速企业业务增长。
在数据存储方面,扩展性和响应速度是关键。Amazon S3对象存储支持广泛的数据协议,能够轻松应对各种数据类型,还支持智能分层以降低训练成本。专门构建的文件存储服务Amazon FSx for Lustre则能够提供亚毫秒延迟和数百万IOPS的吞吐性能,能够进一步加快模型优化的速度。
通过技术手段加速数据与模型的结合成为企业数据基座的第二项关键能力。亚马逊云科技将向量搜索的支持功能加入到主流的数据服务中,通过将数据和向量存储在一起来提升数据查询性能。
如何处理生成式AI应用程序新生成的数据,提升模型调用效率成为企业数据基座的第三项关键能力。据悉,Amazon Memory DB内存数据库通过缓存之前问答生成的新数据,实现对类似问题的快速响应和准确回答,同时有效降低基础模型的调用频率。Amazon Memory DB能够存储数百万个向量,只需要几毫秒的响应时间,能够以99%的召回率实现每秒百万次的查询性能。