Meta新推出多模态的Llama 3.2模型,继续采行开源AI政策,这也是Meta第一款主要的视觉模型,同时理解图像和文本。为在Llama增加图像支持,Meta训练一组权重转换器(Adapter weights),这些权重可与现有的80亿和700亿参数的纯文本模型集成,创建同时理解图像的110亿和900亿参数模型。
Meta还发布轻量的Llama 3.2 10亿和30亿参数模型,这些版本经过优化,可在手机或智能眼镜上运行。
去年发布的Meta AI,至今每月超过4亿人使用,且在欧洲、台湾等市场尚未提供服务,这次在Connect 2024大会Meta AI获得功能升级。
为了让人们在Instagram和Facebook视频看到更多母语发音的内容,Meta正在测试视频自动配音和唇形同步功能,与少数Instagram创作者合作测试,初期支持英语和西班牙语。值得关注的是,Meta技术已能做到这个程度,不免令人担心万一技术遭到不法滥用,会不会快速衍生出更多诈骗视频和不实资讯在网络上传播。
最后,Meta也为AI编辑工具增添功能,Meta AI现在不仅能处理视觉资讯,用户上传照片后可以提出关于照片的问题。比方说,拍摄当地地标的照片并询问历史,或上传壮丽的山景照片了解可以走的健行路线。不只如此,通过简单的文本提示就开云网址 kaiyun官方入口能编辑照片,添加、更改或移Kaiyun体育官方网站 开云登录网站除照片中的元素,比以往只能编辑AI生成图像的功能更高端。