据媒体周五报道,Meta有望在本月发布的新一代开源大语言模型Llama 4。此前这款大语言模型的发布已至少经历两次延期,目前仍存在再度推迟可能。
这距离前代模型Llama 3的发布已过去近一年,凸显出Meta在AI军备竞赛中面临的技术挑战。
据Meta内部测试显示Llama 4在数学推理(GSM8K基准)和代码生成()准确率较Llama 3提升37%。
这款大语言模型多次延期的主因是多模态训练数据清洗遇阻,特别是视频-文本对齐质量未达预期。该模型需协调16000块H100 GPU集群,能源消耗较Llama 3训练增加2.3倍。
行业观察人士指出,若再度延期,Meta将错过6月开发者大会的关键展示窗口。而竞争对手的 4和 2.0已分别计划在Q3发布重大更新。
相关文章:
新童谣童诗征稿活动在沪开启:设三个创作主04-22
工信部发布第一季度电信服务质量通告,上海04-22
工信部发布第一季度电信服务质量通告,长城04-22
带着质疑出生的萤火虫,怎么才能高端纯电小04-22
五角大楼正在“全面崩溃”?白宫被指已在物04-22