24年4月27日
4 月 18 日,Meta 正式发布了 8B 和 70B 参数量版本的开源大模型 Llama 3。Llama3 的主要亮点包括:(1)基于超过 15T token 训练,相当于 Llama 2 数据集的 7倍还多;(2)支持 8K 长文本,改进的 tokenizer 具有 128K token 的词汇量,可实现更好的性能;(3)在大量重要基准中均具有最先进性能;(4)新能力范畴,包括增强的推理和代码能力;(5)训练效率比 Llama 2 高 3 倍;(6)带有 LlamaGuard 2、Code Shield 和 CyberSec Eval 2 的新版信任和安全工具。体量更大的多模态版本将在未来几个月内推出。Meta 称,目前正在开发的最大模型是 400B+参数。与此同时,扎克伯格宣布:基于最新的 Llama 3 模型,Meta 的 AI 助手现在已经覆盖 Instagram、WhatsApp、Facebook 等全系应用,并单独开启了网站。另外还有一个图像生成器,可根据自然语言提示词生成图片。在 Facebook、Instagram、WhatsApp 和 essenger 上,用户现在可以借助 Meta AI 进行搜索,无需在应用程序之间切换,浏览信息流的时候,还可以直接从帖子中向 Meta AI询问更多信息。