AI大潮下,科技巨头苹果公司日前推出了300亿参数的多模态AI大模型MM1.5,该版本是在前代MM1的架构基础上发展而来的。 该模型继续遵循数据驱动的训练原则,着重探究在不同训练周期中混合各类数据对模型性能产生的影响,相关模型文档已在Hugging Face上发布。 MM1.5提供了从10亿到300亿的多种参数规模,拥有图像识别和自然语言推理能力。 在新版本中,苹果公司的研发人员改进了数据混合策略,极大地增强了模型在多文本图像理解、视觉引用与定位以及多图像推理等方面的能力。 参考论文可知,团队在MM1.5的持续预训…