首页 精选百科 > 正文

谷歌称新 AI 训练技术速度提升 13 倍

导读 Google 的 AI 研究实验室Google DeepMind 发布了一项关于训练 AI 模型的新研究,声称该研究将大大提高训练速度和能效,比其他方法的...

Google 的 AI 研究实验室Google DeepMind 发布了一项关于训练 AI 模型的新研究,声称该研究将大大提高训练速度和能效,比其他方法的性能高出 13 倍,能效高出 10 倍。随着有关 AI 数据中心对环境影响的讨论日益升温,新的 JEST 训练方法的出现可谓恰逢其时。

DeepMind 的方法被称为 JEST 或联合示例选择,它以一种简单的方式打破了传统的 AI 模型训练技术。典型的训练方法侧重于单个数据点进行训练和学习,而 JEST 则基于整个批次进行训练。JEST 方法首先创建一个较小的 AI 模型,该模型将对来自极高质量来源的数据质量进行评级,并按质量对批次进行排序。然后,它将该评级与较大、质量较低的数据集进行比较。小型 JEST 模型确定最适合训练的批次,然后根据较小模型的结果训练大型模型。

 DeepMind 的研究人员在论文中明确指出,这种“引导数据选择过程向较小、精心策划的数据集分布的能力”对于 JEST 方法的成功至关重要。成功是这项研究的正确词汇;DeepMind 声称“我们的方法超越了最先进的模型,迭代次数减少了 13 倍,计算量减少了 10 倍。”

郑重声明:本文版权归原作者所有,转载文章仅为传播更多信息之目的,如作者信息标记有误,请第一时间联系我们修改或删除,多谢。