包含标签 训练 的内容
-
字节跳动开源大模型训练框架veGiantModel ,性能最高提升6.9倍
近日,字节跳动应用机器学习团队开源了一款名为veGiantModel的大模型训练框架,该训练框架主要应用于自然语言处理领域的大模型训练,最高可将大模型训练的性能提升6.9倍,大幅降低训练系统的压力。目前,字节跳动旗下的企业级技术服务平台火山引擎已在其机器阅读全文>> -
模型难复现不一定是作者的错,研究发现模型架构要背锅
本文经AI新媒体量子位(公众号ID:QbitAI)授权转载,转载请联系出处。在不同初始化条件下,同一神经网络经过两次训练可以得到相同的结果吗?CVPR2022的一篇研究通过将决策边界(Decision阅读全文>> -
速度升45000倍,英伟达用傅里叶模型实现前所未有天气预报准确率
现代数值天气预报(numericalweatherprediction,NWP)可以追溯到1920年代。当今,数值天气预报已经无处不在,并且为交通、物流、农业和能源生产等关键部门的经济规划做出了贡献。准确的天气预报通过阅读全文>> -
Jeff Dean:我们写了一份「稀疏模型设计指南」,请查收
稀疏模型在深度学习领域发挥着越来越重要的作用。对于给定的token或样本,它可以只激活模型的一小部分,从而在拥有很大的参数量的同时也能做到计算友好。但是,如何可靠地训练这类阅读全文>> -
清华IEEE论文:利用新型训练方法,帮自动驾驶决策摆脱「路侧干扰」
近日,来自清华大学的学者提出了一套基于自动编码器实现的新训练方法,使其能够忽略输入图像中的无关特征,同时保留相关特征。与现有的端到端提取方法相比,该方法只需要图像级标签,降低了标记成本。研究者发现,通过训练卷积神经网络(CN阅读全文>> -
无需人工标注,清华、快手基于参考图像单张生成图像质量评价方法
引言现有的生成图像评价工作主要基于生成图像的分布对模型「整体」的生成效果进行评价。然而,一个性能优异的生成模型并不代表其合成的「任何一张」图像都具有高质量的效果。在基于参考图像(referenc阅读全文>>