包含标签 模型 的内容
-
字节跳动开源大模型训练框架veGiantModel ,性能最高提升6.9倍
近日,字节跳动应用机器学习团队开源了一款名为veGiantModel的大模型训练框架,该训练框架主要应用于自然语言处理领域的大模型训练,最高可将大模型训练的性能提升6.9倍,大幅降低训练系统的压力。目前,字节跳动旗下的企业级技术服务平台火山引擎已在其机器阅读全文>> -
性能最高提升 6.9 倍,字节跳动开源大模型训练框架 veGiantModel
近些年,NLP应用方面有所突破,Bert、GPT、GPT-3等超大模型横扫各种NLP测试后,人们发现参数量越大的模型,在算法方面表现越好,于是纷纷开始迅速向大模型方向发展,模型体积爆炸式增长。而大模型训练给现有的训阅读全文>> -
模型难复现不一定是作者的错,研究发现模型架构要背锅
本文经AI新媒体量子位(公众号ID:QbitAI)授权转载,转载请联系出处。在不同初始化条件下,同一神经网络经过两次训练可以得到相同的结果吗?CVPR2022的一篇研究通过将决策边界(Decision阅读全文>> -
精准高效估计多人3D姿态,美图北航分布感知式单阶段模型入选CVPR
近日,计算机视觉顶会CVPR2022公布了会议录取结果,美图影像研究院(MTLab)与北京航空航天大学可乐实验室(CoLab)联合发表的论文被接收。该论文突破性地提出分布感知式单阶段模型,用于阅读全文>> -
速度升45000倍,英伟达用傅里叶模型实现前所未有天气预报准确率
现代数值天气预报(numericalweatherprediction,NWP)可以追溯到1920年代。当今,数值天气预报已经无处不在,并且为交通、物流、农业和能源生产等关键部门的经济规划做出了贡献。准确的天气预报通过阅读全文>> -
不拆分单词也可以做NLP,哈工大最新模型在多项任务中打败BERT
本文经AI新媒体量子位(公众号ID:QbitAI)授权转载,转载请联系出处。众所周知,BERT在预训练时会对某些单词进行拆分(术语叫做“WordPiece”)。比如把“loved”、“lov阅读全文>>