-
学习视觉和语言的多粒度对齐?字节提出新多模态预训练方法 X
视觉语言预训练提高了许多视觉语言任务的性能。但是,现有的多数预训练方法依赖目标检测器(objectdetectors)提取基于物体的视觉特征,以此学习细粒度的视觉和语言对齐,例阅读全文>> -
清华IEEE论文:利用新型训练方法,帮自动驾驶决策摆脱「路侧干扰」
近日,来自清华大学的学者提出了一套基于自动编码器实现的新训练方法,使其能够忽略输入图像中的无关特征,同时保留相关特征。与现有的端到端提取方法相比,该方法只需要图像级标签,降低了标记成本。研究者发现,通过训练卷积神经网络(CN阅读全文>> -
将点云与RGB图像结合,谷歌&Waymo提出的4D
如今自动驾驶汽车和机器人能够通过激光雷达、摄像头等各种传感捕获信息。作为一种传感器,LiDAR使用光脉冲测量场景中目标的3D坐标,但是其存在稀疏、范围有限等缺点——离传感器越远,返回的点就越少。这阅读全文>> -
院士谈智能、模型VS数据AI、数字化转型,这场AI盛会技术干货来了
2022年,院士如何看待未来人工智能的发展?未来AI是模型驱动还是数据驱动?当前AI开发的难题有哪些?2月26日,在以“构建融通开放新生态”为主题的WAIC2022上海人工智能开发者大会主论坛上,来自学界的院士大咖,产业界的技术专家,就这些问题展开了深阅读全文>> -
基于Transformer的人工神经网络,将有机结构的图像转换为分子结构
人类正在进入人工智能时代。化学也将被现代的深度学习方法所改变,这需要大量定性数据来进行神经网络训练。好消息是,化学数据「很好保存」。即使某种化合物最初是在100年前合成的,关于其结构、性质和合成方式的信息仍然与阅读全文>> -
Meta启示:AI是通往元宇宙的关键变量
近日,元宇宙界中又有新的活水涌入。在Meta举办的实验室讨论会上,MetaCEO小扎公布了自家元宇宙的多项新技术。无论是资金还是技术,Meta都是构建元宇宙世界中跑在最前面的一位,从去年十月不惜将Fac阅读全文>>