欢迎来到池州三陆五信息科技有限公司- 未来科技

微信
手机版
网站地图

1亿组图文对,填补开源空白中文多模态数据集!华为诺亚方舟还附带了来自实验室-量子比特的基础模型,

2023-04-12 08:54:22 栏目 : 网络动态 围观 : 0次

[华为][诺亚][方舟]实验室开源了第一个亿单位的多模态数据集[悟空]

这个数据集不仅是大规模的—而且包括一亿组图像和文章对,是高质量的

所有的图像都被筛选出来,纵横200像素以上,以1/3到3的比例显示。

与图像相对应的文本也根据语言过滤长度和频率,也考虑到隐私和敏感字。

例如,这个数据集的例子仍然是相当新的,比如注册访问代码,社区疫苗预防接种

是填补大规模中文多模态数据集的缝隙。

悟空数据集自1年前的OpenAICLIP+Dalle组合的多模态学习浪潮开始以来,加上后续的ALIGN和FILIP,在视觉语言预训练(VLP)领域发挥了出色的性能。

全球成功而言,大型数据集的支持是必不可少的,但开源数据可能有,但大型数据不多。

2002“悟空”数据集允许下游任务支持更多的预培训模型。

除了数据集之外,还附带了参考了受欢迎的文本图像双编码器体系结构的基本模型。

作为输入有视觉性的表记和文本表记。然后,连接两种模式的输入标记,通过位置嵌入显示标记位置。

有趣的是,这里的图像编码器是从“英文”数据集上训练的,该数据集预加载并锁定从外部模型训练的“英文”数据集的权重。

但是,在文本中的模态横断面预训练在下游任务中也是有效的。

此外,“华为][诺亚”还提供下游任务的各种基准测试。

例如,除了零样本图像分类、下图的wukongvit-500m之外,其他悟空模型的变体都是在这1亿个数据库上训练的。

或者,假设在图像检索和文本检索这两个任务中,有5个不同的数据集出现了以下测试结果。

另外,中文对于多模态的预训练,英语在数据集上应用预训练的图像编码器,证明了很好的效果。在未来,您可能会找到一个解决方案来使用数据集训练多语种模态模型。

现在,悟空可以从官方网站下载数据集(链接地址是文末)

数据集地址:https://wukong-dataset.github.io/wukong-dataset/benchmark.html来修改标记元素的显示属性。

论文地址:https://arxiv.org/abs/2202.06767

展开剩余内容

分享到:

猜你喜欢

  • b2b网站策划书_b2b策划案

    b2b网站策划书_b2b策划案大家好,今天我来给大家讲解一下关于b2b网站策划书的问题。为了让大家更好地理解这个问题,我将相关资料进行了整理,现在就让我们一起来看看吧。文章目录...

    2024-10-22 企业 网站
  • 浙江高端网站_浙江高端网站有哪些

    浙江高端网站_浙江高端网站有哪些好久不见了,今天我想和大家探讨一下关于“浙江高端网站”的话题。如果你对这个领域还不太了解,那么这篇文章就是为你准备的,让我们一看看吧。文章目录列...

    2024-10-22 网站 浙江
  • 做酒的网站_做酒的网站有哪些

    做酒的网站_做酒的网站有哪些希望我能够回答您有关做酒的网站的问题。我将根据我的知识库和研究成果回答您的问题。文章目录列表:1.酒仙网CEO郝鸿峰的电商百亿梦想2.有没有关于介绍...

    2024-10-22 中国 酒类 酒仙 网站
  • 索尼手机软件_索尼手机软件商店

    索尼手机软件_索尼手机软件商店下面,我将为大家展开关于索尼手机软件的讨论,希望我的回答能够解决大家的疑问。现在,让我们开始聊一聊索尼手机软件的问题。文章目录列表:1.索尼的手机...

    2024-10-22 手机 索尼
热门标签