欢迎来到池州三陆五信息科技有限公司- 未来科技

微信
手机版
网站地图

第一个中文多项选择阅读数据集:BERT的最高成绩只有68%,86%的问题需要先验知识-量子比特

2023-04-18 09:07:42 栏目 : 网络动态 围观 : 0次

舔过基准的BERT等NLP模型似乎没有那么强。

因为你会遇到一个名为“中文”的数据集

康奈尔大学留学生第一次阅读了自由形式的中文多选题的数据集。86.6%的问题需要书面知识。

在这个数据集中,每个模型的正确率都高达68%,与96%的人有很大的差距。

数据集3

机器阅读的最大课题是回答这样的问题,在这一点上中文与英文相比相当差,但一个是缺乏专业的数据集。

此数据集被命名为C3(free-form multiple-choicechinese machine reading Comprehension dataset)

收集的主要是自由形式的复数选择题,阅读材料来自汉语水平考试和民族汉语考试,包括试卷和练习。

有13369篇文章和19577个问题,其中60%是训练集,20%是开发集,20%是测试集。

数据集可以分为两种类型

正式的文件和口头文件。写的文章比口头写的文章长,但两者都不能成为机械地阅读长文章的训练数据集。

数据集将按以下方式合并:。

需要事先了解的问题分为10类

研究人员分析了需要先验的知识来回答哪些问题。如果某个问题在文章中一致,回答时几乎不需要先验的知识。需要先验知识的问题分为三类。

1、关于语言知识:需要词汇/语法知识,如:习语、谚语、否定语、反义词、同义词、单词可能的语义和语法转换。

2、关于特定领域:需要,但不限于这些领域的概念、概念定义和特性以及概念之间关系的一些事实知识。

3、一般世界:我们需要关于世界如何工作的一般知识,或者被称为常识的东西。这个数据集主要指的是即使不用百科全书的假设来说明读者也知道的知识。

在第三种类型中,我们将问题分为八个子类型。

1、计算:数值计算和分析。

2、内涵:关于对某物或某人包含的情感,情感和语调

3、因果:事件B会引起事件A,经常用于“为什么”这个问题。

4、暗示:要点、建议、意见、事实或事件在文本中没有明确表达

5、部分和整体:你需要知道A是B的一部分。

6、情境:观察人类的行为和活动,以及相应的时间/位置信息。也知道参加者的个人信息(职业、学历、性格、心理身体状态等)、参加者之间的关系性等。

7、前提:如果A不发生,B就不会发生。

8,其他

基于支持回答的最小语句数。研究人员把所有的问题分为三类:单一、多个和独立

所有问题的分类和标注如下表所示。

进行着与人类相差甚远的训练

通过使用现有方法和神经网络模型对数据集进行训练,结果如下:。

语言模型的预训练效果与基于规则的方法和基于bi-lstm的模型相比有很大的优势,但即使是正确率最高的模型也有68%,96%的人有很大的差别。

我们需要开发更好的模型

是传送门

https://github.com/nlpdata/c3

展开剩余内容

分享到:

猜你喜欢

  • b2b网站策划书_b2b策划案

    b2b网站策划书_b2b策划案大家好,今天我来给大家讲解一下关于b2b网站策划书的问题。为了让大家更好地理解这个问题,我将相关资料进行了整理,现在就让我们一起来看看吧。文章目录...

    2024-10-22 企业 网站
  • 浙江高端网站_浙江高端网站有哪些

    浙江高端网站_浙江高端网站有哪些好久不见了,今天我想和大家探讨一下关于“浙江高端网站”的话题。如果你对这个领域还不太了解,那么这篇文章就是为你准备的,让我们一看看吧。文章目录列...

    2024-10-22 网站 浙江
  • 做酒的网站_做酒的网站有哪些

    做酒的网站_做酒的网站有哪些希望我能够回答您有关做酒的网站的问题。我将根据我的知识库和研究成果回答您的问题。文章目录列表:1.酒仙网CEO郝鸿峰的电商百亿梦想2.有没有关于介绍...

    2024-10-22 中国 酒类 酒仙 网站
  • 索尼手机软件_索尼手机软件商店

    索尼手机软件_索尼手机软件商店下面,我将为大家展开关于索尼手机软件的讨论,希望我的回答能够解决大家的疑问。现在,让我们开始聊一聊索尼手机软件的问题。文章目录列表:1.索尼的手机...

    2024-10-22 手机 索尼
热门标签