文/陈根
具有代替和指示作用的代词,作为实词在句法和文本中具有重要作用。代词令语言简洁且更富有变化性。
对于人类来说,识别代词指代对象并不算困难,凭借对上下文和对句子的理解就可以找出代词的指代对象。然而,对于人工智能来说,却并不容易机器对文本的理解通常需要核心性解析。换言之,能否准确搜索、追踪、分析代词与实体之间的关联,对于人工智能能否准确理解文本内容至关重要。
这种能力被称为共指消解(Conference Resolution),是自然语言处理(NLP)领域的重要研究方向,即通过追踪长句、段落、文章中的代词,找到其对应的指代对象或内容。
尽管目前有很多体量庞大的众包数据集,但它们主要考察模型理解局部语义以及谓词参数结构,涉及共指消解的问题很少见。
针对这一问题,艾伦人工智能研究所的研究团队最近公布了一个新的众包数据集,被称为为QUOREF,里面包含超过 2400 个广度选择问题,旨在专门考察模型的共指消解能力。这些问题需要在维基百科的 4.7K 多个英文段落中分析并找到各个实体的指代对象。
作为专门测试共指消解能力的数据集,QUOREF 足以证明目前常见的机器阅读理解模型仍有很大的进步空间。通过分析错误答案背后的原因,NLP 研究者才能更好地改进模型,实现在复杂、多元、大跨度的文本内容中准确对应实体与代词,做到真正意义上的的语义理解。