Table of Contents 前言 论文调研 调研方向 调研方式 文章汇总 前言 在任务型的口语对话系统框架下,目前主流的口语语义理解方法主要分为基于规则、统计学习的方法。在建立一个口语语义解析器之初,领域专家或者开发者往往需要人为定义语义框架、语义槽以及符合对话场景的所有可能的槽值。基于规则的方法,则继续需要领域专家或者开发人员人为地编写、维护规则文法。基于统计学习的方法则需要数据标注人员标注大量的数据,用于有监督学习。所以现在主流的口语语义解析器的构建过程可以描述为如下几个步骤:
定义指定领域的语义表示方式 编写规则/(收集数据+人工标注) 生成模型 校验 然而其中有几大问题,使得任务型的口语义理解无法快速地构建或者领域迁移。
第一个问题是“语义表示方式的定义”。目前绝大多数的方法都使用意图+槽值对的方式来表示一句话的语义。这样简单的设计对于单个领域或者应用是非常高效的,然而对于领域扩展、迁移却并不友好。比如天气领域中有语义槽“city”,机票领域中有语义槽“Fromcity”和“Tocity”,这三个语义槽在这种扁平化的设计里是属于同一层次的,然而这并不符合人类语言现象。是否改为“city”、“from.city”、“to.city”会好一点呢?那么有层次的语义槽设计具体应该是怎样的呢?
第二个问题是“规则编写”和“数据标注”。数据收集和数据标注是非常耗费人力和财力的,而相比之下规则编写要轻松一些。然而目前人工编写规则有如下主要缺点:第一,人力消耗大;第二,难维护;第三,难移植到新领域。所以我们是否可以自动生成规则?是否可以提升规则系统的易维护性?是否可以实现规则的跨领域移植?
那为什么我们选择基于规则检索的方法做口语义理解?原因之一是基于规则方法的可控性要高于数据驱动的基于统计学习的方法(加入一条新规则比加入一类新数据且重训模型要可控);更重要的是语义规则是一种高层知识的体现,是很难直接从有限的数据中学习到。为此,我们希望从从基于规则的方法出发,力图解决上述几个问题,实现“开放式、可扩展”的口语语义理解。
论文调研 调研方向 规则生成 规则检索 语义表示 语义项自动导出 规则与统计方法相结合 调研方式 已知的语义库 FrameNet/PropBank/AMR Freebase google搜索 关键词