review | Academic

SLU Review Introduction

Table of Contents 口语理解基本概念语义表达语义框架对话动作本体口语理解的不确定性问题口语理解算法前沿规则口语理解方法统计方法对齐与非对齐数据对齐数据与传统统计模型非对齐数据与传统统计模型深度学习方法口语理解中的不确定性建模上下文建模及领域自适应基于对话上下文的口语理解口语理解中的领域自适应与扩展多领域的领域自适应领域扩展尚未解决的问题语义表示的设计语义解析和语音识别的联合优化口语理解的领域迁移技术参考文献：

Survey on Grammar Retrieval

Table of Contents 前言论文调研调研方向调研方式文章汇总前言在任务型的口语对话系统框架下，目前主流的口语语义理解方法主要分为基于规则、统计学习的方法。在建立一个口语语义解析器之初，领域专家或者开发者往往需要人为定义语义框架、语义槽以及符合对话场景的所有可能的槽值。基于规则的方法，则继续需要领域专家或者开发人员人为地编写、维护规则文法。基于统计学习的方法则需要数据标注人员标注大量的数据，用于有监督学习。所以现在主流的口语语义解析器的构建过程可以描述为如下几个步骤：定义指定领域的语义表示方式编写规则/(收集数据+人工标注) 生成模型校验然而其中有几大问题，使得任务型的口语义理解无法快速地构建或者领域迁移。第一个问题是“语义表示方式的定义”。目前绝大多数的方法都使用意图+槽值对的方式来表示一句话的语义。这样简单的设计对于单个领域或者应用是非常高效的，然而对于领域扩展、迁移却并不友好。比如天气领域中有语义槽“city”，机票领域中有语义槽“Fromcity”和“Tocity”，这三个语义槽在这种扁平化的设计里是属于同一层次的，然而这并不符合人类语言现象。是否改为“city”、“from.city”、“to.city”会好一点呢？那么有层次的语义槽设计具体应该是怎样的呢？第二个问题是“规则编写”和“数据标注”。数据收集和数据标注是非常耗费人力和财力的，而相比之下规则编写要轻松一些。然而目前人工编写规则有如下主要缺点：第一，人力消耗大；第二，难维护；第三，难移植到新领域。所以我们是否可以自动生成规则？是否可以提升规则系统的易维护性？是否可以实现规则的跨领域移植？那为什么我们选择基于规则检索的方法做口语义理解？原因之一是基于规则方法的可控性要高于数据驱动的基于统计学习的方法（加入一条新规则比加入一类新数据且重训模型要可控）；更重要的是语义规则是一种高层知识的体现，是很难直接从有限的数据中学习到。为此，我们希望从从基于规则的方法出发，力图解决上述几个问题，实现“开放式、可扩展”的口语语义理解。论文调研调研方向规则生成规则检索语义表示语义项自动导出规则与统计方法相结合调研方式已知的语义库 FrameNet/PropBank/AMR Freebase google搜索关键词