论文信息
文章来源:cnki.net添加链接描述
文章类别,发表时间华阳. 基于多模态词向量的语句距离计算方法[D].哈尔滨工业大学,2018.
摘要摘要分三段,大致阐述了本文的出发点和工作内容,基本情况如下:
简述语句间的距离问题:自然语言处理任务是度量文本间的距离;不同阶段语言学习的难度可以抽象为距离,本文探索语句间的距离。 从两个角度阐述传统词向量距离的缺陷:基于纯文本语料的词向量构建,与人类通过多种感官途径接受信息不符;传统的多模态词向量通过拼接词向量与图像特征略显粗糙。本文提出了基于空间注意力机制的多模态词向量构建方法加强目标物体局部区域的表示。 句嵌入的构建:信息检索:搜素引擎计算文本间距离对搜索页面进行筛选。
机器翻译:机翻需要匹配语料库中相似度最高的语句,其核心技术正是语句的距离计算。
问答系统:问答系统中的问题很多只是表述上存在差异,其回答是类似的,通过计算语句间的距离对问题进行分类,对相似度高的问题提供一致的答案。