论文阅读:基于多模态词向量的语句距离计算方法

Iona ·
更新时间:2024-09-21
· 914 次阅读

论文信息

文章来源:cnki.net

添加链接描述

文章类别,发表时间

华阳. 基于多模态词向量的语句距离计算方法[D].哈尔滨工业大学,2018.

摘要

摘要分三段,大致阐述了本文的出发点和工作内容,基本情况如下:

简述语句间的距离问题:自然语言处理任务是度量文本间的距离;不同阶段语言学习的难度可以抽象为距离,本文探索语句间的距离。 从两个角度阐述传统词向量距离的缺陷:基于纯文本语料的词向量构建,与人类通过多种感官途径接受信息不符;传统的多模态词向量通过拼接词向量与图像特征略显粗糙。本文提出了基于空间注意力机制的多模态词向量构建方法加强目标物体局部区域的表示。 句嵌入的构建:
在改进多模态词向量的的基础上研究句嵌入的构建,提出了三种改进方法:1).基于神经词袋模型。2)基于双向RNN。3)基于GRU。
语句距离计算:
基于MLP和交互注意力机制的两种距离计算方法。在释义识别,答案选择和语句难度上测试性能。实验结果表明模型能够对难度距离这一抽象概念进行建模。 1.绪论 1.1应用场景

信息检索:搜素引擎计算文本间距离对搜索页面进行筛选。
机器翻译:机翻需要匹配语料库中相似度最高的语句,其核心技术正是语句的距离计算。
问答系统:问答系统中的问题很多只是表述上存在差异,其回答是类似的,通过计算语句间的距离对问题进行分类,对相似度高的问题提供一致的答案。

1.2 研究内容 将视觉信息注入文本,作为多模态向量研究的基础。 多模态词向量的构建,作为本文的一个中间模块。 句嵌入的构建,作为计算语句距离的基础。 构建多模态词向量语句计算模型
作者:yang_live



词向量 方法

需要 登录 后方可回复, 如果你还没有账号请 注册新账号
相关文章