技术编号:33399613
提示:您尚未登录,请点 登 陆 后下载,如果您还没有账户请点 注 册 ,登陆完成后,请刷新本页查看技术详细信息。.本发明属于计算机视觉与自然语言处理交叉技术领域,尤其涉及一种基于知识感知注意力网络的视觉常识推理方法及系统。背景技术.本部分的陈述仅仅是提供了与本发明相关的背景技术信息,不必然构成已经成为本领域一般技术人员所公知的现有技术。.在由大量不同模态数据构建的多媒体世界中,不同模态的数据在具体应用的过程中具有高度相关性。单模态学习是指将信息表示为计算机可以处理的数值向量或进一步抽象为更高层的特征向量;而多模态学习旨在通过机器学习的方法,利用多模态之间的互补性,剔除模态间的冗余性,从而学习到更好的...
注意:该技术已申请专利,请尊重研发人员的辛勤研发付出,在未取得专利权人授权前,仅供技术研究参考不得用于商业用途。
该专利适合技术人员进行技术研发参考以及查看自身技术是否侵权,增加技术思路,做技术知识储备,不适合论文引用。
请注意,此类技术没有源代码,用于学习研究技术思路。