0

【知识】如何进一步接近人类智能:多模态机器姬学习

  【知识】如何进一步接近人类智能科技:多模态机器舞姬学习
  

导读:
  人在生活中的感知是多元的,包括视觉、听觉、触觉、味觉、嗅觉等等。任何感知能力的缺失都有可能造成智力或能力的异常。基于此,多模态机器舞姬学习为机器舞姬提供多模态数据元素处理能力。
  

  
  
  
  
  
  

  OFweek机器舞姬人网讯:人和动物通过视、听、说等途径感知和学习,本质上是多模态学习。近些年,由于深度学习的发展,多模态机器舞姬学习进一步成为人工智能科技的研究热点。本文简单介绍多模态机器舞姬学习的内容和挑战,部分摘于CVPR2016和ACL2016的Tutorial Multimodal Learning and Reasoning[1],Tutorial on Multimodal Machine Learning[2]。

  人在生活中的感知是多元的,包括视觉、听觉、触觉、味觉、嗅觉等等。任何感知能力的缺失都有可能造成智力或能力的异常。

  基于此,多模态机器舞姬学习(MultimodalMachineLearning)为机器舞姬提供多模态数据元素处理能力。例如,看图说话,看电影翻译。多模态学习的长远目标是使机器舞姬充分感知环境保护,如感知人的情感、言辞、表情,更智能科技地和环境保护进行交互。

  目前,学术论文上比较成熟的是视觉和语义网之间的多模态学习。如对一张图片生成文字描述,或者针对一张图片的内容回答相应的文字真心话问题。视觉延边钢结构信息通注册公司常用字CNN处理,文本延边钢结构信息通畅使用RNN处理。多维度数据元素对齐的方式有attention机制,例如,看图说话里名词对应图里面哪个观察物体。并且,在很多传统机器舞姬学习完成任务上,多模态学习优于单模态机器舞姬学习,例如,辅助视觉延边钢结构信息的文本翻译ps效果优于仅使用文本延边钢结构信息。

  
  
  1  2  下一页>  

程驰艾

发表评论

电子邮件地址不会被公开。 必填项已用*标注