苏州昊瓦智能装备有限公司

您现在的位置:新闻首页>拖链选型

微软沈向洋:要让“机器人”能讲出图像背后的故事

2024-01-23 09:40编辑:admin人气:617


  人们皆喜好“看图说话”,而人工智能(AI)的研讨者们期望将来较量争论性能像人类一样辨认图片,明白图片背后的故事。但这一行业的顶尖研讨者却以为,要到达这个条理,人工智能研讨的使命其实不轻松。

微软沈向洋:要让“机器人”能讲出图像背后的故事

  微软环球施行副总裁沈向洋1月17日正在“将来论坛”上谈及人工智能入网算机视觉的最新研究进展时暗示,正在图象处置的题目中,对图象的明白是一个前沿性的题目,也许也有“漫冗长路要走”。

  沈向洋称,人工智能已成长了50余年工夫,真正要把人工智能做得像人类智能一样的水平,首先要感知,然后是认知。人工智能不仅是计算机科学,它是一门交叉学科,包含了心理学、社会学、哲学、脑科学等等。

  对图象的辨认则是人工智能发展中的一个主要分支,重量级的互联网公司都在该范畴发力。

  以Google推出的GooglePhotos的为例,GooglePhotos不仅是相册,还具有了智能的图片辨认技能:它能够将相册中同一个人物的照片整合在一起,比方回忆一个宝宝从小到大的生长轨迹。其“练习”历程是:AI具有30层神经网络,每一层对应着差别的笼统水平,比方最低条理能辨认光芒、颜色,下一条理能辨认图片的边沿等等。如许一层层的“练习”需求大批的数据。每一层都能提掏出更高条理的细节,而最终一层会决议AI对图片的明白。

  客岁岁尾,微软亚洲研究院视觉盘算组正在一项竞赛中,对深层神经网络技术又进行了打破:现阶段遍及利用的神经网络层级可以到达20到30层,此次竞赛中该团队运用的神经网络系统实现了152层。

  据悉,微软的谈天机械人小冰曾经整合了微软正在图象辨认上的手艺,没有仅能辨认图象范例和要素,还能开展人性化的描写。

  不外,人工智能在对图象举行处置时,虽然现在的辨认技能曾经很是先进了,但并不是每一次都很灵光。一些实验就标明,研究员给出的类似、邻近或是较庞杂的图象,通常可以骗过计算机,使其得出毛病或是不那么正确的结论。

  关于这一些题目,沈向洋说到,图象识别能够分为三个题目:一是对图象的分类,二是对图象中的要素的发觉,三是像素级另外辨别。今朝对这三个题目研讨的进度都很疾速,但应该再向前一步对图象了解举行深入研讨。

  “好比Howold,MicrosoftSelfie这一些软件,对图象的了解究竟能保证什么境界?一张照片来了以后,能不能表明这张照片究竟是什么,能不能发掘背后的故事。怎样让这个进程变得愈加风趣。”沈向洋说道。

  微软把这一些功效集成正在小冰谈天机器人身上。沈向洋正在论坛现场展现的一张图片显现,一张照片中有巨细两只猫,假如仅仅是按计算机视觉来干,会得出“这张图里有两只猫”的结论,而小冰却可以说出“看这猫的眼神儿太锋利了”,进而让谈天历程变得更风趣。沈以为,这类人性化的描写经过计算机辨认没法到达,只有经过人类交互能力到达。

  这类更加庞杂的交互方法是AI进步的一个主要标的目的。“人工智能是近年来最火的研讨范畴,可是当我们真正走向人工智能的时辰,算是正在机械视觉的那样一个分支上,皆也有漫冗长路要走。”沈向洋说道。


参考资料
(来源:未知)

  • 凡本网注明"来源:的所有作品,版权均属于中,转载请必须注明中,http://www.propolki.com。违反者本网将追究相关法律责任。
  • 本网转载并注明自其它来源的作品,目的在于传递更多信息,并不代表本网赞同其观点或证实其内容的真实性,不承担此类作品侵权行为的直接责任及连带责任。其他媒体、网站或个人从本网转载时,必须保留本网注明的作品来源,并自负版权等法律责任。
  • 如涉及作品内容、版权等问题,请在作品发表之日起一周内与本网联系,否则视为放弃相关权利。






返回首页