您当前的位置 :胶州新闻网 > 汽车 > 麻省理工学院开发新的成像软件 - 图像软件识别 - 工业控制新闻

麻省理工学院开发新的成像软件 - 图像软件识别 - 工业控制新闻



MIT开发了新的成像软件

2008/12/9 11: 02: 32

资料来源:中国图像网

麻省理工学院(MIT)的一个团队惊讶地发现只有几个像素的信息能够识别图像中的目标。这一发现为在线图像的自动识别带来了巨大的进步,并最终为计算机观察人类等事物奠定了基础。麻省理工学院计算机科学与人工智能实验室的助教安东尼奥·托拉尔巴及其同事试图找到最少量的信息,这些信息是从图像中获得最短的数字表示,以提供内容的有用表示。

导出如此短的表示将是一个重要的步骤,使得可以自动对因特网上的数亿个图像进行分类。现在,搜索图像的唯一方法是手动键入每个图像的文本标题,并且许多图像缺少此类信息。自动识别还为人们提供了一种方法,可以将数码相机下载的图像检索到计算机,而无需手动检查每个标题。最终它将触发真实的机器视觉,也许有一天会让机器人了解相机中数据的含义并找出它们的位置。

托拉尔巴说:“我们都试图找到最短的图像代码,所以如果这两个图像具有相似的(数字)序列,它们可能是相似的,也就是说,它们可能由大致相同的目标组成,大致相同的结构“。如果图像由标题或标题标识,则与数字代码匹配的其他图像可以显示相同的目标(例如,汽车,树,人),因此与图像相关联的名称将被转移到另一个图像。 。托拉尔巴表示,使用这种方法来识别图像,“对于大量图像,即使是相对简单的算法也能很好地运行。”他将在今年6月在阿拉斯加举行的机器视觉和模式识别会议上展示他的最新发现。这项工作是与纽约大学库仑学院的Rob Fergus和耶路撒冷希伯来大学的Yair Weiss合作完成的。

需要识别目标信息

为了找出人们识别图像中目标所需的图像信息有多小,Torralba和他的合作者试图将图像降低到更低和更低的分辨率,然后观察人们在每个级别可识别的图像数量。 “我们能够确定图像中的内容,即使分辨率非常低,因为我们对图像了解很多,”他说。 “识别大多数图像所需的信息量大约为32到32”。相比之下,即使Google搜索中显示的小缩略图的典型值也是100到100。

即使由廉价数码相机产生的图像也包含数百万像素的数据,每个像素通常由24位数据组成。但是Torralba及其同事开发的数学系统可以更加简化每个图像的数据,并证明即使图像采用仅包含256到1024位数据的数字表示进行编码,许多图像也是可识别的。

Torralba表示,由于每张图像的数据非常少,因此可以使用普通PC在一秒内在数据库中搜索数百万张图像中的类似图像。与需要将图像分解为不同目标部分的其他方法不同,此方法使用整个图像,因此无需人工干预即可轻松应用于大型数据集。

例如,Torralba和他的同事们使用他们开发的编码系统,仅使用600 MB就能在互联网上代表1.29亿张图像。这些数据足够小,可以匹配大多数当前PC的RAM,并且可以存储在记忆棒中。图像数据库和软件使数据库搜索能够在Web上公开。匹配现在对最常见的图像类型有效。托拉尔巴说:“创造所有图像并不相同。”图像越复杂或越独特,它就越不可能正确匹配。但是对于图中最常见的目标,结果令人印象深刻。

加入Gkong收藏夹

我想发布新闻