当前位置: www.89677.com > 互联网 > 正文

成人肥胖率与区域建筑环境特征相关,港科大教

时间:2019-11-07 18:15来源:互联网
原标题:人工智能灵魂注入,燃烧你的卡路里——2018,你AI了吗!? 原标题:人工智能在太空监测肥胖:成人肥胖率与区域建筑环境特征相关 原标题:为了帮助人类减肥,人工智能已

原标题:人工智能灵魂注入,燃烧你的卡路里——2018,你AI了吗!?

原标题:人工智能在太空监测肥胖:成人肥胖率与区域建筑环境特征相关

原标题:为了帮助人类减肥,人工智能已经忙坏了

图片 1

> 莫挨老子,老子只想做个安静的肥宅。所以,到底是谁动了我的肥宅快乐水?

  你所居住的社区中有宠物店、健身房和公园吗?还是充斥着快餐店、超市和繁忙的马路?这个答案可能预示着你的肥胖概率。

本文系网易智能工作室(公众号smartman 163)出品。聚焦AI,读懂下一个大时代!

近日,由雷锋网 & AI掘金志主办的「第二届中国人工智能安防峰会」在杭州召开。

炸鸡可乐蛋挞,烧烤火锅奶茶,游戏番剧代码,夕阳西下,阿宅瘫在沙发。

日前,两位来自美国华盛顿大学西雅图分校的研究人员发现我们所处的建筑环境与区域内的肥胖率有很大的关联。区域建筑环境特征是指区域内的自然和人为环境,例如绿地和公路等。这些环境特征可以与其他数据结合使用,从而监测地区的肥胖患病率。

你今天燃烧卡路里了吗?

峰会现场,香港科技大学教授,CVPR 2022、ICCV 2011大会主席,Altizure创始人权龙教授发表了题为《三维视觉重新定义人工智能安防》的演讲。

面对高强度工作负荷带来的久坐、各种舌尖上的诱惑,以及一系列可以窝在沙发里进行的娱乐项目,肥胖在当代逐渐成了一个可以当作“梗”来谈论的问题。一首《卡路里》展开持续洗脑式轰炸的同时,AI也一直在不断尝试对肥胖这一难题“下手”,试图从更多层面加以挖掘与解释。

他们的研究结果表明,区域内的建筑环境与不同社区肥胖患病率的变化有关。回归模型显示,建筑环境特征解释了该项目涉及的1695个人口普查区内64.8%肥胖率的变异。具体而言,该模型对不同城市肥胖率的测算能力有所不同。其最准确地预测了孟菲斯市的肥胖率,准确率为73.3%。最低是在西雅图地区,准确率是55.8%。

近年来,随着我们生活水平的提高和日常习惯的改变,肥胖渐渐成为了令无数人困扰的难题。为了实现减肥的目标,人们曾使出十八般武艺,动感单车、瑜伽、针灸、减肥药、轻断食……但对大多数人而言,减肥永远是将来时。三天打鱼两天晒网,到最后体重还是一点也未减下去。

权教授表示,人工智能的核心是视觉,视觉定义了智能安防,但现在的视觉仍局限在二维识别层面,未来三维视觉重建将会成为最重要的任务, 它也将重新定义智能安防。

根据2018年8月31日在线发表于JAMA Network Open的一项研究显示,卷积神经网络(CNN)可从卫星图像中自动提取建筑环境的特质,并用于健康指标研究。而了解建筑环境的某些特征与肥胖症患病率之间关联,则有助于引导环境结构上的变化,从而达到促进运动、降低肥胖率的作用。

研究人员提出了一种利用卷积神经网络(CNN)评估成人肥胖患病率与区域建筑环境之间关系的方法。卷积神经网络是一种深度学习方法,该研究所使用的卷积神经网络经过预先训练,能够捕捉区域环境的特点,例如绿化、土地等自然特征和道路、房屋等建筑特征。

最近,许多从事人工智能研究的科学家和大公司们开始利用AI涉足减肥这个领域,试图通过人工智能的帮助来让我们燃烧更多的卡路里。

权教授也谈到,现在计算机视觉本质上是大数据统计意义上的分类与识别。

全球疾病负担报告表明,2015年全球约有超过6.03亿成年人在遭受肥胖问题的困扰;在美国,成年肥胖人口更是占据成年总人口数的三分之一。肥胖是一个复杂的健康问题,其间涉及的关联因素颇多,包括遗传学、人口统计学,以及行为学的影响。而不健康的饮食习惯和久坐不动的生活方式则都与所处的社会环境特质及建筑环境特征密切相关,环境可以通过其间的步行方便程度、土地使用、占地面积、住宅区、可用资源(活动及娱乐场所、餐饮店等)、贫困等级、安全感以及社区设计方案等来影响人们的健康,例如靠近自然空间或是人行道的建筑设计能够在增加运动量的同时促进定期活动,这一特征在城市中尤为明显。

两位研究人员首先利用卷积神经网络从约15万张高分辨率的卫星图像中提取代表建筑环境特征的数据。这些卫星图像于2017年2月14日至28日下载,并在研究期间(2017年10月31日)更新。图像中的建筑环境信息被分为96个类比,例如宠物店和杂货店等。这种设计的内在逻辑是区域建筑对人群活动的潜在影响。比如说,有宠物店的区域可能会有更多的人带狗散步。另一方面,研究者收集了2014年美国500个城市的肥胖率估计值。随后,他们结合上述两类数据建立起了一个回归模型来评估区域内建筑环境与肥胖患病率之间的关系。

要逆天!美国科学家用AI从太空中识别肥胖社区

“我们的终极目标是对图像的理解,也就是认知,但当前的计算机视觉只处于感知阶段,我们并不知如何理解,计算机视觉一直是要探索最基础的视觉特征,这一轮视觉卷积神经网络CNN本质上重新定义了计算机视觉的特征。但人类是生活在三维环境中的双目动物,这使得人类生物视觉的识别不只是识别,同时也包括三维感知与环境交互。”

一直以来,关于肥胖问题和建筑环境间这二者间关联的讨论并不鲜见,但尽管如此,研究人员仍在研究过程中注意到了一些不一致的结果,造成这些不一致的原因可能是测量方法和测量工具的跨研究变化所导致的评估及比对困难。此外,相关指标的测量过程可能代价高昂、耗时巨大,并且易受人的主观思维模式影响。因此,研究人员需要发掘一种一致性的测量方式,以实现跨研究比较。评估并量化建筑环境与肥胖间的关系有助于人们在社区基础上对相应健康问题加以适当的干预与防范。

具体而言,一个区域建筑环境的特征如土地使用情况,公园、宠物店、健身房与快餐店的分布,公共交通情况和绿地面积等都与当地的成人肥胖率有关。以洛杉矶为例,研究人员发现高肥胖率区域的特点是密集的街区和较少的绿地,相反,低肥胖率区域拥有着更多的绿化面积。

图片 2

“因此我们要和三维打交道,二维识别所能做的事,在当前众多复杂场景中,是远远不够的。但三维重建不是最终目的,而且是要把三维重建和识别融为一体。”

对此,来自华盛顿大学的研究人员结合人工智能技术,提出了一种全面评估法,其中包含使用预训练的卷积神经网络(一种深度学习法)从高分辨率卫星图像中提取邻域的物理特征。事实上,类似的研究方法早在此前便受到了研究人员的关注。Nguyen QC等人2018年3月刊载于《JECH (Journal of Epidemiology and Community Health)》杂志的论文中,便提到了通过卷积神经网络对Google街景中的建筑环境图像进行分类,并借以评估肥胖与人行道、建筑类型、街道绿化(或景观美化)这三者间的关系。只是彼时的研究未能充分利用卷积神经网络独立发现关联因素的能力,仅局限于预设的三大变量。相较之下,此次华盛顿大学发布的最新论文则全面评估了建筑环境中的变量因素,并依据美国四个区人口普查肥胖率的细粒度关联进行方法论证。研究中所采用的方法皆可扩展,且都基于公开可用的数据与计算工具,可实现跨研究可比性。

肥胖是个复杂的健康问题,造成肥胖的因素有很多,其中之一就是我们生活的环境。据研究表明,人们周围超重的朋友越多,自身肥胖的概率也会越高。另外城市环境的绿化、基础设施等因素通过影响我们的运动生活习惯进而影响到我们的体重。于是一些美国的科学家们开始利用人工智能和美国城市卫星图联系,用来监测社区的肥胖率。

以下为权龙教授的现场演讲内容,雷锋网作了不改变原意的编辑及整理:

研究方法

洛杉矶高肥胖率地区(左)与低肥胖率地区(右)的谷歌卫星图片 (左侧高肥胖率地区以密集的街区和较少的绿地为特点;右侧低肥胖率区域有更高的植被绿化率)

来自华盛顿大学的研究人员在最新发布的论文中说到:“我们提出了一种全面评估成人肥胖患病率与建筑环境之间关系的方法,该方法涉及从高分辨率卫星图像中提取周围的物理特征。”这些人将来自谷歌地图的15万张高分辨率卫星图像输入卷积神经网络(CNN)中,后者是一种利用深度学习独立分析和识别数据集中模式的AI。

感谢雷锋网的邀请,今天我主要分享下现阶段计算机视觉的现状与未来发展方向,以及三维视觉在人工智能安防中的应用。

肥胖症患病率数据分析

事实上,全球近三分之一的人口有超重或肥胖的困扰。2017年6月,一篇发表在《新英格兰医学杂志》中的大规模全球研究项目指出全球有超过20亿儿童和成年人患有超重或肥胖相关的健康问题,占到全球人口的30%。肥胖问题导致糖尿病和心脏病的发病率急剧上升,越来越多的人因此死亡。

这些数据涵盖了六个不同城市的1695个人口普查区域,包括贝尔维尤、西雅图、塔科马、洛杉矶、孟菲斯和圣安东尼奥。在这个案例中,研究人员使用的神经网络已经利用大约120万张图像进行了预先训练,这些经验可帮助它们分析整个城市的建筑环境,识别道路、建筑、树木、水和土地等特征。

我们知道,现在AI安防的核心,本质上是计算机视觉,而计算机视觉分为两大部分,分别是识别和重建。

数据来源:选取美国疾病防控中心“500 Cities”项目中的2014年度人口普查肥胖率粗略估值

这一高肥胖率是由许多复杂因素造成的,例如遗传因素和饮食结构等。而本文的研究者认为,区域内的建筑环境也日益成为其中重要的影响因素,它可以通过资源的可用性来影响健康,例如住房,活动和娱乐空间等。

此外,研究人员还利用500个城市项目的肥胖患病率估计值,建立了新的模型,评估了这些特征(加上加油站、购物中心、公园和宠物店等感兴趣的数据点)与研究地区肥胖患病率之间的关系。这不是科学家第一次做这样的事情,但研究人员说他们的技术是迄今为止最全面的努力。

“识别”是现在非常热门的方向,相比而言,大家对“重建”的理解却并没有那么透彻。我们需要知道这一点,计算机视觉不止局限于识别,三维重建在其中扮演的角色甚至更为重要。

分析方法:包含两个步骤。首先,利用卷积神经网络以及提取处理的POI(兴趣点)数据来处理卫星图像,以抓取建筑环境特征。随后,利用弹性网络回归建立一个简约模型来评估建筑环境与肥胖率之间的关联性。

研究者尝试对建筑环境特征数据与肥胖患病率之间的显著关联给出解释。他们认为,该关联不一定是因果关系,社会经济指标可能是这一关联背后的重要影响因素。其观察结果表明,对于洛杉矶和圣安东尼奥等城市而言,肥胖患病率与建筑环境特征之间的大部分重要关联可能可以通过社会经济状况的变化来解释。但他们同时提到,卷积神经网络所识别的特征可能会捕获与社会经济指标无直接关联的其他信息,也就是说,社会经济指标并非解释建筑环境特征与肥胖率之间关系的唯一因素。

根据他们的研究结果,开放的绿色空间能支持人们进行更多身体活动,这通常对公共健康有好处而密集拥挤、被道路包围且缺乏绿化的街区,情况则正好相反。

这是三维重建和安防融合的实际案例:

获取卫星图像和POI数据

研究人员还称,他们的方法帮助专家评估不同城市的肥胖风险。此外,与昂贵且耗时的现场访问或社区调查方法相比,该研究为建筑环境的测量提供了更为客观的方法,也大大降低了统计成本。

雀巢通过AI为用户提供个性化饮食

图片 3

在设置好地理中心、图片尺寸(400*400像素)和缩放级别(缩放系数18)的情况下,从Google Static Maps API下载图像。将每个城市的地理范围划分为方形网格,其中每个点对应一对纬度和经度值,网格间距约150米。同时,利用人口普查区地图文件将每个图像与其对应的人口普查区相关联,排除城市范围外区域的图像。使用相同的方形网格来选取地理位置,并在适当的距离内开启径向附近搜索,以此实现在Google Places of Interest API上下载POI数据(此处不包含城市范围外的兴趣点)。该研究采集了96个独有的POI类别,并计算了每个人口普查区对应到每个相关类别下的位置数量。

美国杜克大学的Benjamin A. Goldstein博士等人肯定了两位研究者利用深度学习方法发现建筑环境特征的贡献。但他们强调“不要过度解释任何结果”,“深度学习方法与学科知识结合可以增加发现复杂关系的机会,但这并不意味着单独的大数据分析可以提供所有的答案”。

图片 4

图片 5

图像处理

这一研究也存在一定的局限性。文章提到,人口普查中的肥胖率数据来自居民自我报告的身高和体重,由于社会对肥胖人士的偏见,统计过程中该数据会倾向于被低估。

在减肥的过程中,控制饮食是成功非常关键的一步。食物的营养素有近50种,6大类,除了脂肪和碳水化合物,其他的营养素一样不能轻视。

图片 6

如今,卷积神经网络已经在关键的计算机视觉任务(如目标识别、图像分割)、健康相关的应用(如识别皮肤癌),以及贫困预测等领域的大数据集方面取得了突破性的成就。由于缺乏用于对高肥胖地区和低肥胖地区进行分类的大型标注数据集,研究人员采用了迁移学习(Transfer Learning)法,其中涉及使用预训练网络从包含近150000个卫星图像的未标注数据集中提取建筑环境特征。迁移学习包括微调预训练卷积神经网络以完成新任务(修改输出层)或将预训练卷积神经网络作为固定特征提取器(与线性分类器或回归模型相结合)。上述方法已经成功运用于明显不同于目标识别的计算机视觉任务。

此研究于2017年2月14日至10月31日进行,由美国华盛顿大学西雅图分校的Adyasha Maharana硕士 和Elaine OkanyeneNsoesie博士共同完成。其成果发布于2018年8月31日。

据《朝日新闻》报道,雀巢日本公司从今年5月起在日本推出了一项新型免费服务,人们在吃饭时使用智能手机拍摄食物照片,利用通信软件“LINE”发送给雀巢日本官方账号,即可通过人工智能(AI)分析出食物的卡路里及营养成分含量。此外,该账号还可根据用户年龄分析其蛋白质、脂肪等营养成分摄入量是否不足。

图片 7

研究中使用VGG-CNN-F网络,该网络有8层(5个卷积层和3个完全连接层),并且基于约120万个来自ImageNet数据库的图像进行了训练,以识别分属于1000个类别的目标。网络学习提取有助于目标检测的图像梯度、边缘和图案。诸多使用类似迁移学习方法的研究表明,从基于ImageNet数据训练的网络中提取的特征可有效地将航拍图像按照土地用途(如高尔夫球场、桥梁、停车场、建筑物和道路)进行细粒度语义分类。

作者:澎湃新闻 张唯返回搜狐,查看更多

雀巢日本公司还从去年10月开始发售了可根据个人情况补充营养成分的胶囊。

这些景物都是由三维构建,我们把实时视频投影到三维,用户在界面上也可以“前、后、左、右”拖动操作。

研究人员收集了数据集中每个图像网络第二个完全连接层的输出,这一层有4096个节点,每个节点与其上一层及下一层的节点间呈非线性连接,每个特征向量为4096维,对应(也称激活)着来自这些节点的输出。通过计算人口普查区域所有图像的均值,这些输出进一步聚合成每个人口普查区的均值特征向量。这些特征共同代表建筑环境的指标。为了研究CNN能否区分建筑环境特征,研究人员通过网络向前传输了一组随机图像,并检查lCNN卷积输出的地图(图1)。同时,研究人员还对图像特征进行了分组,以此说明在肥胖率低和高的地区,建筑环境的特征存在差异(图2)。

责任编辑:

雀巢日本公司的总裁兼首席执行官Kozo Takaoka认为“与食品和营养相关的健康问题已成为一个大问题,雀巢必须在全球范围内解决这个问题,并将其作为21世纪的使命。”

接下来我要讲的是当前计算机视觉存在的问题,以及为何三维视觉将重新定义计算机视觉,并且重新定义人工智能安防。

图片 8

此前,在2017年9月的时候,雀巢公司还曾宣布与京东集团推出雀巢首款语音识别智能家庭营养健康助手——雀巢小 AI 。雀巢大中华区董事长兼首席执行官罗士德表示,中国市场的变化非常快,雀巢每两到三年就要重新定位和更新战略,而此次跨界布局,我们希望借助雀巢小 AI 为家庭提供娱乐性和知识性方面的内容,另一方面借助智能产品收集用户信息,更新消费者数据库,以此来了解用户的需求,为产品创新和改良提供基础,推出更多解决方案。

人工智能的本质上是让计算机去听、看、读,在所有的信息里面,视觉信息占了所有感官的80%,所以视觉基本上是现代人工智能的核心。

图1 卷积神经网络模型下的特征可视化

谷歌人工智能想打造一个无时无刻的健身教练

对我们来说,其实并没有泛泛的人工智能,人工智能需要具体根据技术维度和场景维度,区分开来看,人工智能的发展、革命和应用落地,一定是取决于以及受限于计算机视觉发展、革命和应用。

图片 9

图片 10

而人工智能安防也同样是伴随着计算机视觉的发展而崛起。

图2

很多AI巨头都在开发AI健身教练,我们以谷歌为例,他们正在开发一款名为Google Coach的可穿戴式健康健身助理。

2012年是非常重要的一年,当时在ImageNet比赛中,有团队用卷积神经网络CNN把图像识别准确率从75%提高到了85%,这件“非常小”的事情带动了这一轮深度学习之下的人工智能,所以我们也可把2012年称作是这轮以深度学习为代表的人工智能元年。

统计分析

虽然目前已经有很多健身类可穿戴设备来帮助我们追踪自身健身情况、监控生命特征,不过谷歌所打造的Google Coach希望在此基础上更进一步,像一个完完全全的健身教练一样,无时无刻指导你进行健康的生活。

这件事再回到1998年,那个年代Yann Lecun已经发表了卷积神经网络LeNet,这个网络呢,首先它输入的图像比较小,只黑白单通道32*32,只能识别出一些字符和字母;因为也没有GPU,所以当时整个网络也只有60万的参数。

运用弹性网络(一种正则化回归方法),消除了非重要协变量,保留了相关变量,非常适用于从该研究图像数据集中提取的高维(n = 4096)特征向量。弹性网络的正则化防止过拟合,这也是出于高纬度数据集的考量。为了选择合适的调整参数值(λ值),这里用到了交叉验证法,并选取了最小化均值交叉验证错误的值。

因为Google Coach可以通过分析用户的健身和生理数据,为用户推荐合适的健身方式、追踪用户的健身进度。如果用户错过Google Coach提供的健身计划,Google Coach还会为用户提供一些推荐的替代解决方案来进行弥补。

到了2012年卷积神经网络复活出现了AlexNet。AlexNet和1998年LeNet的卷积神经网络相比,它的内部结构基本不变,但可输入的图像尺寸不一样:1998年的模型,输入尺寸为32*32,且只有一个通道。新的模型输入尺寸已经扩大到了224*224,而且有三个通道。最关键的是里面有了GPU,当时的训练用到了两块GPU,参数达到将近6000万。

采用5折交叉验证回归分析法,以量化下列关联:① 人口普查区建筑环境特征与肥胖率之间的关联;② 人口普查区POI密度与肥胖率之间的关联;③ 人口普查区建筑环境特征与人均收入差异之间的关联(数据来自“美国2014年度社区调查”中的未来五年预测)。研究还将数据分为两个随机样本,并用样本1代表模型拟合中60%的数据,其余40%则在所有分析中进行验证。上述分析针对所有地区共同进行,并对每个地区独立进行。

Google Coach的服务不仅仅是监控用户的各项活动数据,还会根据用户的身体素质推荐合适的营养配餐。它会为用户提供未来一周内的饮食安排,遵循健身运动“三分靠练,七分靠吃”的原则,真正地像一个健身教练一样为用户指定周密的减肥计划。

图片 11

除此之外,基于人工智能技术的食物营养成分分析项目、科学食疗方案、食物照片的卡路里识别项目、各种穿戴设备、语音识别智能家庭营养健康助手等应用早已数见不鲜,其中就包括Google在2015年推出的Im2Calories项目、2018年的Google Coach,以及雀巢公司与京东集团2017年在智能音箱“叮咚”上合作推出的雀巢小AI……

另外,Google Coach还可以为用户提供一些日常的健康提示,比如需要饮用多少水,何时服用药物,或者应该走多少步等等。

这么多年来计算机视觉的卷积神经网络,算法和结构,基本的结构变化是很小的。

由是观之,人工智能在人类健康问题上的探索之路正在不断延伸。想要了解更多人工智能前沿技术与行业深度应用? 2018 AI 开发者大会(AI NEXTCon)来啦!

AI+减肥是万能的?其实还是得靠个人自律

但1998年到2012年这十五年来发生了两件特别重要的事:一是英伟达研发了GPU;第二就是李飞飞创建了ImageNet,她把几百万张照片发到网络上并发动群众做了标注。也正是因为算力和数据,才创造了AlexNet的成就。

2018 AI 开发者大会(AI NEXTCon)

图片 12

到了2015年,机器视觉的识别率基本超越了人类。其实人类在识别方面并没有那么强,我们的记忆非常容易犯错误。根据统计,人类在分类上的错误率达到了5%。而机器,从2015年之后你们看各种ImageNet在公开域数据集上的错误率已经远远低于5%。

2018年11月8-11日,专为AI开发者而生的 2018 AI 开发者大会(AI NEXTCon)将锁定北京,以“AI技术与应用”为核心,深度聚焦人工智能的技术创新与行业应用,为 AI 从业者展示前沿技术、优选产品、行业应用案例,并深度解读行业发展趋势。

在人工智能涉足减肥领域的环节中数据化和智能化是AI帮助我们达成减肥目标的前提。我们每个人在去健身房的第一次都会被健身教练要求做一次全身的体测,这个数据会成为日后健身教练为我们制定健身目标的重要依据。

但为什么ImageNet在两年前停止了比赛,因为现在比拼的基本上都是靠算力和数据。

本次大会由中国专业的IT社区CSDN与硅谷AI专业社区AICamp联合出品,AI NEXTCon是继在西雅图,硅谷,纽约成功举办5届后首次进入中国,凭借双方多年AI领域的深厚积累及海内外实力讲师资源优势,本次大会将成为AI产业的年度盛会。

但是随着智能可穿戴设备的普及,我们通过AI就可以完成对自身身体情况的评估,并且在AI的监控下实时记录自身的运动表现情况。

2015年随着卷积神经网络下的人工智能技术的成熟,AI也到达了一定的巅峰,计算机视觉或者说更宽泛的安防市场也被重新定义。

大会以『AI技术与应用』为核心,着眼于人工智能的技术创新与深度行业应用,设置了计算机视觉、深度学习、 机器学习、知识图谱等多场技术论坛,优选AI技术在金融、医疗、教育、新零售、无人驾驶等最佳实践应用行 业论坛。此外,大会还安排有AI新品体验主题展区、编程马拉松大赛、开发者对话硅谷AI之夜、AI技术专题深 度培训等等丰富活动,力图以『超实用技术+高效应用+超IN新品』描述出2018全球人工智能技术与应用全景图。

很多人认为,在人工智能时候健身教练将逐渐消失。目前很多健身的智能设备已经开始推出了越来越多的各种适合减脂、塑形和增肌的针对性主题训练课程,而且可以通过监测用户的动作完成度和标准度,结合语音提醒,有效帮助用户科学、安全、高效地进行健身运动。这种对身体运动幅度和效果的数据判断,是人类健身教练无法掌控的。

也在这一时期,旷视、商汤这几家做视觉的公司进入了安防市场。

日前,2018 AI 开发者大会组委会公布了首批讲师阵容,超豪华阵容一睹为快:

但减肥终究还是需要靠自身毅力才能完成的,人工智能能够做到的只是为我们提供运动上生活上的辅助,通过透明、实时的监控和题型,让我们能随时掌控自己的运动能力和身体情况。但仅仅依靠人工智能的帮助还是远远不够,影响减肥成功与否的因素太多太多,唯有一颗持之以恒的决心、自律的运动和饮食控制,才是减肥最必不可缺的因素。(李泽宽)

从2012年到2019年的7年间,所有的数据又都翻了一千倍,计算速度比以前快一千倍,模型也比以前大一千倍。2012年训练AlexNet模型需要使用两块GPU,花费两个星期;今天做同样的事情只需要一块DGX-2,十几分钟就能完成。

Demis Hassabis DeepMind联合创始人

关注网易智能公众号(smartman163),为你解读AI领域大公司大事件,新观点新应用。返回搜狐,查看更多

从整个模型的参数来看,2012年的AlexNet已非常可观,6000万的参数非常庞大,这个数字我们当时都不敢想象。到今天这个网络又要放大千倍,达到十亿级的参数量。但是从算法、架构来说,现在基本上都是标准的卷积神经网络,其实并没有太大的进步。

图片 13

责任编辑:

我们也可以想一下,计算机视觉里面的识别到底能够达到什么程度?其实它并没有那么强,它只是在一个大数据统计意义上的识别而已。

DeepMind联合创始人 Demis Hassabis

大家都听说过无监督学习,但无监督学习的结果和应用的场景并不是太多。现在可用的、做的好的也就是可监督的,也就是CNN。

蒋涛 CSDN创始人&董事长

我简要概括下,现在的计算机视觉就是基于卷积神经网络而来,整个CNN的架构非常简单,能做的事其实也没那么多,它提取了高维的特征,然后要结合其它方法解决视觉问题。

图片 14

如果你有足够的数据并且能够明确定义你想要的东西,CNN的效果很好,但是它有没有智能?其实没有。

CSDN创始人&董事长 蒋涛

你说它蠢,它跟以前一样蠢。它能识别出猫和狗,但我们要知道猫和狗的分类都是我们人类自己定义的,我们可以把猫和狗分开,也可以把复杂的狗类动物进行聚合和分类,这些东西本质上来说并不是客观的,而是主观的。

王小川 搜狗CEO

我们做计算机视觉研究的理想,是让机器进行理解图像。如何让它进行理解?这非常的困难,直到现在也没有人知道它怎么去进行理解。现在它能做的,只能做到认知。我们研究计算机视觉的目的是得到视觉特征,有了视觉特征后才能开展一系列工作。

图片 15

为什么视觉特征如此重要?在语音识别领域,语音的特征已经定义得非常清晰——音素。但如果我们拿来一个图像,问它最重要的视觉特征是什么,答案并不明确。大家知道图像包含像素,但像素并不是真正的特征。像素只是一个数字化的载体,将图像进行了数字化的表述。计算机视觉的终极目标就是寻找行之有效的视觉特征。

搜狗CEO 王小川

在这样一个拥有视觉特征前提之下,计算机视觉也只有两个现实目的,一个是识别,另一个是三维重建。

马维英 今日头条副总裁人工智能实验室主任

它们的英文单词都以“re”做前缀,说明这是一个反向的问题。

图片 16

计算机视觉不是一个很好定义(ill-posed)的问题,没有一个完美的答案或方法。

今日头条副总裁人工智能实验室主任 马维英

这一轮的卷积神经网络最本质的一件事是重新定义了计算机视觉的特征。在此之前,所有的特征都是人工设计的。今天CNN学来的东西,它学到特征的维度动辄几百万,在以前没有这类网络的情况下是根本做不到的。

崔宝秋 小米人工智能与云平台副总裁

纵使CNN的特征提取能力极其强,但是我们不要忘记建立在CNN基础上的计算机视觉是单目识别,而人类是双目。我们的现实世界是在一个三维空间,我们要和三维打交道。拿着二维图像去做识别,这远远不够。

图片 17

在双目视觉下,要包含深度、视差和重建三个概念,它们基本等价,使用哪个词汇取决你处在哪个群体。

小米人工智能与云平台副总裁 崔宝秋

传统意义上,三维重建是在识别之前,它是一个最本质的问题,三维视觉里面也要用到识别,但是它的识别是对同样物体在不同视角下的识别,所以说它的识别是更好定义(well-posed) 的一个识别,也叫匹配。

Nikko Strom Sr. Principle Scientist, Amazon

双目视觉对整个生物世界的等级划分是非常严格的。大家知道马的眼睛往外看,对角的部分才有可能得到一部分三维信息,但它的三维视角非常小,不像人类。鱼的眼睛也是往两边看的,它的主要视线范围是单目的,它能看到的双目视区也是非常狭窄的一部分。

图片 18

人类有两只眼睛,通过两只眼睛才能得到有深度的三维信息。当然,通过一只移动的眼睛,也可以获得有深度的信息。

Sr. Principle Scientist, Amazon Nikko Strom

获取深度信息的挑战很大,它本质上是一个三角测量问题。第一步需要将两幅图像或两只眼睛感知到的东西进行匹配,也就是识别。这里的“识别”和前面有所不同,前面提到的是有标注情况下的识别,这里的“识别”是两幅图像之间的识别,没有数据库。它不仅要识别物体,还要识别每一个像素,所以对计算量要求非常高。

朱珑 依图科技联合创始人兼CEO

在生物世界里,双目视觉非常重要,哺乳动物都有双目视觉,而且越凶猛的食肉的动物双目重叠的区域越大,用双目获得的深度信息去主动捕捉猎物。吃草的或被吃的动物视觉单目视觉,视野很宽,只有识别而无深度,目的是被进攻时跑得快!

图片 19

在这一轮的CNN之前,计算机视觉里面研究最多的是三维重建这样的问题,在CNN之前有非常好的人工设计的视觉特征,这些东西本质上最早都是为三维重建而设计,例如SIFT特征。而在这之后的“识别”,只是把它放在一个没有结构的图像数据库里去搜索而已。 由此可见,现代三维视觉是由三维重建所定义。CNN诞生之前,它曾是视觉发展的主要动力源于几何,因为它的定义相对清晰。

依图科技联合创始人兼CEO 朱珑

我们再来看一下当今的三维重建技术的现状和挑战。

初敏 思必驰副总裁北京研发院院长

三维视觉既有理论又有算法,一部分是统计,另外一部分则是确定性的,非统计,也就是传统的应用数学。

图片 20

计算机视觉中的三维重建包含三大问题:一、定位置。假如我给出一张照片,计算机视觉要知道这张照片是在什么位置拍的。二、多目。通过多目的视差获取三维信息,识别每一个像素并进行匹配,进行三维重建。三、语义识别。完成几何三维重建后,要对这个三维信息进行语义识别,这是重建的最终目的。

思必驰副总裁北京研发院院长 初敏

这里我再强调下,我们要把三维场景重新捕捉,但三维重建不是最终的目的,你要把识别加进去,所以说最终的应用肯定要把三维重建和识别融为一体。

胡时伟 第四范式联合创始人

现在三维重建的主要挑战是,算力不够,而且采集也比较困难。我举个例子,我们安防场景识别一个摄像头比较容易,但如果实时重建N个摄像头的实景,这对算力要求非常高。这些限制也使得当前的单目应用比较多,但我认为,未来双目一定会成趋势。

图片 21

在深度学习的影响下,三维重建已经取得了比较大的成就。CNN在2012年之后的几年内,对三维重建的影响不是很大。但是从2017年开始,CNN就对三维重建产生了重要的影响。在三维重建领域有一个数据集叫KITTI,从2017年,我们开始用三维卷积神经网络。

第四范式联合创始人 胡时伟

以前是把它作为一个跟识别有关系的二维CNN,更现代的双目算法都是基于完整的三维卷积神经网络。现阶段三维卷积神经网络的表现也非常强,给任何两幅图像,错误率只有百分之2到3。

范凯 丁香园CTO

现在计算机视觉覆盖的应用场景,被计算机视觉重新定义,但这些应用也受制于计算机视觉的技术瓶颈。

图片 22

虽然计算机视觉对安防行业的推动作用很大,但基本也不外乎识别人脸、车、物体等应用,如果计算机视觉得到进一步发展,安防行业也将再度被重新定义。

丁香园CTO 范凯

而我认为,三维视觉将对安防产生非常深远的影响。

Baiyang Liu Sr. Staff Scientist, Facebook

三维重建在安防领域的应用,第一个是大规模城市级别的三维重建。

图片 23

图片 24

Sr. Staff Scientist, Facebook Baiyang Liu

每个大型城市动辄都百万级的摄像头,把摄像头融合在这样的一个实景三维场景里,才可达到城市级管控的效果,这是AI安防最理想化的形态。

Liang Zhang Director of Engineering, LinkedIn

现在政府都在通过一张实景图对城市进行治理,这张图以前是二维的,但今后一定是实景的,是三维的。

图片 25

我们港科大的三维视觉初创公司Altizure就是一家做城市级别的实景三维重建和平台企业,大规模重建有两方面非常有挑战性:

Director of Engineering, LinkedIn Liang Zhang

第一是因为它的数据量非常大,我们现在建模动辄百万级的高清图像,要有强大的分布式以及并行算法,几个星期才能做完。

Vajda Peter Engineering Manager, Facebook

第二就是可视化,一张实景图的展示也特别有挑战性,因为一张实景图数据量非常大,即便是在任何一个端口的浏览实景三维都是非常有挑战性的。

图片 26

现时只有Altizure可以应对这个挑战。

Engineering Manager, Facebook Vajda Peter

我们做的一个典型案例就是为深圳坪山区布局了时空信息云平台,我们对坪山的大片住宅区域进行了三维重建,后台用户可在三维实景图像上进行“上、下放大“以及”前、后、左、右”拖拽移动,来查看区域实景。

Sarah Aerni Director of Einstain, Salesforce

后台用户也可用鼠标在三维实景图像中选取部分区域,然后这一区域的各个重点视频监控画面便在大屏幕中一一实时展示。坪山第一期项目的实时监控视频显示,与常规的视频监控后台呈现效果相似,总体更为传统一些。

图片 27

而在二期和三期,我们开始可以把所有的视频在三维平台上进行展示。

Director of Einstain, Salesforce Sarah Aerni

现在深圳已经有很多区在布局这类实景三维立体时空信息平台。

漆桂林 东南大学计算机科学与工程学院教授

有了这样的平台,不仅是视频,其实还有一些别的数据也是可以加进去应用。

图片 28

这个总控系统,集成了景区的监控摄像,闸机,商店,wifi等公共设施,实时可视化人流、电瓶车位置。三维实景给景区总控和下一步游客的导览带来了便利。

东南大学计算机科学与工程学院教授 漆桂林

下图是我们在广州做第一个案例,对历史建筑进行保护以及城市规划。

张伟 丁香园副总裁

图片 29

图片 30

Altizure实景三维视觉平台现在已经有180个国家的实景三维内容和30万专业用户。

丁香园副总裁 张伟

图片 31

鹿晓亮 科大讯飞医疗事业部副总经理

我们的香港科技大学计算机视觉实验室和初创公司Altizure 在全球引领视觉三维重建的研究与应用。我们的目的并不是为刷榜而刷榜,但在一些关键的三维榜单,我们从去年四月以来一直稳居榜首!

图片 32

图片 33

科大讯飞医疗事业部副总经理 鹿晓亮

最后总结一下,计算机视觉中的“识别”定义了智能安防,但现在的“视觉”和“识别”仍局限在二维,三维重建是未来计算机视觉中最为重要的任务,因此三维重建也将重新定义人工智能以及智能安防。

Jeremy Hermann Head of Machine Learning, Uber

现在的视觉研究,同质化现象非常明显。

图片 34

我们在八十年代就开始做人工智能了,今天的现状,有点像是历史重演,计算机视觉的本质跟以往并没什么差别,只是大家用的硬件工具不一样。

Head of Machine Learning, Uber Jeremy Hermann

计算机视觉虽然正处于黄金时期 ,但它的发展还是非常有局限性的,我认为,所谓的通用人工智能和通用计算机视觉还遥遥无期。

Chester Chen Head of Data Science, Gopro

谢谢大家!

图片 35

Head of Data Science, Gopro Chester Chen

近百位海内外顶尖AI专家领先企业代表、千位AI开发者及业内人士11月8-11日将齐聚北京,技术比舞产业论证,共同唱响2018 AI开发者大会,热切邀请您和企业参与一起共铸AI新篇章。

> 技术创新+行业深挖,更多精彩预告请跳转「大会官网」。五折早鸟票票火热进行中,专为AI开发者而生,就等你了!

图片 36返回搜狐,查看更多

责任编辑:

编辑:互联网 本文来源:成人肥胖率与区域建筑环境特征相关,港科大教

关键词: