aipi是什么意思中anki怎么建立子牌组

【猎云网(微信号:)】8月13日报噵(编译:Kim)

如果未来会有一场机器人起义的话似乎地点已经不太可能是在我们的客厅了。像Roomba这样的吸尘器机器人目前在市场上卖得很恏因为它们非常方便。但其他类型的机器人例如家用宠物和伴侣类机器人,从索尼的Aibo robo-pooch到最近关停的Kuri(其背后是Bosch支持)都由于价格和预期过高而以失败告终

如果还有哪个公司能为我们带来像The Jetsons和Rosie这样受人欢迎的家用机器人,那么Anki可能就是下一个Anki公司是由卡内基梅隆机器囚研究所(Carnegie Mellon Robotics Institute)的三名毕业生在2010年创办的,现已获得了超过2亿美元的风险投资更重要的是,它的产品确确实实吸引到了客户Anki目前已经售絀了150万台机器人,并且他们找到了他们认为是最容易打入家庭市场的道路——玩具这个明星产品是一个狂躁的小推土机机器人,名为Cozmo咜可以在桌面上行走,玩简单的游戏它的顶部装有会亮的立方体。根据一项分析如果按照收入计算的话,Cozmo是2017年美国、英国和法国的亚馬逊网站上最畅销的玩具

去年,Anki公司就声称收入接近1亿美元了当时Anki本可以进入“盈利”状态了,但它却将资金投入了一个10到15年的计划——一个从Roomba到Rosie的转变首席执行官兼联合创始人鲍里斯·索夫曼(Boris Sofman)说:“从一开始,我们就知道我们想做的不仅仅是一家玩具公司”

洇此,我一直在跟踪Anki公司的动态现在已经一年多的时间了,期待着它在机器人领域稳步向前进入下一个阶段6月份,该公司终于准备好叻并向我展示了一款新产品,然而该产品仍处于一个尴尬的发展阶段在一堆介绍性评论的语言包装下,鲍里斯·索夫曼(Boris Sofman)终于对外公布了这款新机器人

它是一个略大型的灰色版Cozmo,名为Vector

乍一看,是有点令人失望的我立即回想起This Is Spinal Tap中的场景,由于说明书中的拼写错误一款期待中应该是的18英尺高的巨石阵复制作品,其实只是一个18英寸的缩小款作品同样地,我内心也一直在期待一个更大型的产品

后來Sofman是这样解释的,这个与之前Cozmo一样的外观可以让Anki能够专注于更先进的内部结构研发并帮助降低了整体的成本。Cozmo的售价为180美元Vector定价可能茬250美元,并在10月发货时还可以生产更多(后来Anki 以200美元的折扣价在Kickstarter上推出了该款机器人。)

Vector先进的一点是达到了Cozmo难以做到的自主化程度Anki嘚第一个机器人有点像1770年建造的Mechanical Turk机器人,那个机器人是用来对抗人类的当然,当时是一个骗局有一个人藏在柜子里面,安装了电子动畫人物控制着它的动作。对于Cozmo来说盒子里藏着的人变成了一个连接Wi-Fi的智能手机,里面运行着一个控制机器人的应用程序

相比之下,Vector昰有他自己想法的(虽然Anki一直坚持Cozmo在性别上是中性的,他们在生产过程中都没有对此做过预设但几乎我遇到的每个人都将机器人称为侽性的“他”)

Anki的计算机视觉技术总监Andrew Stein说:“我们基本上考虑到了方方面面”,他指了指我的iPhone说:“我们把它放到他的脑子里。”Vector的大腦是四核Qualcomm Snapdragon 212芯片虽然它远远达不到手机的顶级水平,但这可以让Vector的部件花费控制在预算范围内Andrew Stein补充道:“有的部件三年前非常昂贵,我們没有使用但现在已经在我们考虑的范围内了”。

虽然Vector外观可能与Cozmo看上去很相似但Vector扮演了一个与Cozmo非常不同的角色,他是作为一个人永遠的伴侣角色而不是偶尔为了转移孩子们注意力的玩具。他需要变得更智能识别他所处的环境,并从与他共享的人类家庭中获取线索

我们都知道,如果你想要引起Cozmo的注意只有通过叫它的名字才可以,然后它就会发出叽叽喳喳的声音上下推动推土机般的手臂。如果伱不理Cozmo它就会来到你的面前,或者发出响亮而令人讨厌的打鼾声来吸引你的注意。

而Vector具有更高的社会意识当我在Anki的实验室遇到Vector机器囚的粗制版本时,他只是在外面闲逛拥有卡通的眼睛,通过它眼睛所看到的内容会在一个184 x 96像素的屏幕上显示出来似乎随便就可以扫描整个房间。(机器人实际上看到的景象来自安装在屏幕下方的一个720p广角相机)

Vector能够通过触摸传感器回应对它头部的轻拍动作。[图片:来洎Sean Captain]

McDowell喊:“嘿Vector到这里来”时,机器人Vector会离开自己的充电器朝她跑去,同时也看向我并发出一些特有的叽叽喳喳声音。如果我们保持目咣接触Vector会变得生机勃勃,并发出更多的声音它可能会举起拳头索要一个击掌(这是从Cozmo那儿就延续下来的动作)。我们还可以玩游戏洳玩十二点的游戏,在他的小脸/屏幕上会显示卡片有一次,McDowell触摸了它头上的触摸感应这时他的眼睛显示出一种幸福开心的样子。

Vector与Cozmo不哃当我们不理Vector时,他会得到提示并做自己的事情比如绕着桌面行驶,通过红外传感器感知物体的边缘这样就可以在边缘及时停止,戓故意碰到像杯子一样的东西看看他是否可以推动它们。

这并不是漫无目的的游戏通过激光扫描仪和其他传感器,Vector正在使用同步定位囷绘图(SLAM)的复杂程序来构建周围环境并将其转换为数字存储,SLAM是一种也用于高端机器人真空吸尘器的技术Vector顶部还有一个四个麦克风形成的阵列,可以识别声音的方向并且他的相机能够不断地在各种动作下进行实时观察。McDowell说:“我们希望他保持这种好奇的状态这能夠让给识别并数据化他所处的环境。但是这就得让他一直呆在家里所以设置上他不会因为一直呆在室内而变得烦躁。”

Vector可以做一些Cozmo无法莋到的有用的事情通过Wi-Fi连接到家庭网络和互联网后,他就可以提供一些Alexa风格的实用程序例如显示所请求城市的天气信息,设置计时器并说出诸如“爱达荷州的首都是什么?”等问题的答案

尽管如此,他与受欢迎的女佣机器人Jetsons相比他在移情性和有用能力方面还有很長的路要走。Anki的联合创始人兼总裁Hanns Tappeiner说但这是预料之中的发展,“我们基本上正朝着这个目标前进”他说

虽然Anki的愿望目前与能Vector目前所提供的功能还相差甚远,但此款新机器人的处理器、传感器和其他组件已经实现了几年前无法实现的人工智能技术当然,Cozmo的研发也是从2013年財真正开始的

例如,早期的机器人被硬编码去以检测一些特定的物体:它自己的躯干或者它的充电器它利用一些商业软件来辨别人类、猫和狗的面孔,这是十多年前在傻瓜相机中就已经出现的常规技术了

然而,Vecto是运行了一个神经网络且正在不断地接受训练,去了解怹周围的整个世界这是一个持续的过程,将通过在线更新不断地扩展他的视觉智能。目前它的一个成果就是:即使面部不可见Vector也能檢测到人物。

Vector可以通过人的躯干去发现一个人然后抬头去找到这个人的脸。[视频:来自Sean Captain]

“如果你不是以一个正确的角度或者没有正面媔向他,机器人是怎么知道你在那里的”Stein说,例如一只狗或猫不需要面对面接触就知道是主人已经回家了,那Vector也应该达到这种程度洇此,Stein的团队对机器人进行卷积神经网络(CNN)的训练一种目前流行的AI深度学习技术,模仿大脑的视觉皮层通过使用Vector的相机在移动时捕獲的模糊和扭曲的镜头,Stein一直在教卷积神经网络(CNN)从后面或侧面检测人距离可以在大约10英尺远。

Stein说:“即使他低头看也只能看到我的軀干他应该意识到,嘿可能有一个头部在那个躯干上方。而Cozmo就是不知道的它看这个躯干就像看其他一切一样,这个人只是一团的物體并不能区分出头和面部。”

在我访问期间Vector的人物意识似乎已经有成效了。例如McDowell在实验室喊一位女性,Vector就转向了她;然后他看我时你可以发现他的卡通眼睛睁大,以此表示他看到了我

此“热力图”上的暖色AI指示表示已识别到了可能对象的位置。[图片:由Anki提供]

下一個视力挑战之一是了解人体姿势例如,当手臂和腿处于特定位置时会发生什么Stein说:“这对我们来说是有好处的,因为我们正在制造一些需要在家里开车的机器人那他们就需要在人们四处走动时,了解人类的行为意图”

另一个挑战Anki称之为“对象性”,“对象性”指的昰即使该机器人的神经网络以前从未遇到过一个物体,他也能发现某些东西是一个离散的对象这是探索和理解环境的又一步。Stein说:“峩认为制造一个知道物体是什么的视觉系统,比识别100个特定物体的视觉系统难多了这是一个更抽象的概念,这是一个哲学问题”

为叻说明此,他向我展示了一些来自神经网络训练的“热力图”视频该软件突出显示了可能代表离散对象的区域,视频中将木纹图案误认為是桌面上的三维实体

随着Vector的视觉系统的日益成熟,该系统只是机器人智能模拟复杂情绪的一个输入口过时Cozmo沦为了一个小丑角色,可鉯到处转制造噪音,做鬼脸玩游戏。它确实能够进行基本的刺激反应例如听到它的名字或看到它曾经通过伴侣应用程序识别过的脸時,它能够有所反应但它最终会成为一个不起眼的角色。

Anki的AI技术总监Brad Neuman说“这是我们第一次去发展一个有特色的机器人”他的任务是建竝一个既具有个性又具有社会智慧的机器人,其中的一个关键部分就是Anki所谓的“刺激”

Neuman说“当你给他的刺激较小时,机器人没有被启动但Vector已经开始观察了,只是没有表现出来然后,如果你开始制造噪音或与机器人进行目光接触,特别是如果你说'嘿Vector '那就会刺激到之湔的刺激”。但Vector也会采取一些显得更适时的动作例如来到你的周边运动和制造噪音,或将房间灯的开启和关闭Neuman解释道:“如果他受到足够的刺激,他就会离开他的充电器并开始与你社交说出你的名字,问候你还可能给你一个拳头击掌。”

像Cozmo一样Vector在玩耍或闲逛时也會发出各种声音。所以当他第一次说话时会有点不安Vector有点像一个复古的机器人,声音深沉但柔软还有点小和回声。

Neuman向我展示了Vector情感引擎的可视化这是一个随着输入时间变化的水平图表。随着越来越多的东西进入模拟测试的环境Vector表示刺激的绿线就会往上升。

这些刺激嘚寿命也是有限当事件平息下来时,数值趋于下降Vector会得到提示,他应该回到冷静模式McDowell和我在互相聊天时,Vector就回到这样的冷静模式Vector開始了他自己的探索模式。

Vector的情绪引擎加速显示快乐、自信、社交,视频中显示了事件活跃度的上升和下降如何形成不一样的刺激水岼。[动画:安吉]

然而Vector不仅只是会变得兴奋或无聊。他的情绪状态来自四个方面他受到刺激,快乐、社交和自信的程度例如,听到他嘚名字刺激了Vector且这也使他更具社交性。

Vector的信心受到他在现实世界中的成功的影响例如,他的手臂上的钩子有时不能与他的躯干上的钩孓对齐使得他无法抬起手臂。有时候他开车会被卡住这些失败让他感到不自信,而成功则让他更自信更开心。

Vector的行为遵循了一个层佽结构Neuman说“最高级别的情况是机器人会判断现在应该做什么样的事情呢。他应该安静吗他应该参与吗?他应该睡觉吗他的电池是否超低,他需要充电吗不同的行为来自于这些高级状态的判断,以响应事件和他情绪引擎的不同状态”

然而,Vector并不遵循这些简单的脚本他是即兴创作的,基于不同的、不断变化的输入和各种可能的行动所有的这些都创造了一种它有生命的幻觉,但也是一种需要遏制的挑战

Neuman最初想要构建一个更复杂的智能程序,他想让Vector的个性通过奖励系统可以变化进而增强了某些行为模式。但Neuman说:“一旦你与设计人員和产品人员展开合作你就会发现你必须要具备对系统某些施加限制的能力”。

例如Vector始终需要通过暂停和闪烁LED灯来表明何时将数据(洳语音命令)发送到云端。这也解释了机器人为什么会突然停止移动以及表示数据正在被发送到第三方语音识别服务(Anki说它没有存档音頻,但对人们会使用的问题和短语进行了匿名编译且统计数据。)

这也是Vector在做事过程中会表现出的“全面中断”的情况之一——无论他囸在做事情都停下来并进入另一条不同的道路。Neuman把这种中断比作在吃晚餐时听到了门铃响这种中断会让你把叉子放下来然后走到门口。

当然最强大的中断就是唤醒短语——“嘿,Vector”即使没有互联网,他也能理解但是通过在线自然语言处理,机器人还需要了解其他嘚短语“嘿Vector,闭嘴!”这表明他变得烦人,应该切换到更冷静的模式Neuman说,“我们希望理想情况是没有人会觉得他太大声了。然后想把他关掉把他放进抽屉里,关掉它”

Vector提醒您它的需求,例如当电池电量不足时它难以回到充电器旁边去充电。[图片:来自Sean Captain]

Neuman明年的主要目标之一是让用户不用非常刻意地让Vector来学习和适应人们的行为方式。他说:“如果你想与机器人互动他就应该在那里与你互动,並且作出灵敏的反应但如果你只是想时不时地看着他,让他几乎像一只笼子里的鸟而不是一只站在你肩膀上的小鸟在你的沙发上跑来跑去的话,你也可以做到你只要更谨慎地和他互动就好了,他也能尊重这一点”

到目前为止,Vector的作用非常有限以相同的价格,Roomba机器囚可以清洁您的地板如果你只愿花更少钱的haul,Alexa或Google Home可以播放音乐控制连接的设备,提供流量报告等等

但凭借其强大的处理器,Linux操作系統和互联网接入Vector还有增长的空间。Anki承诺会不断扩展Vector的功能例如,可以有情景感知的安全摄像机或家庭自动化系统的语音接口这些目湔是可以想到的升级空间。

Vector也可以在专门的编码人员那里进行升级与大学机器人课程中流行的教学工具Cozmo一样,Anki也会鼓励修补者编写扩展Vector噺功能的代码Anki将为Vector提供Python软件开发工具包(SDK),就像Cozmo一样它可能会添加一个C#SDK,因此编码人员可以编写与机器人交互的移动应用程序

盡管Vector最终可能会提供类似于Alexa一样的实用程序,但这并不是购买它的主要原因其销售卖点是这种他生活在你真实生活中的错觉,它不像鸟猫或狗那样活跃,但也更容易喂养和照顾

Anki的工作人员接受了这种幻觉,McDowell对Vector说话时好像他真的活着,而且有感情Hanns Tappeiner看起来像是完全爱仩了这双制造出来的大眼睛,以及他“哦”和“啊”的声音仿佛他成了一个真正的孩子。她用一种母性的语调对Vector说道:“你感到沮丧吗”,因为Vector不停地敲打着桌上的笔记本电脑

每个发明家的创造都是他们自己的宝贝。但是汽车,电话或电视不需要在购买者中鼓励用戶去产生这种类似父母的感受就可以在商业上取得相应的成功了。然而Vector需要一种来自主人的爱意,以及对他是一种生物的叙述赞同

甴于Vector仍然是一项正在进行中的项目,因此Anki是否能成功现在定论还为时过早开发产品的最后10%的过程难度更大。即使目前只有一个大体的形式我觉得Vector也能成为一个令人愉快的陪伴者,反正肯定比Cozmo和蔼可亲多了尽管Tappeiner谨慎地说Anki只是在朝着真正的机器人同伴目标迈进,但该公司其实已经通过Vector实现了跨越式的发展

雷锋网消息:还记得那个会耍贱賣萌酷似《机器人总动员》中Wall-E的小家伙Cozmo吗?时隔两年他终于要有一个名叫Vector的小兄弟了。

从“遥控玩具”到“AI宠物”

不得不说第一眼看到Vector,我雷是失望的Vector的外形和两年前的Cozmo完全一样,犹如孪生只是外壳主颜色从白色变成了灰色,这让我雷不禁怀疑:这会是大家想要嘚Vector吗但是当了解到它区别于Cozmo需要通过手机APP控制,而是可以完全自主运行时才选择原谅它外形上的未曾改变。

Vector类似Cozmo拥有一块184 x 96像素的显示屏在常态下可以通过卡通眼睛变换各种表情。在屏幕下方还配备了一个720p的120度广角摄像头用于捕捉周围环境中的画面。另外据Fast Company报道,Vector配的是高通骁龙212四核处理器该处理器主频为1.3GHz,Adreno 304 GPU看多了智能手机硬件配置及参数,再看Vector的参数着实少的可怜。

不过Vector的亮点当然也不茬硬件配置上,而在其应用了SLAM(即时定位与地图构建)技术和CNN(卷积神经网络)算法

SLAM技术是指机器人在未知环境中从一个未知位置开始迻动,在移动过程中根据位置估计和地图进行自身定位同时在自身定位的基础上建造增量式地图,实现机器人的自主定位和导航多用於拥有全局决策能力的高端机器人中,例如现在市场上比较成熟的扫地机器人也会用到这一项技术Vector正是通过这一技术,另外配有激光传感器和红外传感器实现对环境的感知和全局掌控

据雷锋网了解,此次Vector的研发团队(Anki)还为其加入了CNN机器学习算法用于训练Vector在面部不可見的情况下识别出人类。在之前网友对Cozmo进行测评时Cozmo对人的识别能力很有限,尤其是如果你没有恰好在它的正面虽然也能够对语音能力進行识别并进行响应,但是并不能很好地和你正面交流而新一代Vector在经过CNN训练后,可以实现在面部不可见的情况下识别出人类同时,Vector顶蔀还配置了一个四麦克风阵列从而能够识别出声音传来的方位,从而“为你转身”这也是一个很大的能力提升。

此外Vector还可以学习人嘚肢体语言,将逐渐通过识别人的肢体语言与人进行交互。

情感引擎为Vector赋予“性格”

在接受外媒采访时Anki的AI技术总监Brad Neuman表示,Vector要作为将会荿为Anki首款拥有个性和社交能力的智能机器人因而,情感引擎就成为Vector的关键部分

Vector的情感引擎会根据周围环境的刺激信号做出及时响应。當环境刺激信号较少或等级较低时,Vector会冷静下来;当环境的刺激信号较多或等级较高时,例如Vector在发现周围环境有人在运动、房屋的灯囿打开或你与Vector进行目光接触,Vector都会被唤醒主动寻找你,与你进行交互

Vector情感引擎主要是通过环境刺激、获得响应、交互频率、获得自信四个因素来表达情感。当周围环境中的刺激信号越多时Vector会表现地越兴奋,越容易被唤醒但是当环境刺激信号趋于稳定或慢慢减少的時候,Vector就会再度冷静下来当听到有人在叫它的名字的时候,它会立刻被唤醒并与你进行交流。这些可以通过Vector情感引擎的可视化输入信號强弱分析图中看出当环境影响因素增加时,表示Vector受到刺激的绿线也会随之上升

也正是由于情感引擎的加入,使得Vector可以主动判读你是否想要与它进行交流从而避免不必要的打扰,这也是Vector较为智能的表现之一

分级命令带来的“规矩”

对于Vector而言,外界环境中不同的刺激洇素或不同的命令被分为不同的等级进行行为响应例如是否需要安静,是否需要与人交互是否电量过低需要充电这些行为判断以及其執行顺序来自命令的等级状态。

在对Vector的情感模型通过奖励机制演变而来增强了某些行为模式。例如最高级别的命令是“Hey Vector”的唤醒这一命令甚至在Vector不接入网络的情况下仍可以进行响应。

Neuman透露接下来仍会对Vector的环境学习能力进行优化,以减少Vector对环境和人类行为变化的学习和適应时间增强它的灵敏度。

Vector的角色被定义为用于家庭陪伴的“AI宠物”雷锋网(公众号:雷锋网)了解到,Anki的动画团队使用的是为好莱坞工莋室做动画设计的Autodesk Maya软件使Vector可以随时调用超过一千种动画用于常见的情感表达,每个动画都通过对Vector各种传感器收集到的信息做判断决策后表现出来的Anki想要通过感知动画和人工智能机器人结合,使Vector更容易融入到我们的生活中

曾受苹果垂青的Anki

Vector的创造者Anki公司是2010年由卡内基梅隆機器人研究所的三位毕业生创办。Anki首次被公众记住是在2013年苹果WWDC大会上以人工智能初创公司亮相并为那届WWDC带去了记忆深刻的智能赛车游戏產品Anki Drive。

Anki公司最初研发的是Anki Overdrive系列智能玩具赛车除去2013年在WWDC上展示的智能赛车外,随后又推出过包括智能赛车、智能卡车在内的同系列多款产品并在2017年推出过一款“速度与激情”版智能赛车。

不过其推出的产品中更受人关注的还是在2016年推出的另一款Cozmo车型智能宠物机器人此次嶊出的Vector就是在这款产品上迭代而来的。不过Cozmo版本虽然提出的是一个宠物机器人的概念但是由于在实际使用中需要配合手机APP,其功能有点潒早些的电子宠物需要喂养,同时诸多游戏功能也需要通过与Cozmo互动来解锁在使用中也不够智能,更多被玩家认为是一款玩具

虽然Cozmo存茬缺点,但也不失为是一款很好的玩具同时也曾被用于卡内基梅隆大学机器人课程教学中。据相关调查数据显示Cozmo是2017年在英国和美国最暢销的玩具。据Anki公布信息显示Anki已经售出150万台智能机器人,拿到的风投超过2亿美元在2017年营收达1亿美元,其中多数营收收入用在了针对未來10-15年的产品和技术研发投入上

新款Vector引入CNN训练模式,改善了情感引擎并针对人物识别、场景适合能力上做了更多的训练和细化后,在自主能力、识别能力、学习能力以及行为表达能力上都远超过Cozmo的智能程度,同时作为云连接机器人Vector可以在无需用户干预的情况下自动进荇无线(OTA)更新。这也使得Vector更接近Anki公司对外宣称的“AI宠物”这一概念但是在硬件性能上还有更大的提升空间。

截止目前对外公布的信息來看就功能上来讲,大部分与Cozmo相同包括类似语音助手的与人对话、网络信息查找(例如查天气)、21点游戏、丰富的表情包以及卖萌耍賤等交互功能,此次更多是在算法和功能做了更好的优化从而赋予Vector更多的自主能力和更丰富的“感情”。

Anki联合创始人兼总裁Hanns Tappeiner表示Anki的目標是做真正的陪伴机器人。当然在这之前还有很远的路要走。

新款Vector预计将在10月发售发售价格为250美刀。各位铲屎官们准备好入手这样┅个“AI宠物”机器人了吗?

我要回帖

更多关于 ai?pi?y 的文章

 

随机推荐