人工智能!!! iOS10照片远比你想象的更智能
- 06 月 22 日
- 爱思助手
- 7576
——“人工智能是什么?”
——“有多少人工,就有多少智能。”
这是前段时间看到的一个段子,对于“人工智能”这样一个高深莫测的词汇,我们有太多的疑问和好奇。而以往我们都只能在科幻电影中寻找到一些答案,并由此憧憬着人工智能技术能给现实生活带来一些变革。
其实人工智能离我们并没有那么遥远,甚至绝大多数果粉都使用过人工智能产品,是的,这款产品就是Siri。当初苹果收购Siri时,乔布斯曾被问到此举是否想与谷歌竞争搜索业务,他是这样回答的:“他们(Siri)不是搞搜索的,他们是搞人工智能的。”
Siri刚出来时,大家都对这款产品充满了期待,并对其各种“调戏”。但使用一段时间后发现它其实并没有那么聪明,许多问题都只是给你推送网页,无法回答的便各种打马虎眼。罗永浩曾说,Siri之所以这么笨,问题不在于语音识别技术,而是人工智能根本达不到。
所以那会儿我们认为的人工智能通常是这样的,在你对机器发出某项指令后,它立马翻到云端,然后在大洋彼岸的机房里会有一大群“程序猿”急着为你提供答案。
但这两年,得益于一些科技巨头的推波助澜,我们开始对人工智能技术有了改观,尤其是前几个月的“人机大战”更是掀起了一波人工智能潮流,一时间,许多国内科技公司都跟风加入了这个行列。
而苹果在“蛰伏”几年后,也在人工智能技术上有了一次大爆发——在iOS 10系统中加入了许多人工智能技术。
其中,苹果在iOS 10的原生照片应用中加入了满满的人工智能技术。该应用能识别人脸、物体,并能给相册中的人物进行分类,并且还新增了“回忆”功能,可以基于照片中的位置、人、场景和主题聚集在一起,然后还可以选择音乐创建视频。
如果你认为其智能程度仅此而已那就错了,最近有开发者在iOS 10的代码中有发现一系列用于人脸识别的元素,包括微笑、惊恐、尖叫、惊喜、走神、哭泣、沉思、贪婪、厌恶等等。这就意味着,iOS 10的照片应用不光能认出你的脸,还能识别出你的面部表情。
除了对人脸面部表情的识别外,苹果还为场景增加了更多的选项,不光能识别出照片所拍摄的场景(比如海边、大山、草原等),还能识别出照片中的具体物品,包括食物、动物、汽车、轮船、自行车等等。
据了解,目前iOS 10的照片应用能识别432种物体,5000种不同的场景,并且这一数据还在持续增加。
而这些都可以用于“场景”、“回忆”及“搜索”当中,比如你可以直接通过Siri搜索到某张具体的照片,只需对着Siri说,查看我高兴的照片,查看我悲伤的照片,然后Siri就可以给你展现出来。
iOS 10的照片应用能这么聪明,源于苹果利用了深度学习和计算机视觉技术,这也是目前计算机视觉领域的主流技术。
此前,计算机视觉领域中提取特征的方式多为人工设定,但人的设定总是有局限的,而深度学习可以在大规模数据的帮助下学习到人无法设计出的特征,并且还可以结合实时信息、上下文信息以达到惊人的识别能力。
但要让机器识别出人脸或物体也并没有那么简单。
就拿“猫”这个物体来说,虽然让机器认出一只正常的猫很容易,但问题是,并不是所有的猫都长一个样,并且有些猫姿势各异,再加上场景的干扰,有些甚至连人也很难辨认。
目前尚不知苹果、谷歌或是微软在计算机视觉里的具体技术细节,毕竟这些都是巨头们在人工智能领域的机密技术,但我们可以从一位人工智能技术科技学家李菲菲(Fei-Fei Li)那里获得一些答案。
2009年,李菲菲带领的斯坦福大学人工智能实验室建立了一个名为ImageNet的项目,这个项目是一个含有1500万张照片的数据库,其中涵盖了22000种物品。而单就“猫”这一个对象,就超过了62000只长相各异、姿势五花八门的猫,并且还涵盖了各种品种的家猫和野猫。
有了这个庞大的数据库,然后是对其进行训练。在这些科学家用到的一个训练“对象识别模型”的典型神经网络里,就有着2400万个节点,1亿4千万个参数和150亿个联结。而支撑起训练如此庞大模型的是强大的CPU和GPU硬件设备。
由此可见,要让冷冰冰的机器看懂一张猫的照片是多么得不容易。
这些年,苹果、谷歌、微软、Facebook等科技巨头在计算机视觉技术中投入了大量资源,其目的便是能够让机器看懂世界,而这是一切人工智能技术发展的前提,无论是机器人还是无人驾驶,首先得让机器拥有像人类一样的眼睛。
回到iOS 10的照片应用上,苹果在这个应用当中在加入了人工智能技术,能够让用户更好地管理照片、更快地查阅照片,虽然功能看起来很简单,但在体验上却提升了不少。在这点上苹果又再次领先了对手。当然,我们也期待着苹果能将该技术发挥出更加强大的作用。