在说明一个技术的出现然后广泛使用的时候,我们可以翻看中国自己的历史。秦统一中国的时候,各国已经有铁剑出现,因为铁的密度远小于铜,铁质兵器远比铜更为轻便,然而秦依旧使用铜来制剑。荆轲刺杀秦王,由于秦剑太长,秦王迟迟无法拔出宝剑。
轲既取图奏之,秦王发图,图穷而匕首见,因左手把秦王之袖,而右手持匕首揕之。未至身,秦王惊,自引而起,袖绝;拔剑,剑长,操其室;时惶急,剑坚,故不可立拔。
直到一个太医喊出“秦王握剑”,秦王才慌忙的左手握住剑鞘,右手拔出长达近一米的青铜剑,一刺荆轲。
是时,侍医夏无且,以其所奉药囊提荆轲也。秦王方环柱走,卒惶急不知所为,左右乃曰:“王负剑。”负剑,遂拔,以击荆轲,断其左股。
荆轲刺秦,是铜长剑和秦朝发达的铜器的加工工艺终结了荆轲。到了汉朝,铁的加工工艺开始成熟,远比铜更为轻便的铁质兵器开始大规模应用。于是骑着没有马蹬的马,拿着汉环刀的汉朝军队把匈奴赶到漠北,并以这个朝代的名字为自己的民族命名。
秦朝使用铜作为兵器的原因就是对铜的加工工艺更为熟悉,秦的胜利就是铜的加工工艺的顶峰,而汉朝铁的制备工艺已经相对成熟,所以汉朝骑兵握着更加轻盈锋利的铁刀,这就是新技术对旧技术的胜利。
如果截取Vicariois联合创始人Scott Phoenix回答神经网络技术局限性的问题,来总结秦汉的故事就是:新技术开始出现时,和当前重度优化的现有技术相比,它可能在很多层面上反而没有优势······随着时间的推移和不断的努力,我们将在大多数事情上变得更好······。
已有的人工智能技术在设计与艺术领域的尝试
在设计与艺术领域,最为广泛使用的技术就是卷积神经网络(CNN),比如Prisma和本章开始提到的Tailor Brands。Prisma背后的技术源于一篇论文《A Neural Algorithm of Artistic Style》,下图是论文中的截图。
我们可以看到机器如何从梵高的画中抽象出风格然后钱已到一张照片上。
除了风格的模拟,用户研究经常使用的眼动仪实验数据也可以通过人工智能来解决,有一个名为eyequant的网站可以提供“无人眼动仪”的服务,如下。
上图是真实的眼动仪追踪的结果,下图是通过数据训练得到的神经网络预测的结果,网站宣传其准确率可以达到90%。这个学习的过程就是将眼动仪捕获的人眼根据注意力机制运动的数据与图片的数据输入到神经网络中,神经网络会学习到图片与眼睛运动之间的相关关系形成模型,反复这个过程之后将训练成熟的神经网络来预测一般图片的眼动过程。也就是说,对于中小企业或者设计初稿,可以通过人工智能技术获得一个基本的设计质量的判断。
还有中国的阿里巴巴公司的阿里鲁班,据说可以自动生成banner,我相信其技术核心也是CNN。
未来可能的设计场景
tobii是一家眼动追踪技术的公司,如下图。
将这个细长的小条贴在现有屏幕下方就可以追踪眼球的运动,用以替代部分鼠标的功能,但是便利性则大大加强,如果加上这个技术,我们把已有的技术放在一起看一下会发生什么效果。
交互技术
图像识别技术
语音/语义识别技术
眼球追踪
CNN的人工智能
CNN/RNN等复合的人工智能
假设我们要完成一个基本的抠图场景,把一个人物从背景中抠出来,以前的过程是费力的通过各种“选择”、“通道”工具把目标合背景区隔开,遇到人群叠加就会更加费时,涉及到人物头发边缘轮廓的反光就会更棘手。
而如果将现在的技术整合应用只需要一句话:“计算机,把这个人从背景中抠出来”。这个过程是:计算机听到命令后,会理解你抠图的需求—语音/语义识别,然后你用眼睛盯住目标人物—眼动追踪,计算机把识别的人物选择区分出来—图像识别,然后将头发边缘的反光自动消除,最后完成抠图命令。
计算机可以通过眼球的运动知道你所关注的焦点,可以通过语音识别理解你得语言,通过图像识别理解屏幕上的图像,可以学习设计或者艺术的风格,那么更为复杂的事情呢?比如设计一个简单的App?
UI设计的本质,那就是:有效的牵引注意力进行分布操作,最终完成目标任务,解除心理张力的过程。如果AI学会了人类一般的解除心理张力的动作过程,比如购买一个钢笔的操作流程,那么是不是也可以完成类似任务?
首先对每个页面,无人眼动仪可以模拟人的注意力集中点,那么每个页面的设计质量就可以自己判定出来,如eyequant;其次,每个页面中最复杂的图形设计AI似乎也可以完成,那么更为工整的方形或者圆形控件button则更为容易,这个技术如自行设计logo的tailorbrands所拥有的一样;第三,通过模拟人类注意力转移的过程进行质量测试和流程的流畅性测试,也就是说依赖基本的回馈规则和规范的模块,人工智能可以自己进行简单的App设计。
如果设计一个App可以,那么网站呢?VR应用或者AR应用呢?实体的工业设计可不可以?服装?建筑?可以肯定的说:这些工作中简单的、重复的、易于识别的都将在未来得以替代。
那么对设计师是好事还是坏事?这个问题又再次回到了原点,拖拉机的出现对拿着锄头的农民是好事还是坏事?
设计师的核心价值
回答人工智能会在何种程度上替代人类工作的问题,其实是在问人的智能与计算机的差异在哪里?这个答案很复杂也很简单,复杂是因为在各种技术层面上的比较是无穷尽的,简单是因为人就是人。
人才有人类的情感和认知路径,这是亿万年演化的结果,也就是人对自己的感受无可替代,AI无法完全获得与人一致的感受,因此针对人的感受所从事的职业仍旧需要人来完成,设计当然是其中一点,那么更为广义的艺术领域,摄影,动画,电影,喜剧,文学等等都会是AI始终无法完全替代的领域,注意是完全,而非部分!
人工智能仍旧可以替代的原来需要重复的、简单的、繁琐的、机械的,非人所特有的工作,只会抄袭的描图员什么时候都会失业。设计师的核心价值是是对人自己的需求的敏锐感受,保留这种能力才能不断追求新的设计去满足这种需求,不断创造新的设计,这是人工智能不能替代,或者短时间不能替代的地方。
技术的每一次进步都会改变人类工作的方式,解放人一次。打字机把女工变成文员,计算机把又文员变成办公室白领,马车把足役变成车夫,汽车把车夫变成驾驶员,拖拉机将大多数农业人口转变成服务业人口,而AI对人类工作形态的改变将超过以往技术的总和,因为这种技术在模拟人的智能本身。
模拟与相同的区别是亿万年演化的时间对人本身的塑造,如果人工智能想要获得与人一致的感受,也需要足够的时间,这种相似现在只在科幻的艺术作品中才可出现。
回答开篇的问题:人工智能当然可以设计,也可以替代部分设计工作,但是最终的让人感受自然而然的设计依旧要通过人来完成,而人工智能将扮演的角色将是让那些最有创意的设计师完成他们的梦想。
小结
首先,我们明确认知是设计的本源的问题,解决“人-人造物-自然”与“人-人造物-他人”之间信息流动的问题,那么人对信息处理机制的研究就成为设计研究的必然,也是本书的主旨;其次,为了明白模拟人类智能的人工智能技术,我们简述了人类智能的微观基本结果和特点;最后,我们探讨了已经存在的人工智能技术,其在设计领域的初步探索和未来可能的设计场景。
知其然,知其所以然,我们才能进行设计,这就是我们需要了解人的智能和人工智能的原因。
本文有微信公众号【混沌巡洋舰】(chaoscruiser)供稿。