"日本历来在机器人的物理方面很强大,但是美国在人工智能研究方面遥遥领先。"
分析师)Yini Lin
核心内容
1、日本人形机器人研发主体由汽车制造和电子技术厂商主导可能意味着,其在该领域的产业领先地位或是基于它在科技消费制造业的技术研发和生产能力,而这一竞争力的形成在很大程度上源自战后西方盟友的经济援助与技术转让。
2、当昔日“盟友”成“威胁”,美国对日政策从经济扶持转向经济遏制,1985年成为日本电子产品出口的转折点。日本电子产业的衰落和随之而来的消费电子厂商现金流萎缩或在极大程度上削弱了日本在人形机器人领域的研发能力。
3、机器人破坏和重塑国家权力的世俗条件,并且已经拥有一定程度的本体自主性。正如火药对殖民主义影响深远,核技术是上世纪世界格局的关键决定因素,军事机器人或将重塑战争面貌,颠覆世界秩序。
无论是“机器人武器化”的反乌托邦叙事,还是人类对于高级新物种造成潜在的大规模失业与日俱增的恐惧,机器人都是困扰我们文化潜意识、同时又让人着迷的科幻原型。人类对人形机器人的向往至少能够追溯至以及东方的东周时期中国道家学派哲学家列御寇在《列子》中详细阐述了人形自动机(Automata)概念,以及西方的古典时期希腊神话中的铁匠之神Hephaestus在多则故事中创造了不同形态的人形自动机。从古至今,学者和科研人员常常展望这样一种未来机器人能够模仿人类行为并以类似方式胜任工作。如今,科技进步、商业实体和军事主体等推动力量正在加速缩短人类与这一理想的距离。
继去年8月在“人工智能日”活动中宣布人形机器人制造计划之后,马斯克(Elon Musk)自今年6月起多次在公开渠道透露,特斯拉将于9月30日正式推出人形机器人Optimus原型。或是作为对Tesla Bot的回应,小米继去年发布仿生四足机器狗CyberDog后,于今年8月11日在其秋季新品发布会上抢先发布人形仿生机器人CyberOne。
Tesla Bot的问世与中国企业在人形机器人领域的积极布局是否意味着市场即将迎来人形机器人的产业化浪潮?
短期看来,人形机器人实现产业化仍然面临诸多挑战软硬件技术仍需完善;商业应用场景仍需探索;同时,高昂的售价与极低的性价低意味着人形机器人尚且难以实现面向家庭场景的大规模普及。不过,制造厂商的研发热情有望加速人形机器人的商业化普及,并在短期内为产业链上下游带来巨大增量。
开辟新天地:日本制造业厂商引领人形机器人产业
时至今日,机器人早已而消无声息地进入我们的寻常生活、消费与工作场景中。在过去几十年中,机器人已经突破生产制造领域,并在物流、医疗、零售等行业持续渗透。不过,技术限制意味着机器人尚且难以具备像人类一样的“通用”功能设计具有特殊目的或功能的机器人,即让一款机器人完成一项任务,显然更易实现、也更高效。与诸多产业相反,机器人产业发展路径始于“垂直”、而非“通用”。
日本早稻田大学(Waseda University)于1973年推出的WABOT-1(WABOT即Waseda Robot)通常被认为是全球首个全尺寸人形机器人,或Android(即男性人形机器人,Gynoid为女性人形机器人)。这款拟人化智能机器人由肢体控制系统、视觉系统和对话系统组成。WABOT-1能够使用下肢行走,能够通过触觉传感器用手抓去和运输物体,甚至能够用日语与人进行初步交流。不过,WABOT-1运动能力极弱, 每走一步耗时45秒钟。
△ 右图:日本早稻田大学于1973年推出WABOT-1;右图:日本早稻田大学于1984年推出WABOT-2(来源:Waseda University)
WABOT项目旨在最终开发出能够在最大程度上与人类相似的“个人机器人”(Personal Robot)。从面向机构的“大型计算机”(Mainframe Computer)到面向消费者的“个人计算机”(Personal Computers)的转变彻底颠覆个人工作与生活的方式,同时使生产效率得到大幅提升。与之类似的是,从“工业机器人”到“个人机器人”的转变正在改变家庭场景中的生产效率,而人形机器人即将到来的技术突破或将放大这一效应,同时彻底颠覆个人生活方式、文化形态、甚至社会结构。
人形机器人产业链上游为核心软硬件。硬件包括伺服电机、减速器、 控制器、传感器;而软件则包括机器视觉、人机交互、机器学习、系统控制。截至目前,诸多零部件仍然常年被日本和西方国家垄断,尽管近年来中国国产化率有所提升。
事实上,日本不仅开创了人形机器人这一新兴赛道,还在很长一段时间内引领该产业。
WABOT的问世为日本汽车及电子制造业厂商开辟的新天地。自80年代起,本田汽车(Honda)积极投身于人形机器人研发,旨在创造步行机器人。事实上,在其于2000年10月推出闻名遐迩的ASIMO(Advanced Step in Innovative Mobility)之前,公司早于1986年至1993年间便创造了第一款双足原型E0,作为早期实验线E 系列的一部分。紧随其后的是其于1993年到1997年间生产的本田P系列机器人。ASIMO的诞生正是建立在公司对E系列和P系列的研究之上。这款机器人能够步行、跑动、上下阶梯,在运动能力方面实现了较大突破。
△ 本田汽车于2005 年 12 月推出的新款ASIMO人形机器人能够实现与人同步行动的增强能力(来源:HONDA)
2018 年,本田汽车停止了ASIMO 的商业研发,尽管该款机器人仍然得以公开亮相。
除了本田,日本汽车厂商在人形机器人赛道的探索还能在丰田汽车(Toyota)推出的伙伴机器人(Toyota Partner Robot)中被看到。自80年代以来,为了强化制造工艺,丰田持续投入工业机器人研发,而由此沉淀的宝贵经验为人形机器人的诞生奠定了技术基础。
日本消费电子厂商索尼(Sony)在其于1998年发布机器狗AIBO(Artificial Intelligence Robot,日语aibō意为伙伴)原型后,顺势推出无予以销售的人形娱乐机器人QRIO(Quest for Curiosity)。2006 年1月,为了改善盈利状况,公司宣布AIBO与QRIO停产。在此之前,QRIO原本计划在三至四年内实现商业化。
△ 2006年停产之前的各代机器狗AIBO(来源:IEEE)
△ AIBO于2018年以新形态重新进入市场(来源:Sony)
△ QRIO身高不过60厘米(来源:Sony)
此外,日本电子信息通信技术厂商富士通(Fujitsu),以及覆盖信息技术、基础设施等广泛业务的日立(Hitachi)分别推出HOAP系列(Humanoid for Open Architecture Platform)和EMIEW,积极参与人形机器人布局。2014年6月,软银创始人孙正义推出Pepper,并于次年起在其手机门店发售。由于需求疲软,Pepper于2021 年6月停产。
人形机器人在日本市场的商业应用场景主要以诸如娱乐社交、陪伴看护等日常生活服务为主。同时,机器人产业总体上被视为日本出生率下降和劳动力萎缩的解决方案。然而,尽管日本社会受困于人口数量负增长、老龄化程度恶化等以及由此带来的劳动力高昂等人口结构问题,但是该国人口从2011年开始下降,而WABOT-1早于1973年便已问世。早稻田大学早在1969 年便已推出双足机器人WAP-1 平面自由度步行机。
社会问题与科技解决方案发展历程的“错位”表明,至少在日本,人形机器人的发展进程并非仅仅依靠需求拉动,而是更多来自技术推动。日本民营企业作为技术研发的主体,加之人形机器人资金门槛极高、短期回报极低的特性意味着,研发主体企业主营业务的盈利能力以及企业现金流管理水平是人形机器人研发生产可持续性的关键。索尼机器狗AIBO和人形机器人QRIO的停产便是源自资金压力消费类机器人无法为公司带来可观利润。
因此,CyberOne的诞生或是中国消费电子产业迅速成长的结果。本文作者认为,日本人形机器人研发主体由汽车制造和电子技术厂商主导可能意味着,日本在人形机器人领域的产业领先地位或是基于其在科技消费制造业的技术研发和生产能力,而这一竞争力的形成在很大程度上涉及日本制造业和高科技产业发展初期极其特殊的时代背景。
冷战推动「逆向进程」
尽管日本在人形机器人领域的地位在很长一段时间中难以撼动,但是现代机器人产业的基础工业机械臂,诞生于美国、而非日本。美国发明家George Devol Jr.凭借其创造的全球第一台工业机器人Unimate而赢得“机器人之父”的美誉。在Devol于1954 年申请其开创性机器人专利后,Unimate于 1961年被通用汽车公司引入工厂。日本第一台工业机器人American Machine and Foundry推出的Versatran作为“舶来品”,直至1967年被Tokyo Machinery Trading Co.引入。
元气资本此前粗略提及战后日本作为美国在亚太地区亲密盟友对日本经济的决定性影响。美国对国际威胁看法的转变使其外交政策从“孤立主义”转向“国际主义”,国际经济竞争力、军备实力和西方联盟成为美国冷战政策的三大基石,“马歇尔计划”由此诞生。美国对日占领政策政策从“民主化”和“去军事化”转向“经济重建”和“再军事化”的时期常被称为The Reverse Course(逆コス),暂直译为“逆向进程”。在此背景下,“伴随1950年朝鲜战争而至的20亿美元军需采购成了“天降甘露”,日本汽车制造厂商在这种战时景气中势如破竹般生长”。
事实上,与汽车产业相似,战后日本电子产业的爆发也离不开美国的慷慨相助。
凭借于1948年颁布的“马歇尔计划”条款,美国说服欧洲盟国一致对彼时的苏联实行禁运,由此以东西方贸易战的形式禁止西方商品,尤其是先进技术流入苏联阵营高科技消费品,尤其是计算机和电子产品,最初便作为军事创新出现,“逆向工程”的可能性导致高科技消费品的贸易禁运尤为严格。1950年,美国进一步推动成立CoCom,即多边出口管制协调委员会,通过编辑(扩充)敏感物品清单定义“军事技术”,从而监控和限制禁运商品出口。
虽然最初被排除在外,但是德日最终相继与西欧一起加入“马歇尔计划”中的首要技术转让项目,以及USTA&P,即美国技术援助和生产力项目。日本企业自1955年起获得巨额拨款以便将大量管理人员派遣至美国参加麻省理工学院、纽约大学和斯坦福大学等知名大学提供的商业课程,并在诸如杜邦(Du Pont)、通用电气和福特等美国大型公司工作。
在此后五年中,日本钢铁、汽车和电子行业的技术驱动型企业共有200个团队参加了USTA&P这为日本带来了一个“沉浸式”学习美国技术和商业方法的新时代。同时,日本生产力中心(JPC)的成立使得日本企业得以参加由美国技术顾问和专家举办的专题研讨会,日本高管获得了对新兴计算机硬件技术和软件开发、电子产品市尝管理方法和生产创新的长期一手接触。Takenori Saito将此描述为“美国系统、设备和方法的直接进口”。
除了美国的技术援助计划和国家发展贷款基金,包括世界银行在内的国际经济发展计划共同为日本制造业务和工厂设施提供大量拨款以进行现代化改造,同时鼓励高科技研发、工程和商业发展。
值得注意的是,CoCom近乎荒诞的名单扩张甚至将“军事绝缘”的中国猪鬃也纳入禁运范围之列。由此带来的经济代价激怒了以英国、丹麦为首的欧洲盟国,CoCom因而被视为美国借以拉大其与欧洲“技术差距”,从而促进自身经济霸权的途径。日本此后进入CoCom,正是作为斯堪的纳维亚国家以及此后英法的重要盟友,以对抗美国的主导权。
这使美日经济和外交关系从“家长式主义”逐渐转向“合作”,甚至“竞争”。
为了应对冷战,美国电子产业以军工和航天工程作为发展重心,日本民用电子产业的爆发导致日本消费电子大量涌入美国市场昔日政治“盟友”成为经济“威胁”。美日贸易摩擦由此愈演愈烈,并逐渐从最初的纺织产品,70年代后半期的钢铁贸易,蔓延至80年代的汽车及电子产业。
日本经济新闻数据显示,1970年至1985年间,日本电子工业产值增长了5倍,国内需求增长了3倍,而出口额整整增长了11倍。
日本人形机器人正是在此背景下诞生并迅速成长。
AI与数字化技术或改变美日人形机器人的竞争格局
应对竞争失利的最佳方式或是“修改规则”。
随着美国对日政策从经济扶持转向经济遏制,1985年成为日本电子产品出口的转折点。在于9月通过与日本签订《广场协议》迫使日元大幅升值后,美国于1986年9月与日方签署《日美半导体协议》。不过,这并没能阻止日本在同年超越美国成为全球半导体市场最大供应国。1987年3月,美国对日本进入其市场的3亿美元芯片征收100%的惩罚性关税。这一对抗一直持续至日本经济泡沫破灭。此后,美国半导体产业复苏,并于1993年再次超越日本。
△ 日本芯片制造产业的衰败(来源:Financial Times)
Los Angels Times曾于1987年如此反思,“抨击日本现在已经成为美国官方政策的光环……日本的高科技产业、包括半导体,可能会受到日元升值的严重伤害……我们说,日本人只会对压力做出反应……但是我们不能对日本发号施令,告诉他们如何改变其经济和社会……他们对外国关于如何改变他们的税收和支出政策的建议感到不满,换成我们也会。这些问题涉及国家主权,不应通过外交途径解决”。
电子产品“出口创汇”时代的终结使得日本电子产业主要依靠内需拉动。1985年至2000年间,尽管整体增速大幅减缓,但是日本电子产业国内需求翻了一番。时至世纪之交,该产业生产额触及26万亿日元历史峰值。2000年后,电子产业急转直下,产值于2013年萎缩至11万亿日元不及2000年峰值的一半,贸易差额由正转逆。
△ 左图:1955年至2013年日本电子产业国内需求,即生产 + 进口 - 出口,以及贸易平衡,即出口 - 进口;右图:1990年至2013年日本电子行业与汽车行业贸易顺差变化(来源:财政部贸易统计)
在此背景下,松下、索尼和夏普在截至2012年3月的财政年度录得赤字约为1.6万亿日元。
本文作者认为,汽车制造和电子技术厂商主导人形机器人研发的意义在于,企业在软硬件技术方面的研发与生产经验、以及资源沉淀,能够大幅降低人形机器人开发及商业化的试错成本,提升研发效率。
截至目前,尽管日本汽车制造产业仍然居于全球榜首,但是日本电子产业的衰落和随之而来的消费电子厂商现金流萎缩或在极大程度上削弱了日本在人形机器人领域的研发能力。
挑战、甚至撼动日本在人形机器人产业领导地位的正是美国。只是,二者应用场景截然不同。
Financial Times曾于2016年冷酷地指出,2011年海啸爆发后福岛受损核电站使用的机器人并非日本制造,而是美国制造这些机器人由iRobot公司推出,用于在阿富汗和伊拉克雷区作业,“尽管日本在机器人技术方面拥有悠久的实力,但其领导地位已经不再稳固”。
信息技术发展使得人机交互从基本交互、图形式交互、语音式交互日益趋向感应式交互或体感交互,人工智能技术由此成为该产业的重要竞争力。排除政府项目,如果日本人形机器人研发由汽车制造和电子技术厂商主导,那么美国人形机器人研发或由硅谷科技公司主导。Google母公司Alphabet早于2013年便收购了7家机器人相关初创公司,其开发的自动驾驶汽车本质上是配备计算机与传感器的移动机器人。
Carnegie Mellon University机器人学院教授Martial Hebert曾表示,“日本历来在机器人的物理方面很强大,但是美国在人工智能研究方面遥遥领先”。本文作者认为,这种“物理优势”可能源自日本汽车制造产业的机械工程能力。如果昔日日本电子产业未经美国竭力遏制,此后“美国在人工智能研究方面”未必能够“遥遥领先”。
伦理困境:机器人的应用场景
在Isaac Asimov于1950年发布的科幻小说“我是机器人”(I, Robot)中,人形机器人奉行三项铁律,其中第一项便是机器不得伤害人类。这一共识可能将被DARPA,即美国国防高级研究计划局,对军用机器人呈现出的空前热情颠覆。
2013年7月,美国机器人厂商波士顿动力公司(Boston Dynamics)在DARPA的资助和监督下推出处于技术前沿的人形机器人Atlas,并称其为“地球上最先进的机器人”。除了DARPA,公司研发资金来源还包括美国陆军、海军和海军陆战队。10 月,公司发布的视频显示,这款最初为搜救任务而设计的机器人能够在被武器击中后并保持单腿平衡。
△ 2013年,Boston Dynamics推出Atlas(来源:The Guardian)
2021年,Atlas执行各种高能量行为,包括“跑酷”(来源:Boston Dynamics)
波士顿动力公司研发的四足机器人包括于2004年推出的BigDog以及于2011年推出的WildCat。早在2013年,BigDog便已实现4英里/小时的奔跑速度,Legged Squad Support Systems能够将这款高76厘米、长91厘米、重109 公斤的机器狗承载能力提高至181 公斤,行程长达20英里。同时,WildCat则以超过29英里/小时的奔跑速度成为全球最快的机器猎豹。自2016年起,公司每年在YouTube发布视频呈现Atlas持续精进的感知能力、运动能力和适应能力。
△ 左图:BigDog;右图:WildCat(来源:Boston Dynamics)
Alphabet子公司Google X于2013年12月收购波士顿动力公司,后与2017年6月出售给日本软银集团。现代汽车于2020年12月以约8.8亿美元的价格收购了波士顿动力公司80%的股份,并在2021年6月正式从软银手中获得该公司的控股权。
Ian GR Shaw曾在其学术论文中提出,“机器人时代的美国帝国以技术力量替代人类的生理脆弱……军用机器人正在侵蚀人类对暴力的垄断……美国士兵将被机器战士增援、取代和伤害”。在终极代理人战争中,机器人取代人类成为帝国的执法者。机器人在军事领域的应用或意味着,它们并非人类意志的奴隶工具,而是地缘政治的积极参与者机器人破坏和重塑国家权力的世俗条件,并且已经拥有一定程度的本体自主性。Mark Coeckelbergh认为,机器人可能使发动战争变得更加容易,“杀手机器人”的伦理学不再仅关乎于机器人。
无人机已经改变军事目标杀戮的道德规范。Elke Schwarz表示,“无人机通过将人类生命抽象为可以在临床术语中作为数据捕获的技术政治实体,以实现目标的政治化或去政治化”。
事实上,对无人机战争的依赖已经改变了美国海外军事基地的地理分布。
Chalmers Johnson曾评论道,20世纪的美国军队巩固了一个“环绕地球的基地世界”。冷战期间,为了遏制共产主义,美国在欧洲和太平洋地区建造约1700个基地。Johnson甚至荒诞地提出,美国“只是一个基地帝国,而不是领土,这些基地以空前的形态环绕地球,这在过去不可想象”。2015年,David Vine估计,美国在全球80个国家约有800个基地,每年耗资1650亿美元,“美国在外国领土上的军事基地可能比历史上任何其他民族、国家或帝国都多”。
然而,无人机大幅削弱、甚至破坏了美国在海外安置人类士兵的必要性Roboworld,即机器人世界,通过增强美国的监视能力消除其旨在“治理世界”的地理距离,地球表面由此“收缩”。美国可能凭借基于机器人、而非人类的基地世界保持其统治地位,但是,机器人的全球化分布加剧这一秩序的不确定性。
前文粗略提及美国从“孤立主义”到“国际主义”的外交政策变迁,美国对军事机器人的需求与其“世界警察”的身份息息相关,而这一转变能够追溯至二战期间Franklin Roosevelt颁布的《租借法案》,本文暂不展开讨论。此外,尽管美国军费开支在1985年至1993年期间迅速减少对日经济激进的遏制行为出现在1985年或许并非偶然,该费用在2001年9月11日之后重新大幅攀升。
纵观历史,军事技术参与塑造了帝国主义和民族主义政策。正如火药对殖民主义影响深远,核技术是上世纪世界格局的关键决定因素,军事机器人或将重塑战争面貌,颠覆全球秩序。虽然技术伦理值得重新审视,但是军事机器人实现的技术突破或推动了美国在人形机器人领域的发展进程。
外型设计:人形机器人建立人机情感链接的重要基石
美日人形机器人应用场景的差异或决定了美国军用人形机器人对“人类友好”的设计基准较日本个人人形机器人更低,这或是日本在人机情感交互的基石人形机器人外形设计方面仍然在全球范围内具有绝对优势的重要原因。
Hanson Robotics于2016年推出人形机器人Sophia,Engineered Arts于去年公布人形机器人Ameca,前者令人生畏,后者尽管神情逼真,却常让人细思极恐。Hanson Robotics虽然基于中国香港,公司创始人David Hanson其实来自美国。Engineered Arts则为英国人形娱乐机器人设计制造厂商。
△ 难以想象,Sophia的外形设计部分以Audrey Hepburn为原型(来源:The Verge)
△ 当Ameca视频在社交媒体上疯传,Elon Musk以“Yikes”作为回应,而Chrissy Teigen则以“absolutely. the f***. not.”表达这种反感(来源:Engineered Arts)
Uncanny Valley,即恐怖谷效应(不味の谷),最初于1970年由机器人学教授Masahiro Mori提出,用以形容接近人类形象的人造制品引发人类恐惧心理的现象,包括机器人在逼真程度特定阈值间引起的排斥反应。如果这一人工制品在移动、而非静止,恐怖谷效应可能随之增强。
△ 恐怖谷效应(来源:Nature)
与工业制造与军事行动基于实用主义的应用场景不同,个人人形机器人建立人机情感链接的需求决定了外形设计是该产品至关重要的竞争门槛之一可爱(Lovable)未必等同于幼稚,但是可怖的形象势必不利于建立信任。
值得注意的是,人形机器人的设计需要基于目标市场独特的文化背景。以体型为例,超出一定水准的相对身高、以及相对体积往往具有挑衅性。本田推出的ASIMO身高130厘米,体重54公斤;索尼推出的QRIO身高60厘米,体重7.3公斤;特斯拉推出的Optimus身高172厘米,体重 57公斤。然而,小米推出的CyberOne身高177厘米,体重52公斤。
人形机器人需要解决行走、感知、交互与智能化三大技术问题,因此其发展进程在极大程度上取决于机构设计、控制技术、传感器技术,以及人工智能技术的发展进程。尽管起步较晚,但是中国在诸多研发及制造领域的技术突破与成长速度或将推动这一进程。