文/Kathleen Walch、COGNITIVE WORLD
美国专利商标局(USPTO)的主要功能是授予发明专利,并为产品和服务注册商标和服务标识,而其改进这项功能的关键手法之一就是通过多种方式使用自动化和人工智能来提高专利审查人员的办事效率。
在10月的AI in Government在线活动上,美国专利商标局高级分析部门负责人Scott Beliveau将分享他对如何利用大数据、自动化和AI来推进工作的见解。在活动开始前的这次采访里,Scott Beliveau介绍了美国专利商标局的一个小团队如何创建了一个获奖的AI/ML程序。该程序为局里节省了数千万美元,并在每年为超过2亿个公共请求提供服务。在美国专利商标局,分析、自动化和AI在许多不同的场景下协同工作。
为了让美国专利商标局受益,你们在使用大数据和AI方面有哪些创新?
Scott Beliveau:作为一个收费机构,数据是美国专利商标局的“流动资本”我们将其视为改善内部决策的资产,以及赋能企业家和创新者的一种方式。数据可以支持我们的项目评估,并推动我们的业务案例和财务分析。它还能推动成本节约,实现预测性规划,并改进政策和项目操作。
高质量数据能够提升美国专利商标局的AI性能。和专利相关的AI工作主要集中在支持专利搜索和分类的自然语言处理(NLP)技术,商标方面的工作则通过计算机视觉来进行欺诈检测。这些AI技术的使用可以帮助我们推动发布高质量和及时的专利及商标申请。
美国专利商标局是如何以自动化为基础发展AI的?
Scott Beliveau:我们的AI之路实际上更像是一段数据之旅。我们首先通过一个可共享的“社交”平台DeveloperHub来建立一个数据基础,用来展示使用我们的数据并将其与其它数据集结合起来的独特方法。人们可以获取我们的数据,对其进行使用和升级,然后反馈给我们更多的信息,以此不断继续循环。这个数据基础令我们能够使用自然语言编程来提取和编码信息以进行识别。如今,我们的数据被用在了许多领域,包括Pile数据集,这是AI/NLP研究社区的一个进展。
对于自动化和认知技术项目,你如何确定该从哪个问题领域开始?
Scott Beliveau:我们总是从客户价值的角度出发,而不是从IT能做什么出发。然后我们会通过一系列的问题,比如“客户想要什么?”“如果客户得到了它会做什么?”或“它对客户来说有多少价值?”在有了答案之后,我们将通过阶段性的成果来达到长期目标。
在数据和人工智能方面,公共部门将拥有哪些独特的机遇?
Scott Beliveau:我们机构的数据涵盖了过去250年里所有你能想到的创新。作为一名公务员,我经常会见发明家,听他们讲述如何使用数据或我们的公共人工智能服务创建一家新公司或把工作做得更好。在公共部门工作提供了影响许多人生活的独特机会。
你可以分享哪些AI的成功案例?
Scott Beliveau:美国专利商标局目前有两个正在建设的真实AI案例:“更丰富的引用”和“自动分类”。
在“更丰富的引用”方面,我们的团队使用自然语言处理来解构专利申请响应,并创建更丰富的引用,以便使利益相关者和国际合作伙伴的研究变得更容易、更快。这种方法不但采取了从用户角度出发的设计思维来理解利益相关者的需求,还使用了无数的数据变量以交付出以用户为中心的结果。NLP模型被证明比之前几十位专家的工作更快、更准确,其在丰富引用方面为局里节省了数百万美元。
我们还在专利分类工作中部署了AI和机器学习(ML)。美国专利商标局收到的每一项创新都被归为几十万个类别中的一个或多个符号。目前,我们的手工分类服务相对缓慢和昂贵,但在对新的AI/ML算法AutoClass进行训练后,它可以在数小时内用分类符号对专利和非专利文件进行分类,成本只有过去的十分之一,工作质量也差不多。该服务结合用户反馈来验证结果的准确性。AutoClass可以无缝集成到我们的路由和搜索功能,从而显著节省成本。这种新的、更智能的路由系统已经为局里及客户节省了时间和数百万美元。
公共部门的AI和机器学习面临哪些挑战?
Scott Beliveau:作为一个行政机构,公共部门AI和机器学习面临的挑战之一是在可解释性和透明度之间取得适当平衡。对我们做出的决定的背后逻辑进行阐释是确保知识产权系统透明度和人们对该系统信任度的关键。数据和算法训练的透明度至关重要,因为任何偏差都可能给申请人带来意想不到的负面影响。但完全透明可能会让寻求操纵该过程的人进行“**”。另外,完全透明还可能限制美国专利商标局使用私营领域的机器学习服务的能力,因为这些服务会影响商业专利隐私。
在美国专利商标局,分析、自动化和AI如何协同工作?
Scott Beliveau:分析、自动化和AI对我们的数据程序和数据生命周期都至关重要。我们的专利审查员和商标律师在对是否授予专利或注册商标进行决策的过程中,每一步都会用到数据,而且团队会对这一过程每个步骤中获取的数据进行分析,以确定改进机会,然后改进自动化、AI、机器学习或非IT性行为。最后,我们用数据来评估这些改进的结果,从而完成持续的学习循环。
你是如何处理有关AI使用的隐私、信任和安全问题的?
Scott Beliveau:要小心。根据美国商务部2016年的一项研究,知识产权相关行业占美国整体就业的30%,如果不能保证创新的安全(除非它可以合法共享),可能会给小企业或国家的全球竞争力带来灾难性的后果。安全是我们最关心的问题,也是我们在创建、发布和使用AI技术时每一步决策的驱动力。
美国专利商标局在建立AI团队方面做了什么?
Scott Beliveau:作为一个拥有数千名计算机科学家和工程师的机构,美国专利商标局每天都在关注最新和最伟大的技术,并在建立AI团队方面有了一个很好的开端。不过AI是一个快速发展的领域,我们发现最好的跟上节奏的办法就是建立一个持续学习的组织文化,以便让组织成员像有激情跟踪新APP一样拥抱内部创新。构建-衡量-学习,然后重复这个过程,如果有什么不奏效的话,就从中吸取经验教训,然后继续前进。
未来几年你最期待的AI技术是什么?
Scott Beliveau:合作情报。机器擅长更快地处理大量数据,并把人们解放出来做一些不那么单调或重复的工作。我特别感兴趣的是,创新者如何能够利用协作智能的进步不仅仅是自动化流程,而是如何重新设计流程,以利用协作智能技术。
Kathleen Walch、COGNITIVE WORLD是福布斯撰稿人。