By 超神经
内容提要:来自不同岗位、不同城市,跨越多个年龄段的 20 位开源爱好者,在今年年初集结起来,共同打造了智能问答机器人「小源」,为用户提供关于新冠疫情与开源相关问题。超神经有幸邀请到小源机器人背后的团队,为我们分享小源的故事。
关键词:智能问答机器人 知识库 NLP
经历了五六十年的发展,开源,已从最初的「星星之火」,成为「燎原之势」。
据 Gartner 调查显示,99% 的组织正在其组织系统中使用了开源软件,尤其是新兴技术领域,对开源技术的应用更为广泛。
在国内,开源也已有了二十多年的发展,近年来更是开展得如火如荼,越来越多的中国程序员投身到了开源社区。目前在 GitHub 全球 4000 万注册用户中,中国开发者从数量和贡献度上均位列第二,科技大厂的贡献度也越来越高。
阿里和腾讯在 GitHub 均位列企业 Star 榜的前十位
但尽管如此,很多开发者对于开源依然存在一些疑惑与误解。
针对这种现状,来自全国各地的 20 位不同职业、不同年龄段的开源爱好者,共同打造了开源智能问答机器人「小源机器人」,解答人们关于开源的困惑,揭开开源的神秘面纱。
小源 1.0:因新冠疫情而生
事实上,小源机器人最初并不是为开源而打造,而是因新冠疫情而诞生。
2020 年,对于任何人来说都是特殊的一年。新年伊始,一切都被新冠疫情打乱。而面对前所未见的新冠病毒,大家在恐慌的同时,也充满了各种对新冠的疑问。
彼时面对前所未见的新冠病毒,大家都在寻找权威的解答
如何在浩如烟海的资料中,快速定位正确的疫情知识,及时获取有价值的疫情信息?如何避开各路谣言,得到权威的解答?这些都是疫情期间亟待解决的问题。
在这样的背景下,小源机器人团队成立了。在大家的紧密合作之下,小源机器人很快成型。
小源机器人俨如一个对新冠肺炎了如指掌的专家,可回答的问题涉及方方面面,包括资料百科类、信息查询类、政策公开及权威公布类、辟谣类等。
提问新冠肺炎相关问题,小源机器人就会提供相应的答案
小源 2.0:为开源答疑而转型
随着国内疫情形势的逐渐好转,小源机器人抗疫工作的使命也暂时告一段落。
随后,小源机器人开始转型,被赋予了新的使命解开大家对于开源的困惑。
经过线下调研后,团队发现,大家关于开源的误解与疑问还真不少。比如,可能认为开源是需要懂技术、会敲代码,才能参与;再比如,作为开发者,在各种繁杂的开源协议中,不知如何选择适合自己的开源协议。
世界上的开源许可证,大约有上百种
仅仅是许可证的选择这一问题,对开发者来说就足够复杂
一旦开始一个开源项目,关于版权、专利、维护等问题都会纷至沓来,开发者可能不仅要忙于敲代码,还要在茫茫网络中寻找这些问题的答案。
为了帮助大家更好的了解开源、理解开源、参与到开源中,小源团队决定借助小源机器人,以聊天机器人这种易于使用又轻松的形式,为大家传递关于开源的知识问答。
团队将各类关于开源的问答,都纳入了小源机器人的知识库中。如果你有关于开源的疑问,那么把问题交给小源机器人,便可收到准确回答。
小源知识库目前已有 1024 条
并全部开源在 GitHub 和 Gitee 上
据介绍,小源采用了微软的智能对话平台,该平台的AI 技术为小源赋予深度学习模型的泛化能力、澄清模糊问题以及多轮问答的能力。比如,对于同一个问题,有多达数十种问法,小源依赖其自然语言理解能力,能够精准理解你的意图,从而提供精确答案。
小源机器人具有问题泛化、多轮对话等能力
在技术之外,还有各方面的非技术力量,让小源机器人更加完善。
这些非技术力量包括知识库的构建、产品策划、运营推广、知识产权,而这些都来自对开源、AI 机器人感兴趣的志愿者和从事知识产权领域的律师。
在团队成员朱忠凯看来,小源机器人并不是一个冰冷的问答机器,它的每一条回答都是团队成员亲手回答,里边包括不同作者回答的文风、语气、惯用词。对于用户来说,不仅通过小源机器人获得知识,更会对有着个性的小源产生一些情感。
小源团队:感受开源的力量与魅力所在
小源机器人面世之后,获得了用户的称赞和喜爱,并在 Hack for Wuhan 黑客松比赛中获得了「导师最喜欢项目奖」。对于团队来说,小源机器人让他们收获的不止是这些认可与荣誉。
在这个 20 人组成的团队中,有高中生,程序员,律师,还有医生;他们横跨好几个年龄段,从 70 后到 00 后;他们 base 全国各地 ,从广州到北京。他们是实打实的「网友」,却「聚」在一起,共同投入到小源机器人的项目中。
小源机器人团部分成员
虽然来自五湖四海,但小源团队的每个成员,都有一个共同愿景,便是通过小源机器人,用技术的力量,为抗击疫情与开源做出贡献。
当时开源社的白清杰,同时也是「疫战 2020」的发起者,组织了一个志愿者团队来建设疫情信息的知识库;
团队成员之一 Emily,是微软亚洲工程院 AI 资深产品经理。她当时在微软负责的项目之一是智能对话系统,因此她负责将该对话系统与疫情知识库结合起来(去年我们曾对 Emily 进行了专访,详情请见《她的十年开源路:只管热爱,无问西东》);
小源项目组产品经理惠世冀和团队成员朱忠凯都是开源项目的新手。他们表示,参与小源机器人项目,让他们感受到了开源的力量,感受到开源的强大,也第一次真切地感受到了开源的魅力所在。
参与项目过程中的问题与挑战,也让他们对于打造成功的聊天机器人、团队协作,有了更加深刻的理解。
用朱忠凯的话说,开源在本质上,是一种生命为了对抗熵增行为,而在工程领域产生出来的一种涌现现象。
独行快,众行远。小源机器人团队也正在召集更多开发者加入到这支队伍中来。
COSCon'20 完美落幕,小源团队邀你加入
上周末,开源年度盛会 2020 中国开源年会(COSCon'20) 成功在线上举办。各位嘉宾采取线上线下相结合的形式,从人工智能、开源治理、数据技术、教育与公益等 11 个方向,围绕开源向善(Open Source for Good)的主题进行了知识分享。
小源团队产品经理惠世冀在直播中
分享了小源的发展历程
10 月 24 日,小源机器人项目组产品经理惠世冀,在人工智能分会场,为大家分享了小源机器人的开源故事。从产品研发到产品背后的团队,让我们全方位地了解小源,了解开源,了解这群用行动展现何为「开源向善」的小伙伴。
小源机器人开源地址:
https://github.com/kaiyuanshe/xiaoyuan
完