人工智能已经变成了科技公司谈论的热词,包括Google、亚马逊、微软等。现在,即便是像Google学术这类的学术研究用的小众搜索引擎,也开始使用人工智能了。
简单来说,学术搜索引擎跟普通用户使用的 Google、百度等没有差别,但检索结果来自于期刊、学术会议资料或者是学术机构的文献。
最近的消息是,微软联合创始人 Paul Allen做的免费学术搜索引擎 Semantic Scholar 覆盖的学科从计算机科学扩展到了脑科学,计划是在2017年前覆盖生物学科。这个搜索引擎用上了机器学习的技术,希望减少科学家的检索论文的时间。
为了提升用户的效率,除了利用作者、出版商标注的关键词这种常用的方式外,Semantic Scholar 将机器学习的技术花在了信息筛选上,例如用计算机视觉等技术搜寻论文发布的会议名称、论文发布的时间,从论文文中筛选出关键词句等。这让搜索结果的信息看起来更加丰富。
对于科学研究人员来说,Semantic Scholar 看上去最大的用处是有更多信息筛选的角度,包括论文的影响力,媒体报道(Twitter 数据)、作者等,另外它直接提供图表预览,看起来能方便研究人员省下更多筛选的工作。
Semantic Scholar 是 Paul Allen 创立的非盈利研究机构 AI2推出的产品,这个搜索项目背后的团队有70 人,Paul Allen 已经为这个机构提供了 2000 万美元。
从提供的文献检索数量、搜索引擎的性能来看,Semantic Scholar 还在相当早期的阶段。去年 11 月份推出这个产品时,AI2 机构的 CEO Oren Etzioni 称,这个搜索引擎能检索到 80% 的免费论文文献,大约有 300 万份,在数量上远不及 Google 学术。
这可能是学术搜索引擎这个细分市场的趋势。另一家覆盖生命科学、医疗等领域的学术搜索引擎公司 Meta 在去年 11 月拿到了 Google 等投资的 600 万美元,称他们用机器学习检索医疗论文中的人名和物件,并根据用户此前阅读的论文作相关论文推荐。
当然,专业的学术搜索在搜索引擎领域也是个比较小的市场,竞争就更加激烈了。搜索引擎 Bing 早前也有类似的学术搜索,但运营 5 年后宣布关闭,功能并入 Bing 搜索。现在,能不能用人工智能这项新技术获取更多的用户,是这些搜索引擎需要考虑的问题。
题图来自:pixabay