展会信息港展会大全

将不可能变为可能!文本和数据挖掘如何助力这家大型抗体搜索引擎公司?
来源:互联网   发布日期:2023-11-18 13:51:38   浏览:1641次  

导读:当今时代,科学快速发展,由AI驱动的发现突飞猛进。在这样的背景下,研究人员应如何在海量的资源中发现可靠的信息来源并确保信息质量,以做出明智的决策? 文本和数据挖掘 (text and data mining, TDM)使用计算工具和技术来分析大型文本数据集,从学术论文...

当今时代,科学快速发展,由AI驱动的发现突飞猛进。在这样的背景下,研究人员应如何在海量的资源中发现可靠的信息来源并确保信息质量,以做出明智的决策?

将不可能变为可能!文本和数据挖掘如何助力这家大型抗体搜索引擎公司?

文本和数据挖掘(text and data mining, TDM)使用计算工具和技术来分析大型文本数据集,从学术论文、期刊和其他科学出版物中的大量科学数据里提取有价值的见解,旨在识别通过传统人工分析难以或无法发现的模式、关联和趋势,近年来已逐渐发展成为一种强大的工具。

施普林格自然的TDM工具赋予科研人员以“传统”渠道所不具备的检索和发现能力,并使其能够对信息进行深入探索。把TDM的强大功能与特定科研工具相结合,将有助于驱动变革性发现和一些重大社会挑战的创新解决方法。

如何将这一强大的工具引入到企业的研发架构中,让研究人员无需为了获取有用信息而研读数百篇文章?

下文采访了我们的合作伙伴CiteAb首席执行官Andrew Chalmers(CiteAb是一家专业提供抗体搜索引擎的公司),他分享了施普林格自然的TDM工具如何为其研究人员赋能,帮助他们提炼有价值的信息并节省研究经费。我们也希望借此启发研究人员、数据科学家和研发部门从业者,并为如何将TDM引入企业研发架构提供建议。

帮助研究人员提炼有价值的信息

想要在数千万种产品中,为一个实验选择合适的化学或生物试剂可能会令人生畏。早在十年前,CiteAb推出了一个抗体搜索引擎,旨在帮助研究人员避免在不适用于他们实验的试剂产品上浪费时间和研究经费。该搜索引擎的设计基于一个前提,即学术论文中描述试剂如何被使用的内容是可为研究人员所参考的。然而,从已发表的文章中提取这类产品信息需要对非结构化数据进行文本挖掘,而单纯的全文检索则无法发现这些信息。

将不可能变为可能!文本和数据挖掘如何助力这家大型抗体搜索引擎公司?

CiteAb使用施普林格自然的TDM API检索了6万份科学出版物的全文,识别被使用的试剂产品以及它们如何被使用,并将这些信息转化为支持其搜索引擎的结构化数据。这个过程高度自动化,采用了多种不同的文本挖掘方法,从简单的模式匹配到人工智能分类器,还纳入了人工审查环节以检查算法无法处理的边缘情况。

正如CiteAb的首席执行官Andrew Chalmers所描述的那样:“我们希望获得最好的数据来帮助研究人员,因此我们需要获取尽可能多的科学出版物和最高质量的数据。

与施普林格自然的合作使我们能够访问其丰富高质的系列出版物,并对这些出版物进行文本挖掘,将这些数据用于帮助研究人员获取可能受到付费约束的信息。然后我们将数据反馈给施普林格自然,他们则将其整合到Springer Nature Experiments(施普林格自然旗下高质量的实验室指南和方法数据库)中。我们与施普林格自然之间建立了密切的合作关系,因为数据得到了双向应用。”

“这一切都说明了如何通过多个步骤将不可能变为可能,并激发你去寻找下一个不可能的事情。”

在Chalmers看来,CiteAb既是一家生物公司,同时也是一家科技公司。他说:“在生物领域,有太多的前沿技术是我们希望为之找到可适用的产品的,而合理运用更多AI技术有助于更好地理解文本。目前我们已经可以一次性对40个不同靶点做免疫组织化学分析,这无疑是非常神奇的。”

施普林格自然的文本和数据挖掘

文本和数据挖掘(TDM)对大量的文本或数据资源进行自动选择和分析,产出研究和研究项目所需的有用信息,帮助研究人员检索内容、寻找模式、发现关系、语义分析和了解内容与概念和需求之间的关联等。

TDM的创新之处在于,研究人员就算不知道具体要问什么,也能对数据集进行分析。如今,AI已基本成熟它不单能呈递信息,还能提供建议、做出决策并生成内容。

施普林格自然开发了各种工具,旨在方便研究人员对我们丰富的出版物资源进行文本和数据挖掘。

适用于开放获取内容的TDM

施普林格自然开放获取内容API:提供施普林格自然开放获取XML格式的元数据和全文内容(如有),覆盖来自不同学科领域、超649,000篇在线文献,其中包括BioMed Central和SpringerOpen期刊。我们支持XML、JSON等多种数据输出格式。

针对订阅用户,施普林格自然提供各种各样的TDM组合数据,如元数据或全文API,同时适用于开放获取和订阅内容。

除知名的《自然》系列期刊和Springerlink期刊、图书之外,施普林格自然还拥有SpringerMaterials、AdisInsight、SpringerProtocols等专业数据库。

TDM数据库可同时为订阅用户定制化组合不同数据模块,以方便用户的检索和使用。

适用于非订阅用户的TDM

我们也提供多种TDM工具便于非订阅用户获得开放获取资源,例如开放获取内容的全文API。对于非订阅用户基于付费订阅内容提出的TDM需求,我们将根据具体情况进行处理。

赞助本站

相关内容
AiLab云推荐
推荐内容
展开

热门栏目HotCates

Copyright © 2010-2024 AiLab Team. 人工智能实验室 版权所有    关于我们 | 联系我们 | 广告服务 | 公司动态 | 免责声明 | 隐私条款 | 工作机会 | 展会港