展会信息港展会大全

当前位置：人工智能实验室> 人工智能应用 > 谷歌推出 DataGemma：基于可信数据源提高 AI 准确度，减少幻觉

谷歌推出 DataGemma：基于可信数据源提高 AI 准确度，减少幻觉
来源：互联网发布日期：2024-09-13 13:27:58 浏览：1245次

导读：IT之家 9 月 13 日消息，科技媒体 maginative 昨日（9 月 12 日）发布博文，报道谷歌公司基于谷歌数据共享（Data Commons）中的真实世界统计数据，推出了开放权重 Gemma 模型的新版本 DataGemma。语言模型当前面临的一大难题就是幻觉（Hallucinations），...

IT之家 9 月 13 日消息，科技媒体 maginative 昨日（9 月 12 日）发布博文，报道谷歌公司基于谷歌数据共享（Data Commons）中的真实世界统计数据，推出了开放权重 Gemma 模型的新版本 DataGemma。

语言模型当前面临的一大难题就是幻觉（Hallucinations），尤其是大语言模型（LLMs）在处理数值或统计数据时，这一问题变得尤为棘手，因此精确性至关重要。

谷歌的 Data Commons 是一个存储库，汇集了来自联合国和疾病控制与预防中心等可信组织收集的超过 2400 亿个数据点。

通过利用这一庞大的统计数据集，基于 Gemini 的 DataGemma 能够显著提升模型准确性，确保其输出基于真实可信的现实世界信息。

DataGemma 方法的核心在于两种关键技术：检索交错生成（RIG）和检索增强生成（RAG）。这两种方法通过在生成过程中将模型基于现实世界数据，从而减少幻觉现象。

IT之家简要介绍两项技术如下：

RIG：

通过主动查询可信来源，再生成回答的方式运作。在接收到提示词之后，DataGemma 会识别查询中的统计数据点，并从数据共享平台获取准确信息。

例如，若被问及“全球可再生能源的使用量是否有所增加？”，该模型会在回答中穿插实时统计数据，确保事实准确性。

RAG：

在生成回答之前，会从数据共享平台检索相关信息，进一步提升了回答的质量。借助其长上下文窗口（由 Gemini 1.5 Pro 实现），DataGemma 确保了回答的全面性，引入了表格和脚注以提供更深层次的上下文，从而减少了虚构内容的出现。

谷歌对 RIG 和 RAG 的研究尚处于初期阶段，但初步成果令人鼓舞。通过将现实世界数据嵌入回复中，DataGemma 模型在处理数值事实和统计查询方面展现出显著提升。研究团队已发表论文详述其方法，强调这些技术如何帮助 LLMs 判断何时依赖外部数据与内部参数。

人工智能实验室

相关热词： 谷歌推出 DataGemma 基于可信数据源提高准

上一篇：OpenAI o1模型问世，五级AGI再突破！推理极限超博士，华人立功

下一篇：OpenAI发布首款具有推理能力的模型o1，可“思考”后自我核实答案正确性

相关内容

AiLab云推荐

最新资讯

本月热点

热门排行

马斯克的xAI连发两款新模型，有进步但还谈不上领先

阅读量：63768

Meta Llama 3.1-405B AI模型多项跑分超越 OpenAI GPT-4o

阅读量：25512

《2024年AI Agent行业报告》｜甲子光年智库

阅读量：17958

从现在起，GitHub上超1亿开发者可直接访问全球顶级大模型，构建AI应用

阅读量：17455

IMF：对人工智能造成大规模失业、不平等加剧的可能性深感担忧

阅读量：14672

AI创投的那些荒诞故事

阅读量：14469

推荐内容

展开

热门栏目HotCates

关于我们

人工智能实验室（AiLab：Artificial Intelligence Laboratory）中国人工智能领域的专业媒体平台，始于2010年的中国AI创业先行者，专注人工智能、机器人、无人驾驶、可穿戴、模式识别、物联网、云计算等新兴技术信息资讯，是人工智能爱好者学习和交流平台，是一群梦想者与实践者的网络家园！

版权声明

本站部分文章来源于互联网以及网友投稿，本站只负责对文章进行整理、排版、编辑，是出于知识传递之目的，并不意味着赞同其观点或证实其内容的真实性。如果您有什么意见或建议，请联系E-mail：kefu#ailab.cn(将#换成@)！

Copyright © 2010-2024 AiLab Team. 人工智能实验室版权所有关于我们 | 联系我们 | 广告服务 | 公司动态 | 免责声明 | 隐私条款 | 工作机会 | 展会港