展会信息港展会大全

对话高途联创罗斌:教育公司要想在应用AI层改变格局,至少需要3-5年的周期
来源:互联网   发布日期:2025-02-17 08:06:54   浏览:223次  

导读:“不要期待有了AI之后就能一剑封喉。”来源|多知作者|徐晶晶兴奋。未知。这是高途联合创始人罗斌面对当下DeepSeek引发的这一轮AI技术浪潮时的心境。兴奋,是因为看得见的确定性,“拉长周期来看,DeepSeek带来了巨大的变量,创造了新的可能性。”不过,这份确定性又是模糊的、未知的。“大致方向是能看得见的,但是整个路径、节奏是模糊的、非共识的,这其中存在很大的不确定性 ......

对话高途联创罗斌:教育公司要想在应用AI层改变格局,至少需要3-5年的周期

“不要期待有了AI之后就能一剑封喉。”


来源|多知

作者|徐晶晶

兴奋。

未知。

这是高途联合创始人罗斌面对当下DeepSeek引发的这一轮AI技术浪潮时的心境。

兴奋,是因为看得见的确定性,“拉长周期来看,DeepSeek带来了巨大的变量,创造了新的可能性。”

不过,这份确定性又是模糊的、未知的。“大致方向是能看得见的,但是整个路径、节奏是模糊的、非共识的,这其中存在很大的不确定性和未知性。这也意味着,一种压力。”

2月12日,高途正式宣布接入DeepSeek大模型,不过,其对DeepSeek的关注要比后者大范围步入公众视野更早。

高途透露了接入DeepSeek后带来的一些显著变化:

比如,内部协同工具AI助手在接入后,截至目前,日访问量提升了200%,预计在2月中旬完成内部业务系统和协作平台全面打通之后,访问量将会进一步增加。

再比如,在用户产品侧,以DeepSeek为技术核心的高中数学测评准确率提升了15%,而后高中AI选科规划服务也借由AI助力实现了服务质量提高。

在高途官宣接入的当天,多知就DeepSeek相关话题对话了高途联合创始人罗斌。

罗斌严谨地给出了一些判断和预期:

1.DeepSeek-R1大模型的准确率已达到在教育场景相对可用的状态。

2.今天的大模型还处在整个AI能力进化的相对早期阶段,如果成熟状态是100分,那么今天的这些大模型最好的状态也就是5-10分的水平,离终态还很遥远。

3.在基座模型不断迭代时,对每家公司来说,更重要的是要找到一种机制,以便在大厂的基座模型快速迭代的过程中,能及时跟上这一波变化,并在每次变化的过程中,能及时把新的能力结合进来,为自己所用。

4.回到教育这个场景,至少在我们现在能看见的一个周期内,AI能力本身是一个关键要素,但不是一个决定性的要素。不要期待有了AI之后就能一剑封喉。

5.如果有了更强大的大模型能力,过去拍搜的这种模式就会发生变化,就不需要提前去生产积累自己的题库,现在是一种实时解答的方式,通过大模型就能够达到一个非常高的准确率了。

6.教育AI的iPhone时刻一定会发生,但时间、形式不确定。教育公司要想在应用AI层面改变格局,至少需要3-5年的周期。

7.众多学习环节里,AI能替代的,其一,是一个相对简单的学习任务。其二,AI更适合于学生主动来发起、AI来接听响应的场景。而需要由我们来主动地管理和影响学生的这个部分,今天的AI还做不到。

8.小型的创业公司,在某些单点上、在某些形态的产品上,有可能获得一波特殊的机会。但是如果回到重交付、端到端、以学习结果为导向的领域里,这里的机会对于创业公司而言,挑战还是非常大的。


01

DeepSeek-R1大模型的准确率已达到“在教育场景相对可用的状态”

多知:DeepSeek将如何影响教育行业未来的发展?会带来哪些颠覆性的改变?

罗斌:第一个变化,DeepSeek这波算是完成了一次比较好的市场教育,提升了大众对于AI能力的关注度,也让普通用户使用AI工具的渗透率得到了提升。

第二个变化,结合公开信息和我们内部验证来看,DeepSeek-R1的模型做了一些创新(包括引入了更强的推理能力)后,在一些教育场景下的应用效果确实有很大的提升。这种提升意味着,从应用的角度来说,它的准确率已经达到了一个相对可用的状态。

教育行业的容错率比较低。原来,大模型的准确率并没有达到可用状态。但是今天,以DeepSeek-R1为代表的这些模型的能力迅速提升,让整个可用性变得更高,也让更多的场景引入这一大模型的能力变得更加可行。

举例来说,在我们内部高中数学的一个题库上,之前我们用原有模型测试,准确率最佳情况是能做到74%。我们现在拿DeepSeek-R1结合内部级数据测了一下,经过调优之后,准确率大概能到90%。这还是其在高中数学的知识体系里的表现。如果知识点下沉到初中、小学,DeepSeek-R1的准确率会提升得更显著,可能接近于真人的状态。

第三个变化,让更多企业坚定了对AI的投入。之前很多企业对AI还没有形成很好的共识,毕竟AI的投入成本比较高,也需要专业人才。但今天很多企业意识到了,必须要拥抱AI。

回到教育场景下,它可能会带来的变化主要是在两个方向:

一个方向是为学生创造更好的价值。

从产品的角度来讲,目前行业里的教学环境,大部分还是通过以真人老师为主来跟学生进行交付。有了DeepSeek能力的辅助后,老师和学生在整个教学过程中的反应的速度、平均的专业度、效率、服务群体的规模,都能得到大幅提升。

这带来的一个变化是,原来必须要由专业的真人老师来提供一些教学服务,今天通过大模型的辅助,不管是教学、练习还是答疑,直接通过AIToC或者通过AI辅助老师来ToC这两种情况下,整个效果和效率都能够有显著的提升。

另一个方向是改善企业内部的运营效率。不管是市场营销、销售转化或服务的环节,效率都会有显著提升。

必须要明确的是,虽然以DeepSeek为代表的大模型现在很火,但是总体来讲,它们还是在整个AI能力进化的相对早期阶段,如果成熟状态是100分,那么今天的这些大模型最好的状态也就是5-10分的水平,离终态还很遥远,在短周期内,我们还不能对它的节奏和价值期待过高。

02

在基座模型快速迭代的过程中,教育公司也要让自有模型及时跟上变化

多知:市面上很多教育公司已经有自研的大模型,同时接入了DeepSeek,怎么看其未来的路径?

罗斌:如今,DeepSeek是一个更强大的基座模型,无论是把自己原有的模型或数据和DeepSeek结合,还是以DeepSeek模型作为基座,重新去训练新的自有模型,每家公司会用不同的路径来做。

但我的基本观点是,今天大模型的底层生态,如果只是5-10分的水平,那么在未来的半年、一年、两年、三年,底层的大模型还会有突飞猛进的变化。

今天各家在这样的场景下构建起的自有模型的能力提升速度,跟大厂的模型提升速度相比,完全不在一个量级。

在这种情况下,对每家公司来说,更重要的是要找到一种机制,以便在大厂的基座模型快速迭代的过程中,能及时跟上这一波变化,并在每次变化的过程中,能及时把新的能力能结合进来,为自己所用。

03

不要期待有了AI之后就能一剑封喉

多知:当教育公司普遍拥抱DeepSeek,大家的差异化、本质区别将体现在哪里?

罗斌:不管是以DeepSeek为代表开源的基座模型,还是一些大厂的闭源模型,它都会有某种方式开放给整个社会使用。所以在底层的基础的能力上,是相对标化的、是平等的,大家在这个地方不会有明显的差异。

但可能会存在差异的地方是什么呢?

第一个维度就是在模型的本身。

各家根据自己的需要,尝试建垂直模型、小模型或者专属模型,这样能更好地适配不同应用场景。比如高途有考研业务,也有公考业务,可能用于考研业务的模型和用于考公业务的模型就不太一样。这里可能存在差异化的模型的版本。

各家在专属模型的建设能力和水平上实际上是有差异的。

第二个维度是在应用层。

关于基座模型,教育公司们不会有显著的差异。但在应用层,可能变化会更多一些。现在的模型,更多的还是偏系统1的这种模型,还不具备非常强的推理、调度或者真正意义上的智能。

未来,大家也在提,比如大套型套小模型的方式,或者是通用模型嵌套专有模型的方式,包括未来有市面上有这么多的模型,怎样做混用,不同的场景下可能调用不同的模型,另外,包括人机怎么结合,老师和AI怎样协作,让整个过程能够变得更加高效和专业,这个地方可能各家的做法会有差异。

还有一个就是怎样做运营。同样的一个能力,在不同的团队里面,你的推广、宣传、运营,可能会导致最终的使用的广度、深度、效果上,也会有明显的差距。

第三个维度是在产品层。

站在学员的角度,学员需要的产品是一个解决方案。他并没有那么在意你提供的是真的AI还是别的什么。

所以结合AI的能力后,每家提供的解决方案,是不一样的。但是从学员角度看,他需要更好的体验,更好的效果和更好的性价比。因此,在产品上,变化会更大。

最后一个维度是组织能力。

同样的一种AI能力,随着时间的演进,大家的迭代方向和迭代速度是会有差异的。

拉长周期来看,不管是从产品层面还是从运营层面,都会形成更加明显的差异。

这里面,人才的影响是比较大的。

总结来讲,底层能力、标准化的这些能力,大家是类似的。但是回到教育这个场景,至少在我们现在能看见的一个周期内,AI能力本身是一个关键要素,但不是一个决定性的要素。更重要的还是在产品、在应用等方面,可能需要结合AI来做重新的思考设计。面向未来的一个周期(3-5年)来做这样的布局和迭代,可能是更加重要的。

不要期待有了AI之后就能一剑封喉,这件事情不太会发生。

04

大模型实时解答,正在消解拍搜解题产品的题库门槛

罗斌:原来学生有一道题不会做,他要么问老师,要么就用拍搜工具。拍搜工具内部是要做大量题库的生产和累积的,但今天看起来,如果有了更强大的大模型能力,过去拍搜的这种模式就会发生变化,就不需要提前去生产积累自己的题库,现在是一种实时解答的方式。

所以我的感觉是,未来在解题的这个部分,你问AI一道标准化的题,AI给你进行解题这件事,会变得比较标准化了,通过大模型就能够达到一个非常高的准确率了。相当于拍搜题库这件事不会有绝对的门槛了。当然可能每一家自己做出来这个模型,通过不同的数据和调优以后,可能还会有一定的准确率的差异。但这个差异就没有那么大了。

原来可能你手里有一亿的题库,人家手里可能只有一千万的题库,差异可能会特别大。但有了更强大的大模型能力,以后可能的差异是,你的准确率可能是93%,人家的准确率可能是91%。可能只是这种层面的一个区别。但是在覆盖率上,可能大家都能够做到非常高的覆盖率。

05

学习环节里,相对简单的任务和交互,更容易被AI替代

多知:DeepSeek会不会取代一些现有的学习产品?

罗斌:如果把整个学习进行拆解,不管是面向学生,还是站在企业内部的角度,有很多环节。

哪些环节受到AI的影响更大呢?可能是相对简单的任务,相对简单的交互,在这种逻辑下,更容易发生。但如果它是一个长周期的、多任务的、复杂的链条,AI在里面产生很大作用的难度会比较大一些。

所以,第一个,AI替代的应该是一个相对简单的这种学习任务。第二个是,它更适合于学生主动来发起、AI来接听响应的场景。而需要由我们来主动地管理和影响学生的这个部分,今天的AI还做不到。这是因为,AI的能力还不够,也很难让学生真正遵从AI的指令。

所以从这两个角度来讲,AI能够在里面发挥作用的一些环节还是可以罗列的:

第一种场景,在企业内部的一个场景下,通过AI来辅助做一些内容的生产,做一些知识库的建设,包括做一些内部的问答平台搭建,这是可以做得到的。

第二种场景,一些简单的对话场景,比如像客服、拍搜(学生问一个问题,你要给他一个答案,这种就是用户过来之后就去寻找一个答案的这样一种逻辑,跟标准化的DeepSeek的用法类似。你给一个输入,它会反馈你一个输出,提供一些专业的内容解答)这种类型的场景下,AI的能力会越来越强。

第三种场景,在一些特定的练习场景下,AI是可以承担这样一个角色的。举个例子,英语对话练习,市面上有很多的产品在做类似的一个事情,这也是比较简单的对话性的任务,或者是你需要他给你针对一个特定的题目做一下讲解,讲特定的一道题,简单的教学或者是对练,是可以通过AI来做一定的替换的。

但是除了这三种情况以外,对于其他的比较复杂的这种任务,以及这种需要老师和学生进行强互动,强引导,甚至带有一定的管控属性的任务和场景,AI在里面更多的只能起到一个简单的辅助的作用,也很难真的替代真人来完成这些逻辑。

06

教育AI的iPhone时刻一定会发生,但时间、形式不确定

多知:随着AI的快速发展,未来教育行业的格局会发生怎样的大变化?

罗斌:教育行业格局如果要发生大的变化,一定要有一个重要的变量会不会有真正意义上新形态的产品出现。教育+AI里会不会有一个iPhone时刻,像当年iPhone横空出世一样,带来根本性的产品的变化和升级?

赞助本站

AiLab云推荐
展开

热门栏目HotCates

Copyright © 2010-2025 AiLab Team. 人工智能实验室 版权所有    关于我们 | 联系我们 | 广告服务 | 公司动态 | 免责声明 | 隐私条款 | 工作机会 | 展会港