中意知识网 中意知识网

当前位置: 首页 » 常用知识 »

全民AI启蒙之后 DeepSeek向产业纵深处走去

[ 在DeepSeek之前,没有厂商将有用且便宜做到一个完美的平衡点。DeepSeek给出了选择,之后可能也会拉动整个行业,激活大量应用场景的变化。彭斌表示,虽然短期可能看不太出来,但是它会孕育一种生态,慢慢就会发生,可能再过半年、一年去看会很有意思。 ]

DeepSeek引发的效应正在每一个行业发生。“客户直接指定了,非常明确地说要DeepSeek。”蜜度首席技术官刘益东对第一财经提及客户对一体机的要求突然转向。在今年1月初就提出需要一体机产品的客户,1个月后新的需求是,在原来功能基础上,希望能将模型换成DeepSeek,同时,也有更多用户开始来咨询一体机产品。

从手机、办公到影像,甚至是农田无人机,DeepSeek撬动了越来越多的产业,让更多的企业、更多的人开始真正思考,“我必须要用大模型去做一些事情”。OPPO ColorOS系统设计总监陈希认为,这是一个起点,未来一定会驱动产生一系列的AI实践。但这场风暴催生的变革初期,挑战同样存在。

“小步快跑”用起来

数据中心服务厂商超云在2023年就已发布一体机,但连续一年多的时间,“大家对于一体机这事儿并不是很感冒”。在一场直播中超云产品运营中心副总经理任世杰提到,背后原因一方面是部署成本过高,另外一方面或许是与业务相结合的效果没有达到客户预期。任世杰发现,直到DeepSeek出现后,一体机的需求才开始旺盛。

蜜度主要做B端政企和机构的智能办公、城市治理等服务,也推出了一体机产品,在今年1月他们发布了针对智能办公场景的“模力通”。在节前已经沟通过需求的客户,在节后新的需求是,希望可以有一个DeepSeek的选择项。

“客户问一体机能不能放DeepSeek的模型,我们也紧急在春节期间,包括节后就开始产研,做适配和验证,将它放进去。”刘益东感受到DeepSeek对业务促进明显,1月后,更多的客户来咨询了,也有已经达成的商业合作。

“在一个大致正确的方向上,我们信奉小步快跑,不断更精细化地去验证用户精细颗粒的需求。”OPPO是第一批接入DeepSeek的手机厂商,谈及接入前的考虑,陈希表示,在这一确定性很高的趋势上,内部没有经过太长的纠结,“我们想的是怎样尽快把DeepSeek第一个融入我们的产品中来,这是一个非常好的机会点。”目前OPPO ColorOS对外表示“月月有更新”,甚至以周为单位迭代新的功能。

DeepSeek让更多企业、更多的人开始思考,“必须要用大模型去做一些事情”。

“一个通用的大模型,给它一张照片,它会告诉你这是一块农田。但是用我们的大模型微调以后,它应该会告诉你这是种的棉花,长势如何、什么地方有一点问题,你得去看看。甚至可以给出更重要的意见,比如灌溉没做好,缺肥缺微量元素,这也是常年在农场里干活的农业专家的工作。”极飞科技创始人兼CEO彭斌表示,极飞一定会有这样的AI功能出来。

在DeepSeek之前,没有厂商将有用且便宜做到一个完美的平衡点。DeepSeek给出了选择,之后可能也会拉动整个行业,激活大量应用场景的变化。彭斌表示,虽然短期可能看不太出来,但是它会孕育一种生态,慢慢就会发生,可能再过半年、一年去看会很有意思。

“买菜无需豪华车”

尽管DeepSeek效果很好,但在应用场景里单一模型也并非所有情况下的最优选。商业化面临的一个选择是,在不同场景里挑选性价比最高的模型“应答”。如果追求大参数量的满血版本,用户是否会为模型更高的成本买单?这是商业化需要考虑的核心问题。

在蜜度,内部曾花了一两周的时间去验证DeepSeek在公司业务场景的表现,在智能办公、智能客服、城市治理这类不同场景下,同时测与DeepSeek同类型同等参数量的其他解决方案模型。

刘益东对第一财经表示,基本上DeepSeek带思维链或者深度思考的R1满血版本,效果要优于原来的解决方案里不带深度思考的版本。而原来方案里采用的模型的表现,可能要略好于DeepSeek同类型参数不带深度思考的版本。他强调,这是在公司的业务场景里,积累下来的数据集跑出来的结果,并不代表所有应用。

DeepSeek目前主要有两个最新的模型,一个是推理模型R1,也就是有思维链的深度思考模型,消耗更多的token(词元)、更多的时间带来更加详细的回答,另外一个则是基础的V3模型,用更少的token和更快的响应,带来更简单的回答。这是不同的两个技术路线,在应用场景里用来解决不同深度的问题。除这两个模型之外,在应用中还可以选择DeepSeek不同参数量的蒸馏版模型,减少部署成本。

除了调用API(应用程序编程接口)的模式外,私有化部署也存在用不同模型成本的问题。

任世杰提到,“不见得部署自己的模型,就非要是满血版的。”他表示,有客户看到单机就可部署DeepSeek 671B满血版本的模型,就也要满血版,但没有考虑到,单机部署虽然把这些模型容纳进去,但实际使用中能并发出来的模型专家数量也就8个到10个,利用率会变得非常低。

“将选模型的问题看作是买车的话,如果更多需求是买菜、送孩子上学,那没必要买一辆豪华跑车。”中国人民大学校级计算平台负责人、高级工程师鲁蔚征认为,虽然豪华跑车更好,安全性或者荣誉感都很好,但是带来的成本也会很高,同时还有维护成本。

实际上,大部分业务部署必须要考虑成本的问题。“现在因为DeepSeek刚火不久,大家都是先去拥抱DeepSeek的生态。越往后业务量起来之后,推理的请求多了之后,算力成本或者推理成本是不是能接受得了,这是一个比较大的问题。”UCloud优刻得华北解决方案架构师马杰提到。

这个问题到手机厂商这里,为了做到性能和成本的平衡,OPPO系统团队在做的是“意图分流”。陈希提到,OPPO ColorOS会做一个系统级的AI,和多个大模型进行合作,除了DeepSeek,还有其他视觉大模型、声音大模型以及其他多模态的模型,系统要把这些模型整合在一起。

除了模型整合上的挑战外,在手机系统上,用模型做一些更复杂的应用同样还存在难题。例如,谷歌曾于去年发布AI智能体项目Project Astra,可以通过手机摄像头与大模型进行实时的视觉与语音交互,在今年3月底终于上线,但也并未完全开放。

陈希认为,视频对话这样的场景会更复杂,怎么能让技术的尝鲜变成用户场景的常用,这一步比较困难的是要做大量泛化的努力。这本质上还是技术的问题,因为现在的技术并不能充分满足各种各样的应用场景,用户场景是复杂的、千变万化的,有可能在车上晃来晃去,有可能在暗光环境下看不清楚,都会对技术的可靠性造成很大影响,而现有的技术还不能完全泛化地去处理所有产品,这也是OPPO仍然在探索的方向。

除了一些技术的挑战外,不少从业者都提及的一个点是,客户内部的数据源质量会决定企业能否将大模型的潜力挖掘出来。

未经允许不得转载: 中意知识网 » 全民AI启蒙之后 DeepSeek向产业纵深处走去