机械荟萃山庄

 找回密码
 立即注册

QQ登录

只需一步,快速开始

搜索
热搜: 活动 交友 discuz
查看: 367|回复: 1

大模型底座能力没突破之前 应用难有质变

[复制链接]

2万

主题

2万

帖子

17万

积分

超级版主

Rank: 8Rank: 8

积分
174346
发表于 2024-9-9 15:18:09 | 显示全部楼层 |阅读模式
“大家都知道AI大模型好,但怎么在内部落地部署,才能最大限度发挥大模型的效用?”“不论大模型选择B端市场还是C端市场,目前都没有清晰可行的商业模式。”从事前沿科技、智能驾驶等领域投资十年的云启资本合伙人陈昱日前在澎湃科技采访时直言。在加入云启前,陈昱曾任Google(谷歌)工程师、国内上市公司CTO(首席技术官),陈昱早在2021年已入局大模型,当年他参与投资了大模型创业企业MiniMax,成为后者天使投资人,MiniMax也是眼下大模型明星创业企业之一。

陈昱表示,今年大模型公司看起来都融到了钱,明星创业企业的估值达到了二三十亿美元,但科技公司所处的创投环境其实非常残酷,资本不可能无限制地支持不赚钱的公司,创业公司最终必须形成自己的商业模式,能产生规模化的收入。但现实情况是,大模型创业公司要想实现规模收入已经非常困难,更谈不上盈利。不论选择B端(面向企业)市场还是C端(面向消费者)市场,大模型公司都面临着相似的困境,还没有清晰且成立的商业模式。
B端市场其实是帮企业客户部署私有模型。当前,B端市场的利润空间正在急速萎缩,去年能卖到千万级别的大模型项目今年可能只能卖到100万元了。市场上有太多的开源大模型可以套壳,竞争非常激烈。B端业务涉及售前服务、合同签署、项目实施(如模型监督微调)以及售后维保等,这些都得耗费人力,原本卖到千万,大模型企业可能有毛利空间,但现在连毛利都没有了。
大模型企业训练基座模型消耗的算力成本通常是上亿级的,而当下大模型企业也没有办法通过B端业务的收入来分摊训练成本。
许多企业不愿错过AI浪潮,但在AI与自身业务结合上还没有找到明确的路径。甲方也一样,面临的最大的问题是知道要运用大模型,但不知道大模型如何在企业内部落地、部署,如何才能最大限度发挥大模型的效用,事实上这需要花大量时间和大模型公司沟通。
企业做大模型私有化部署时,数据或许会成为真正的障碍。什么样的数据适合微调、怎样做数据清洗,有用的数据怎么做好标注,这些都得花人力、物力。训练数据的选择和模型对齐会极大影响模型的使用效果,所以不存在一个大模型能适用所有的场景。
大模型面向C端大众市场的产品应用大概可以分为两大类:一是情感陪伴类对话机器人,譬如MiniMax旗下的星野和大家熟知的海螺ai;第二类就是生产力工具。这些产品其实各家大模型都在做,问题是只要大企业一天不收费,其他企业也很难收费,因为它本质上并没有用户粘性。对于现金流良好的大企业来说,最好的策略就是把竞争对手熬死,所以对于国内创业公司来说,要想通过面向C端的生产力工具来收费也会很困难。最终肯定会出现融钱融不到而被淘汰的企业。大模型出海,其盈利方式和在国内市场并没有太大变化,海外市场更大,海外客户的付费意愿也相对国内会高一些。但会面临着与国外大模型产品的竞争,极具挑战。
从去年到今年,大模型的推理成本已大大降低,但之所以没出现很好的应用场景,还是受限于大模型本身的能力,如推理能力和幻觉问题。
现在大家整体的感觉就是,大模型很多地方都可以用,但又好像什么地方都用不了,这是因为大模型没有调教之前还涉及幻觉等问题。这也是我们投资难做的原因,虽然大家都在看AI应用方向,但问题在于大模型的底座能力进展缓慢。大模型能力没有突破之前,下层应用很难有实质性的改变。

回复

使用道具 举报

0

主题

2008

帖子

1万

积分

论坛元老

Rank: 8Rank: 8

积分
15268
发表于 2024-9-9 23:00:36 | 显示全部楼层
试过用最新的openai解题,看起来说得头头是道,但实际上连基本的能谷歌到的常数都弄错了
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

QQ|小黑屋|手机版|Archiver|机械荟萃山庄 ( 辽ICP备16011317号-1 )

GMT+8, 2024-11-22 15:32 , Processed in 0.086831 second(s), 20 queries , Gzip On.

Powered by Discuz! X3.4 Licensed

Copyright © 2001-2021, Tencent Cloud.

快速回复 返回顶部 返回列表