其它行业的企业是不会为国产大模型买单的
本帖最后由 寂静回声 于 2024-7-5 15:36 编辑很简单,就一句话无法满足客户需求。
扯鸡巴蛋说片汤话,可以。
2024年初,酱香酒企肆拾玖坊在经销商群里投放了一个大模型驱动的聊天机器人。
群聊机器人不是什么新鲜玩意儿,但大模型是时兴技术。肆拾玖坊是酒企里的新兵,2015年才成立,与传统酒企相比公司规模不大,但对新技术敏感。肆拾玖坊CIO(首席信息官)张鹏告诉我们,经销商对酒企来说太重要了,希望借助大模型的自然语义交互功能提高对经销商的服务能力,实现提高销量的目的。
热闹了一段时间,张鹏有点失望,“大模型加持的机器人就是不一样,特能说,比闺蜜还能提供情绪价值,但这不是业务价值。”张鹏分析,其经销商群里的聊天机器人属于市场营销工具,经过大模型技术升级后,聊天机器人的语言表达更加自然,但仍不具备销售人员的主动服务和专业素质。它提供的核心功能是同步产品价格、渠道等信息或行业通识类知识,整体能力相比上一代问答机器人虽有提升,但业务价值不明显。
一开始张鹏选择聊天机器人落地大模型技术,是因为营销场景能直观评估商业价值转化。但从结果看,这个场景的投入和产出“不太能达到预期”。
上述头部咖啡连锁品牌CTO认为,目前大模型技术在业务中展示了部分效率工具的价值。该公司将大模型引入营销、客服和内部培训场景,大模型在辅助文案和设计创意时“有些作用”。但他评价效率价值是相对的,对企业来说业务价值更重要。
大模型落地企业的方式主要有两种。一种是企业私有化部署大模型,它可以保证企业的数据安全,但部署成本高达数百万元,适用金融、电信、能源等数据敏感行业。另一种是调用厂商的大模型API(应用程序编程接口),它的成本低,主要以输入输出的Token(模型可以理解和生成的最小单位,它可以是一个词、一个数字或一个标点符号等)量计费,部署方式简单,适合的场景也更广泛。
肆拾玖坊主要采用成本低的API调用模式。试点后,公司发现大模型对业务价值有限,决策者对后续大模型落地的探索已经趋于保守。
我们和十余位散落在各行各业(主要是相对传统的行业),规模不尽相同的头部公司CIO交流了大模型的落地情况,得到两个反馈:
其一,作为当下被认为是最重要的创新技术,大模型确实受到企业重视。他们想通过大模型技术解决痛点业务场景的问题,给企业带来降本、增效、提质、拉需、创利等实际价值。
其二,目前大模型技术主要在单点、小场景落地,难以对业务整体带来直观回报。一位头部咖啡连锁品牌首席技术官表示,大模型只能锦上添花,无法雪中送炭。
目前,多数企业落地大模型的阻碍包括但不限于以下四点:明确有商业价值的落地场景有限、模型落地的工程化能力不足、行业和场景大模型尚不完善,以及企业自身对大模型的认知不足。
中观数据侧面支撑了以上反馈。国联证券核对了A股全部公司2023年财报,有883家上市公司提及生成式AI业务。落地的企业集中在TMT(Technology科技、Media媒体、Telecom电信)行业和大市值公司。超过一半的一级行业渗透率不到10%,A股上市公司整体渗透率不足20%。
从结果看,先行企业探索的落地场景有限,集中在虚拟人、客服问答、营销文案、平面设计、代码生成、知识库、智能助手等。这些场景与企业核心业务的关联较轻。由于大模型生成的内容和训练数据、提示词的质量息息相关,以上典型场景的大模型落地效果也很参差。
率先落地大模型技术的多是技术敏感、数字化基础较完善的企业,其他企业要落地大模型还需要补上这两课。各行业普遍对大模型讨论多、落地少。医药流通行业某头部企业的副总经理告诉我们,在他看来,2024年不是所在行业的大模型落地元年:人才、认知、技术都不足。
也就是说,目前大模型落地的是那些天然离数字化近的行业,更多传统行业目前仍处于观望状态。这符合新技术推广规律,也给科技公司带来时代命题——如果大模型真是一个能够促进产业革新的大技术,它在更广阔的行业赛道上的落地之路,应该怎么走?
企业落地大模型的步骤一般分为三步:
第一,IT团队梳理市场上开闭源模型的性能特征。不同的模型有明显差异,有的语义理解能力强,但对数据、时间不敏感;有的逻辑推理强,但语言表达不够好;还有的英文场景能力强,中文场景能力弱……
第二,识别各业务线的痛点,即大模型技术和业务需求的交叉结合点。
第三,评估具体大模型的适配场景。
为此,技术团队需要制定技术预算、投入人力资源、协调跨部门合作。但即便如此,大模型落地后的业务并不一定能收获更多商业价值。
多位产业企业的CIO告诉我们,希望模型厂商提供更多大模型落地的标杆案例。但国内头部厂商的主要精力都在突破底层大模型,以实现对海外企业的追赶。它们普遍保持三个月迭代一次底层大模型的节奏。因此,大多数模型厂商和企业沟通时,以推销技术为主,而不是提供行业解决方案。
在武侠世界里,人剑合一是达到武学最高境界的象征,在大模型的浪潮中,大模型融入企业的业务和发展,才有可能发挥出想象中的威力。这意味着企业内的系统、数据要充分和大模型融合。这极其考验企业数字化建设和工程化开发的能力,底子不够的企业甚至拿不起这个新兵器。
具体来说,企业的核心业务要落地大模型有两个前提条件。一是企业建设了数字化系统,且多个系统间能打通实现互操作性。二是企业实现对内部数据的整合与治理。
前者考验企业过往的数字化建设水平,只有打通了OA(办公自动化系统)、ERP(企业资源计划系统)、MES(制造执行系统)、CRM(客户关系管理系统)等内部管理工具和生产力工具的企业才能为大模型落地提供便捷。
后者需要企业挖掘散落在各处的海量的Excel、CSV、XML等格式的结构化数据和音频、视频、图片等非结构化数据,并完成对数据的清洗、预处理、打标、向量化处理等工作。这才能让大模型理解并使用企业的数据。
一直以来,产业企业中的IT部门主要承担采购的角色,为业务场景筛选、采购合适的技术解决方案,而很少承担具体的开发工作。IT部门可以花高价采购外部服务完成企业数字化系统建设,但是大模型对企业还提出了新要求——如何将企业原来的数字化基础与大模型结合、如何将专业人士对业务场景的理解转化为知识库和知识治理,这都需要大量的工程工作。
目前,大模型落地快的多是在智能化投入时间长、投入资金大的企业。它们的数字化基础较完善,模型厂商也愿意为这些少数头部企业提供贴身驻场的定制化服务。
然而,千行百业更多的是规模不那么巨大、年投入数字化资金有限的企业。它们的数字化建设和工程化开发能力落后,要用好大模型更需要贴身的工程化定制服务。大模型厂商却因为要控制成本、精力有限等原因无法顾及这部分需求。
某消费领域头部企业的数字化负责人告诉我们,美国有很多软件企业在探索大模型场景落地的工程化服务业务,但国内这个生态还有缺陷。已有的服务商集中在大模型私有化部署领域,而对大模型API调用的深度使用关注不足。同时无论哪种落地方式,将大模型与企业价值场景结合的工程化解决方案都不成熟。
目前各大厂商商业化的主力都是通用大模型。它的知识面广但深度不够,在产业中的实用性不足。与之相对,行业和场景模型是专才,深钻具体场景需求,可以提供更多业务价值。
一方面,建筑、化工、医疗健康等具有高专业壁垒的行业尤其需要行业模型。以建筑业为例,建筑项目通常规模庞大,涉及设计、施工、管理等多个阶段,需要处理大量数据和信息。但建筑行业有独特的专业知识和规范标准,相关数据和信息的处理需要模型能够理解和应用专业知识,通用大模型通常难以应对建筑专业项目的需求。
去年下半年以来,多家厂商都推出了行业大模型。但产业界的共识是,这些行业大模型的能力极其有限。
多位产业企业CIO认为,让模型厂商提供行业模型本身就存在悖论。模型厂商训练大模型的数据一般来自互联网公开数据、采购的外部数据和企业自有数据。这些数据以通用为主,难以涵盖具体行业。行业数据主要掌握在行业的头部企业手中。但多数行业企业没有模型厂商的研发实力,也难以脱离主营业务开发行业大模型。
对此,模型厂商的主流做法是和行业头部企业共创开发行业大模型。但模型厂商不能将企业的数据纳为己有,这就无法解决行业数据来源的问题。
一种观点认为,行业头部企业部署私有化大模型后,可以将相关经验输出为行业解决方案。另一种观点认为,细分领域的科技公司也有机会成为行业大模型的推动者。不过多位消费、供应链、餐饮行业头部企业的数字化负责人表示,目前没有在业内看到完善的私有化模型。
缺少行业模型的后果是,大模型的准确率不足,和行业核心业务适配度低。一位给国内头部厂商做模型私有化部署的代理企业负责人告诉我们,截至目前,他给4-5家能源、金融、电信行业的企业推销过大模型,一开始这些企业都有兴趣,其中两家还进入了POC(Proof of Concepts的缩写,意为“概念验证”。它是一种解决方案,用于验证某个概念的有效性和适用性)阶段,但最后一家都没有买单。
核心原因是大模型准确率不足,最高只能达到70%左右。企业级应用对大模型的准确率要求越高越好,准确率达95%是一个门槛。目前国内主要模型厂商的解决方式是通过提高底层模型能力,提高大模型应用的准确率。
另一方面,具体场景模型的缺位,同样阻碍了大模型的落地。肆拾玖坊正在探索将图片模型落地酒品包装设计。他们尝试了多个开闭源的生图模型,没有发现可以直接应用的产品。
张鹏解释,包装设计和其他平面设计不同,印刷要求分辨率10M以上的图片;公司产品的核心受众是国内中年男性,包装设计要符合他们的审美;包装设计还要涵盖商标文字信息。
而现在市场上文生图模型生成的图片精度不达印刷要求;图片风格以二次元为主,即便微调模型后,也难以生成令人满意的符合酱酒设计的中式和新中式风格;能在图片上准确生成文字的模型也有限。
理论上,服务商对图片模型进行再训练和工程化开发,就能打造一款包装设计的大模型应用。但张鹏接触的几个服务商都对此表示兴趣不大。因为这意味着数十万元的研发投入和更长的商业转化周期。
多数服务商只希望卖通用大模型技术,并捆绑销售算力、云等现成的配套设施。品牌方没有训练模型解决行业问题的能力。这就造成了大量需求服务的空缺。
一个事实是,目前能够落地大模型技术的企业是少数。多数企业因为数字化基础薄弱,缺乏对大模型技术的人才和认知积累。
某全球某顶级饮料国内代理商的数字化负责人告诉我们,他所在的公司从今年1月就开始通过各种渠道发出招聘信息,希望找到一位有咨询背景的大模型技术人才推动技术落地。到了5月下旬,这个人依然没有找到,其所在部门提供的技术方案还是传统的决策式AI。
传统企业如果无法从内部培养或从外部引入AI人才,就难以跨越对新技术的认知鸿沟。
对产业企业来说,从外部引入大模型人才难度很大,因为它要和科技企业竞争。2023年11月脉脉高聘人才智库发布的《2023人工智能人才洞察》显示,互联网、新生活服务、游戏等企业对AI人才的需求最大。2023年前八个月人工智能新发岗位开出的平均薪资为46518元,较2022年提升6.16%。
其中,数据挖掘、算法研究员、算法工程师平均月薪超过5.1万元,年薪(不包括年终奖)超过61万元。与之相对,2023年国家统计局公布面向社会生产和生活服务的IT岗位(城镇私营单位信息传输、软件和信息技术服务业)平均年薪仅为15.6万元。
AI人才可以带来技术认知和储备。有意愿招聘AI人才和已经有AI人才储备的企业,更容易落地大模型。由于AI人才的投入不菲,企业决策者对引入AI人才和落地大模型的态度将起到关键作用。
杨炫之指出,那些在过去曾从数字化建设中获益的决策者,更愿意投资新技术。否则,即便有专业的技术人员告诉他们大模型的价值,决策者也难以理解和相信。“只有见过、用过、感受过技术好处的人,才能在新技术出现时愿意投入。”
国际管理咨询和信息技术服务公司埃森哲发布的《2023中国企业数字化转型指数》显示,受宏观环境影响,中国企业聚焦运营和成本优化,创新力度明显减弱,2023年业务创新活跃的企业占比降至9%,较2022年下降约一半。过去六年,参与数字化业务创新的被调企业占总数的峰值为17%。
点评
多数中国企业都是山寨的,根本就没有数据积累。
他拿什么数据就给大模型训练,而且多数企业也根本没有专业人才,他自己都不懂,他怎么去判断大模型说的对不对。
而未来多数民企都会嗝屁,多数国企也没什么效益。
所以国产大模型的未来也很惨淡,国人不厉害,怎么可能国产大模型厉害。
目前来看,微软的copilot落地最好,很多企业就付费开始用了。
现在的东家也购买这个服务,平时工作的时候也在用。
大模型的“通识”水平还是很高的,作为助手使用很适合,可以可以裁减相关人员比如
10-30%,这些人肯定是办公室的白领,蓝领一个也少不了,需要减少蓝领需要成熟的
人形机器人再加大模型,这条路还很远。但是专业知识明显不足,主要还是
没有相关行业内的知识训练,而这些知识训练成本应该不便宜。举个例子,石油化工行业
先不说各个企业内部的数据(文本,图表等)就是行业内的标准系列API, NOSORK,ASTM,
DNV, ISO等就有海量的数据,首先得购买这些标准,其次要人家同意去作为数据集去训练,
训练的过程中还是行业的各个职位的专家都修调模型,这些都是需要巨大的成本。
不训练这些,大模型就像大学本科毕业学生,对某个行业的知之甚少。
页:
[1]