机械荟萃山庄

 找回密码
 立即注册

QQ登录

只需一步,快速开始

搜索
热搜: 活动 交友 discuz
查看: 150|回复: 1

Deepseek大模型 国家队还是别扔银子了

[复制链接]

2万

主题

2万

帖子

18万

积分

超级版主

Rank: 8Rank: 8

积分
181909
发表于 6 天前 | 显示全部楼层 |阅读模式
一个多月了,Deepseek的热度仍然很高。热搜上经常有央企、国企、大学、事业单位部署deepseek的新闻,让很多人上头,赢赢赢,又赢了。
如果懂AI技术的话,稍微一分析,就知道它们亏麻了。
大模型推理看起来很简单,deepseek把模型权重和技术细节、代码全部开源了,下载下来,买几台GPU服务部署一下就行了,立刻达到deepseek的技术水平。成功地运营deepseek服务,需要GPU服务器、模型权重、运维人员、知识库、搜索引擎、变现模式,缺一不可。国家队都有困难。
GPU服务器最容易理解,向英伟达定货就行了,至于能不能拿到货,就看人脉咋样,出得起多少钱。Deepseek R1满血版的参数是671B,权重文件是8位精度版,大小710GB。加载到内存里转为16位精度,推理质量最好,需要GPU显存1420GB。每块GPU的显存为80GB,部署一套deepSeek R1至少需要18块GPU。R1版是为大学生数学竞赛级别难度的问题准备,推理慢,成本高。V3版适合简单问题,大小跟R1版相同。
两个模型各部署一套,需要36块GPU,每个NVIDIA H100 80GB GPU价格按25000美元计算,共计90万美元,约合653万元人民币。算上其它的硬件,成本算700万元可以吧。
有人会说,部署量化版模型不行吗?精度减少到原来的四分之一,成本也降到四分之一。或者部署70B参数的蒸馏模型,甚至最小的1.5B参数模型。打这么多折扣,回答的质量会大幅下降,deepseek r1会沦为平庸的模型,有没有就所无谓了。

模型权重很容易获得,有手就能下载,0成本。但要注意,AI大模型是当前科技领域竞争最激烈的赛道,没有之一。每天都有新的技术进展,即使24小时学习,也永远看不完。Deepseek R1只是短暂地领先了一个来月,不少指标已经被马斯克的grok3和阿里的QwQ-32B超过去了。
像OpenAI和谷歌这样的大公司的模型都闭源,不给你下载。像阿里的通义千问,也是部分开源,落后的开源,先进的留着自用。几个月之后,投入重金部署的deepseek R1,比不过免费产品,有点尴尬。
运维人员贵,起码要年薪百万吧。国家队、体制内,能开出这么高的薪水吗?

知识库必不可少,光秃秃模型中包含的专业知识有限,必须搭配垂直领域知识库,例如电视剧的剧情、明星的历任女朋友、唐诗全集。互联网公司每天都会生产大量垂直数据,建知识库简单。但高校这样的单位,垂直数据很少,很难建起来大型知识库。自有数据少,那只好买搜索引擎的接口了。
按照bing搜索接口的价格,每搜索1千次价格18美元,约130.1184元,每次搜索0.13元。假设大模型每天的访问人次是100万,那么搜索成本是每天13万元,一年4745万元。假设deepseek大模型响应每次提问的平均计算时间是3秒(深度思考其实要长得多),那么需要部署35套模型(1000000*3/24/3600),对应的硬件成本是1.225亿元。搜索成本加上硬件成本,一年1.6995亿元。
如果只部署1套deepseek R1和1套deepseek v3,那么每天能支持2.88万次提问(3600*24/3),每天搜索成本3744元。这么少的提问量,直接用免费的deepseek不好吗?

最后一个是变现模式,最难。如果下定决心要做大做强,投入1.7亿运营大模型服务,那么就得考虑赚钱,起码要回收成本。这个时候,国家队面对就是deepseek、豆包背后的字节跳动、通义千问背后的阿里、元宝背后的腾讯,竞争得过吗?亏掉的钱怎么办?亏就亏了?
2007年5月,中国移动推出飞信,投入巨大,发短信免费,占尽先机。2011年1月21日,微信才上线。现在飞信已经下线3年了,仅公开的投资就有30亿元,全打水漂。2010年6月,人民日报旗下的国家队“人民搜索”上线,邓亚萍挂帅。2013年11月1日,钱花完了,人民搜索下线。
N多事例证明,在互联网行业,在科技行业,在公平竞争的行业,在不需要行政垄断的行业,国家队不行。弄个小的蒸馏模型,蹭点热度,刷点业绩挣点奖金,完全理解,支持。但脑子一热上满血版,真心不建议,不折腾就是省钱啊,为全国的打工人省钱。做点好事,别玩了。







回复

使用道具 举报

300

主题

6829

帖子

3万

积分

论坛元老

Rank: 8Rank: 8

积分
36942
发表于 6 天前 | 显示全部楼层
IT 行业真的日新月异,吃别人嚼碎吐出来,只能说能尝个味,不一定
学到精髓。
半路追,即使资金充足,正常情况也是追不上的,除非有绝世基尼才行。
国企,央企,研究院能容得下绝世基尼,即使有也被排挤到寺庙里了。
他们投资这个是举大旗,找个正当理由,瓜分钱财,仅此而已。
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

QQ|小黑屋|手机版|Archiver|机械荟萃山庄 ( 辽ICP备16011317号-1 )

GMT+8, 2025-3-26 01:39 , Processed in 0.085020 second(s), 20 queries , Gzip On.

Powered by Discuz! X3.4 Licensed

Copyright © 2001-2021, Tencent Cloud.

快速回复 返回顶部 返回列表