Deepseek大模型 国家队还是别扔银子了
一个多月了,Deepseek的热度仍然很高。热搜上经常有央企、国企、大学、事业单位部署deepseek的新闻,让很多人上头,赢赢赢,又赢了。如果懂AI技术的话,稍微一分析,就知道它们亏麻了。
大模型推理看起来很简单,deepseek把模型权重和技术细节、代码全部开源了,下载下来,买几台GPU服务部署一下就行了,立刻达到deepseek的技术水平。成功地运营deepseek服务,需要GPU服务器、模型权重、运维人员、知识库、搜索引擎、变现模式,缺一不可。国家队都有困难。
GPU服务器最容易理解,向英伟达定货就行了,至于能不能拿到货,就看人脉咋样,出得起多少钱。Deepseek R1满血版的参数是671B,权重文件是8位精度版,大小710GB。加载到内存里转为16位精度,推理质量最好,需要GPU显存1420GB。每块GPU的显存为80GB,部署一套deepSeek R1至少需要18块GPU。R1版是为大学生数学竞赛级别难度的问题准备,推理慢,成本高。V3版适合简单问题,大小跟R1版相同。
两个模型各部署一套,需要36块GPU,每个NVIDIA H100 80GB GPU价格按25000美元计算,共计90万美元,约合653万元人民币。算上其它的硬件,成本算700万元可以吧。
有人会说,部署量化版模型不行吗?精度减少到原来的四分之一,成本也降到四分之一。或者部署70B参数的蒸馏模型,甚至最小的1.5B参数模型。打这么多折扣,回答的质量会大幅下降,deepseek r1会沦为平庸的模型,有没有就所无谓了。
模型权重很容易获得,有手就能下载,0成本。但要注意,AI大模型是当前科技领域竞争最激烈的赛道,没有之一。每天都有新的技术进展,即使24小时学习,也永远看不完。Deepseek R1只是短暂地领先了一个来月,不少指标已经被马斯克的grok3和阿里的QwQ-32B超过去了。
像OpenAI和谷歌这样的大公司的模型都闭源,不给你下载。像阿里的通义千问,也是部分开源,落后的开源,先进的留着自用。几个月之后,投入重金部署的deepseek R1,比不过免费产品,有点尴尬。
运维人员贵,起码要年薪百万吧。国家队、体制内,能开出这么高的薪水吗?
知识库必不可少,光秃秃模型中包含的专业知识有限,必须搭配垂直领域知识库,例如电视剧的剧情、明星的历任女朋友、唐诗全集。互联网公司每天都会生产大量垂直数据,建知识库简单。但高校这样的单位,垂直数据很少,很难建起来大型知识库。自有数据少,那只好买搜索引擎的接口了。
按照bing搜索接口的价格,每搜索1千次价格18美元,约130.1184元,每次搜索0.13元。假设大模型每天的访问人次是100万,那么搜索成本是每天13万元,一年4745万元。假设deepseek大模型响应每次提问的平均计算时间是3秒(深度思考其实要长得多),那么需要部署35套模型(1000000*3/24/3600),对应的硬件成本是1.225亿元。搜索成本加上硬件成本,一年1.6995亿元。
如果只部署1套deepseek R1和1套deepseek v3,那么每天能支持2.88万次提问(3600*24/3),每天搜索成本3744元。这么少的提问量,直接用免费的deepseek不好吗?
最后一个是变现模式,最难。如果下定决心要做大做强,投入1.7亿运营大模型服务,那么就得考虑赚钱,起码要回收成本。这个时候,国家队面对就是deepseek、豆包背后的字节跳动、通义千问背后的阿里、元宝背后的腾讯,竞争得过吗?亏掉的钱怎么办?亏就亏了?
2007年5月,中国移动推出飞信,投入巨大,发短信免费,占尽先机。2011年1月21日,微信才上线。现在飞信已经下线3年了,仅公开的投资就有30亿元,全打水漂。2010年6月,人民日报旗下的国家队“人民搜索”上线,邓亚萍挂帅。2013年11月1日,钱花完了,人民搜索下线。
N多事例证明,在互联网行业,在科技行业,在公平竞争的行业,在不需要行政垄断的行业,国家队不行。弄个小的蒸馏模型,蹭点热度,刷点业绩挣点奖金,完全理解,支持。但脑子一热上满血版,真心不建议,不折腾就是省钱啊,为全国的打工人省钱。做点好事,别玩了。
https://s3.bmp.ovh/imgs/2025/03/20/b5e2bb886cbf7f47.jpg
https://s3.bmp.ovh/imgs/2025/03/20/56b36cef40bde852.jpg
https://s3.bmp.ovh/imgs/2025/03/20/1fddb35124532629.jpg
https://s3.bmp.ovh/imgs/2025/03/20/561465a381ff5d63.jpg
https://s3.bmp.ovh/imgs/2025/03/20/faf0a82c096b3292.jpg
IT 行业真的日新月异,吃别人嚼碎吐出来,只能说能尝个味,不一定
学到精髓。
半路追,即使资金充足,正常情况也是追不上的,除非有绝世基尼才行。
国企,央企,研究院能容得下绝世基尼,即使有也被排挤到寺庙里了。
他们投资这个是举大旗,找个正当理由,瓜分钱财,仅此而已。
页:
[1]