美国海军下令禁止部队使用DeepSeek

寂静回声 · 发表于 2025-1-29 11:19:51

本帖最后由寂静回声于 2025-1-29 15:42 编辑

CNBC获悉，美国海军部近日已指示其部队避免使用中国开发的名为DeepSeek的人工智能技术。
美国海军部1月24日通过电子邮件向部队发出警告，“鉴于与模型来源和使用相关的潜在安全和道德问题”，不得“以任何形式”使用DeepSeek人工智能。
邮件写道，“我们希望大家关注一种名为DeepSeek的新人工智能模型的重要更新……不得将DeepSeek的人工智能用于任何与工作相关的任务或个人用途”，这是“当务之急”（imperative）。
邮件说，收件人“不得以任何形式下载、安装或使用DeepSeek模型”。
海军部发言人证实了该电子邮件的真实性，并表示该电子邮件与海军部首席信息官制定的生成人工智能政策有关。
海军部的警告是在DeepSeek发布其新的推理人工智能模型R1后发布的。
这封电子邮件于周五上午发送至OpNav（海军作战）的分发名单，表明这是一份全员备忘录，获得了海军航空作战中心网络人事经理（Naval Air Warcraft Center Division Cyber Workforce Manager）的首肯。
周二，白宫新闻发言人Karoline Leavitt表示，美国官员正在审查中国人工智能应用DeepSeek对国家安全的影响。Leavitt周二在其作为白宫新闻发言人的首次简报会上说，国家安全委员会正在审查DeepSeek应用的影响，“这是对美国人工智能行业的警钟”。
她补充说，周二早些时候曾亲自与国家安全委员会讨论此事，白宫正在努力“确保美国人工智能的主导地位”。
众议院对中特别委员会周一还呼吁加强对DeepSeek人工智能基础设施所依赖技术的出口管制。该委员会表示，“美国不能允许像DeepSeek这样的中共模式危及我们的国家安全，并利用我们的技术来推进其人工智能野心。”
战略与国际研究中心智库主任、前五角大楼人工智能战略主管Gregory Allen表示，美国不应该抛弃旨在减缓中人工智能产业发展的既定措施。
Allen认为，中国政府希望DeepSeek在川普执政第一周引起关注，作为一种象征性声明。他指出，DeepSeek的突然受关注，与华为在2023年时任商务部长吉娜‧雷蒙多访问中国同一周，发布一款新型高性能智能手机的情况相似。
Allen说：“如果得出结论认为这意味着出口管制现在无法像当时一样发挥作用，那将是一个巨大错误，但这正是中国的目标。”

普渡大学克拉奇技术外交研究所（Krach Institute for Tech Diplomacy）首席执行官Michelle Giuda告诉彭博电视台，美国必须通过加强出口管制，来保持“真正强大的防御”。她补充道，与此同时，如果美国想在科技竞赛中保持领先，就需要在培养优秀工程师方面赶上中国。
“我们应该做的就是加倍努力，让美国在人工智能创新方面行动得更快、更聪明、成本更低。”她说道。

前OpenAI研究主管Miles Brundage在接受自媒体ChinaTalk时说，他担心有人会将DeepSeek此事作为反对出口管制的最终叙事论点。
“虽然我不认为这个论点成立，但我理解为什么人们可能会看到它并得出结论，认为出口管制适得其反。”他说，“出口管制是有效的——你不能否认这种情况正在发生，而且由于出口管制，这种情况更有可能发生。”

美国媒体“连线杂志”（WIRED）一篇分析指出，DeepSeek正将大量美国用户资料直接传回中国，可能比TikTok近年来传回中国的资料还更多。
加拿大多伦多大学公民实验室资深研究员John Scott-Railton提醒，公众不应等到中国AI技术引发恐慌时才意识到，大部分企业都会自行设定如何使用用户数据的条款。
他强调，“使用这些服务时，实际上是为他们工作，而不是他们为你服务。”
根据DeepSeek的隐私政策，该公司明确表示将收集的用户数据存储在中国的服务器上。这意味着，用户与DeepSeek的对话和提问以及生成的答案都有可能被传送到中国。
DeepSeek的隐私政策列出了三类数据收集内容：用户共享的信息、DeepSeek自动收集的信息、以及从其他来源获取的信息。
用户与DeepSeek共享的数据包括通过应用程序或网站进行的聊天内容、文字或语音输入、提示、上传文件、反馈和聊天记录。
尽管DeepSeek提供了删除聊天记录的选项，专家认为，用户不应向AI聊天机器人透露任何敏感信息或个人数据。

伦敦国王学院AI研究所的研究员Lukasz Olejnik表示，他不会在任何AI聊天机器人中输入个人或私密数据。
研究机构Gartner分析师Bart Willemsen指出，生成式AI模型的构建和运行通常对消费者不透明，用户无法确切知道这些模型如何运作以及使用的数据来源。DeepSeek提供的服务本质上是免费的，但用户通过提供数据、内容等换取服务。
《连线杂志》进一步指出，DeepSeek似乎将数据传送给中国的科技巨头百度和互联网基础设施公司Volces。
此外，当用户使用Google或Apple等账户登录时，DeepSeek还会从这些公司获取信息。广告商也与DeepSeek分享数据。
DeepSeek隐私政策表示有权决定如何使用收集到的用户数据，数据可能被用于维持服务和改进技术。更重要的是，DeepSeek可能利用用户输入的提示来开发新的AI模型。
隐私政策还提到，DeepSeek的数据可能被企业集团访问，必要时将与执法机构和公共当局共享。
报道写到，虽然所有企业都有法律义务，但中国企业更有其特殊任务。中国过去10年间颁布了一系列网络安全和隐私法，目的在允许国家官员向科技公司索取数据。2017年的一项法律便规定，组织和公民应该“配合国家情报工作”。

白宫人工智能和加密特使David Sacks在福克斯新闻受访时，被问及DeepSeek的进展是否涉及知识产权盗窃。
“这是可能的。人工智能中有一种叫做蒸馏（知识蒸馏，Knowledge Distillation）的技术，你会听到很多关于它的信息，它是指一个模型从另一个模型中学习。”Sacks在采访中说。我认为在接下来几个月里，你将会看到我们的领先人工智能公司采取措施，试图防止蒸馏……这肯定会减缓一些模仿模型的速度。”他补充道。知识蒸馏是一种模型压缩和迁移学习的技术，通过将一个大型模型的知识传递给一个小型模型，以提高小型模型的性能。

DeepSeek发表的论文，这个被美国媒体广为引用的550万美元训练成本实际上是DeepSeek-V3，而不是R1，而且即便如此，它也只是V3实际训练成本的一小部分。
首先AI模型的成本是1.6万张显卡，deepSeek只用了2千张，但是他没有把2019年就做的LLM（语言大模型）的成本也加进去。那么要是加上这部分成本，deepSeek实际上使用了1.2万张显卡。另外节省下来的4千张显卡只要靠各种优化。

“上述成本仅包括DeepSeek-V3的正式训练，并不包括与架构、算法或数据方面的先前研究和实验相关的所有其它成本。”论文写道。
DeepSeek发表的原始报告中有详细解释这笔成本的计算。“在预训练阶段，每兆个token上训练DeepSeek-V3仅需要180K H800 GPU小时，也就是说，在我们拥有2048个H800 GPU的丛集上需要3.7天。因此，我们的预训练阶段在不到两个月的时间内完成，耗费2664K GPU小时。加上上下文长度扩充所需的119K GPU小时和后制训练所需的5K GPU小时，DeepSeek-V3的完整训练仅需2.788M GPU小时。假设H800 GPU的租赁价格为每GPU小时2美元，我们的总训练成本仅为557.6万美元。”
伯恩斯坦研究公司美国半导体和半导体资本设备董事总经理、高级分析师Stacy Rasgon在一份报告中更直言，DeepSeek的训练成本的数字具有很大的误导性。
“DeepSeek真的‘以五百多万美元创立了OpenAI’吗？当然不是。”他质疑到。
他解释说，DeepSeek-V3是一个“混合专家”模型，“透过一系列优化和巧妙的技术，可以提供与其他大型基础模型相似或更好的性能，但只需要一小部分计算资源来训练”。
拉斯贡表示，这种类型的模型旨在“显着降低训练和运行成本，因为在任意时刻，只有一部分参数集处于活动状态”。
值得注意的是，DeepSeek没有公布其R1模型的成本。如果说DeepSeek R1比肩OpenAI o1，R1的成本数据更关键。
“DeepSeek的R1论文没有量化开发R1模型所需的额外资源”，拉斯贡写道，“大概这些资源（耗费）也相当可观。”
全球咨询公司DGA Group的合伙人Paul Triolo在Substack上撰文说，“OpenAI的o1的训练成本肯定远超过GPT-4，同样，（DeepSeek）R1的训练成本也肯定高于V3。从o3到o4/o5或从R1到R2/R3，训练计算只会增加。”
美国资本公司Archerman Capital也质疑了550万美元的成本宣传。他们的报告指出，有人称，DeepSeek的训练成本是550万美元，是Meta的十分之一，OpenAI的廿分之一，好像比后两者厉害10倍、20倍。但是，Meta和OpenAI花的钱多是因为前沿探路，探路就意味着就会有浪费，而后发追赶是站在别人的肩膀上，当然可以避开很多浪费。
“打个不恰当的比方，创新药的研发需要十年几十亿美元，而仿制药的研发一定会更快更省，另外成本的统计口径也没有统一的标准，可以有很大的差别。”报告写道。

DeepSeek的“官方交流98群”公告上说，“暂不对外进行项目合作，不提供私有化部署及相关支持服务；DeepSeek将集中研发精力奉上更强的模型，尽情（敬请）期待！”

周二，意大利数据保护机构表示，正在寻求DeepSeek就其个人数据使用情况做出解释。
意大利监管机构（也称为Garante）表示，想知道DeepSeek应用收集了哪些个人数据、从哪些来源收集、出于什么目的、基于什么法律依据以及是否存储在中国。
Garante在一份声明中表示，DeepSeek及其附属公司有20天时间给出解释，这是针对这家中国初创公司的首批监管举措之一。
意大利Garante是欧洲最活跃的AI使用监管机构之一。

新加坡国立大学李光耀管理学院的资深研究员AlexCapri指出，DeepSeek的成就显示中国公司在创新和寻找方法方面，巧妙地规避了华盛顿施加的出口管制及技术转移的层层限制。“这是一种不对称的权力结果。自由可得的传统技术被巧妙改装，转变为一种增效器。但外界仍需观察DeepSeek最初囤积的英伟达高端AI 芯片是否在这一过程中扮演了更重要的角色，或是否还有其他外国技术元素对 DeepSeek的发展提供了关键协助。”
分析美中AI科技战的发展，位于华府的智库保卫民主基金会（FDD）中国资深研究员Craig Singleton向BBC分析，DeepSeek热潮背后，北京将人工智能视为其在当今创新军备竞赛中争取主导地位的基石，目的不仅是为了在人工智能领域取得优势，更希望利用这一优势，在高超音速、量子计算和自主系统等领域领先一步，重塑全球的权力版图。
Singleton认为在DeepSeek震惊金融市场后，川普政府对中国的AI挑战及管制不会松手，且会越来越积极。
AI研究学者、台湾政治大学学务长蔡炎龙在脸书专号分析指出，如果没有基础的开源模型，如Llama等，就无法开发出DeepSeekR1，而这些基础开源模型的开发也需要花费相当的资金。蔡教授表示：“DeepSeek更像是在进行聪明的微调。”
DeepSeek的母公司幻化魔方是最重视芯片装备的一家公司，过去中国媒体曾报道他们大量添购GPU及英伟达芯片，为自身发展增添动力。因此，DeepSeek的开发背后不可能仅仅花费600万美元的成本。
此外，路透社今日发表的分析报道称，有研究报告中强调，DeepSeekV3模型的总训练成本尚不清楚，但远高于该新创公司所说的用于运算能力的558万美元。美国 Scale AI CEO Alexandr Wang 上周在接受CNBC采访时也指称 DeepSeek应该拥50,000颗英伟达H100芯片用来开发模型，而购买这些芯片需要的资金远远高于558万美元。

台北的半导体评论家许美华在脸书称，说到底，芯片才是关键，因为复杂算力要靠高阶芯片。“芯片规格是先天优势，其他都是后天努力。再好的算法、工程优化，即使在效能上取得一时的领先，比到最后，都抵不过芯片先天算力的限制。”她说，若美国未来真的全面执行拜登下台前颁布的AI芯片三级禁令，全方位的封锁中国取得芯片的管道，未来中国公司在AI技术上突破是很困难的事情。

台湾NGO工作者Manting Huang表示，DeepSeek背后的幻方这家私募基金公司争议非常多，它主要是透过自动化判断去决定投资标的，过去在中国用这个理由去规避官方的审查，它说我这个人工智慧的部分是不面向消费者的，所以不用去遵守国内的人工智慧相关法规，但DeepSeek作为面向消费者的产品，就会受到中国生产AI的规定。
“它等于在开发时的前端规避了审查，但是它的最终端要符合审查，所以目前中国国内，它的对手在骂这件事情，因为他们前端不用审查，所以成本近乎于零，直接去用ChatGPT的模型去做，幻方推出的DeepSeek的价格等于在中国市场直接砍半，所以所有做AI服务的厂商都跳脚(反对）。”
，有购买DeepSeek企业版的人士说，DeepSeek提供的运算能力，跟TripleGPT是可以相比，但仅限于数字和数值，在人文或是图片等美化的能力上面，还没到这么好。它的优势是在于价格便宜，因为现在是开源给大家使用，它只是把过去大家互抄的结果，让大家再来互抄一下吧。人们不清楚它的算力，到底是哪里提供的，这也是很大的问题。

川普告诉参加众议院共和党年度政策务虚会议的议员们，对美国来说，中国人工智能初创公司DeepSeek是一个“警钟”（wake-up call），但可能包含着一种“积极因素”。川普，“一家中国公司发布DeepSeek人工智能，应该给我们的行业敲响了警钟，我们需要专注于竞争取胜。”
他补充道，“当你听到有人发明什么东西时，我们总是（受到启发）有（新）想法，（所以）我们永远是第一，所以，我想说，这是一个积极因素，一件非常积极的事情。”他建议，“与其花费数十亿美元（指拜登《芯片法案》提供的部分资金），不如花更少的钱，希望大家能提出相同的解决方案。”

美国亿万富翁投资者Ray Dalio警告说，投资者对人工智能（AI）的狂热助长了美国股市“泡沫”，类似于2000年互联网泡沫的再现。
Dalio在接受《金融时报》采访时表示：“当前AI股票的定价已达到高位，同时还面临利率风险，这种组合可能会刺破泡沫。”
Dalio是对冲基金桥水联合创始人，也是华尔街最具影响力的人物之一，他的警告正值市场对AI股热潮是否已过头的担忧不断加剧之际。
Dalio在2021年卸任桥水联合主席，但仍担任董事会成员。他长期倡导与中国加强经济联系。对此，他表示：“美中之间的技术竞争远比盈利重要。这不仅涉及经济优势，还关系到军事优势。”
Dalio认为，为了赢得全球AI竞争，国家支持已不可避免，即便会牺牲短期利润。他解释道：“我们的体制总体上正在转向一种更类似于‘工业综合体’的政策模式，这种模式将包含政府主导和政府影响的活动，因为这实在太重要了。”
他补充道：“单靠资本主义或单靠利润驱动，是无法赢得这场战斗的。”

1月28日，社媒上出现一段“涛哥”对DeepSeek的质疑视频。他在视频中说：“你能相信吗，一个在2023年的七月份，刚刚成立的公司，成立了一年多的时间，仅有四个人，他整个公司仅有四个人缴纳社保。但是呢，竟然有媒体、有专业的研究团队出具报告，说他们开发出了全球顶尖的AI大模型。”
他并表示：“你要知道AI的这个模型开发问题，它不光需要人才，它要投入巨大的算力，投入巨大的知识产权的投入，因为这个东西，不是说你拿来用就可以直接用的，你是要有很大的资金投入的。”
“那么一个成立一年多的公司，是怎么可以被一些所谓的业界专家和人士出具报告，说他可以在未来，在不久的未来可以打败英伟达这样的国际性的大公司的？这个‘遥遥领先’的这个东西，到底是怎么出来的？因为时间太短了，而且此前没有任何的铺垫，没有任何的陈述，直接一股脑就把它推到了这个投资平台上面。”
他用一个例子做比喻：“这就像告诉你什么呢，一个刚刚出生的婴儿，还没有学会走路，甚至还不会说话，就有人出具一份报告，说这个婴儿经过检测，他的智力水平、体能状况已经超过了很多成年人。”
他暗示DeepSeek之所以现在出台是因为形势所迫：“这些人是完全等不及了，时间上感觉来不及了，所以要尽快地把它给搞出来。”

无独有偶，在此之前，国内一名AI领域的创业者也发布视频，对DeepSeek的逻辑推理能力表示质疑。
“我作为一个非常普通的用户，用DeepSeek和ChatGPT回答了一道逻辑推理题。结果DeepSeek的回答是错误的，ChatGPT是正确的。
（deepseek要是不使用深度思考模式，还不如通义大模型及类似的国产大模型。而使用了深度思考模式，如果去回答文本提问，也仅仅是与通义大模型持平，并且结果出的慢，因为一番推理也不省时。
那些研读过论文和代码的人说deepSeek将很多必要功能都做了删减。起码在处理长文本上会出问题。
测试方法就是问deepSeek三个问题:
1. HDMI接口规格是4K/30Hz能否用上1080p/144Hz
2. HDMI视频线的接口规格是4K/30Hz，能否用上1080p/144Hz
3. 笔记本电脑的HDMI接口规格是4K/30Hz，能否用在1080p/120Hz的显示器上？
这三个问题每一个都是前面问题的优化，然后deepSeek就开始一口咬定该接口不支持的结论。
这很明显是deepSeek没有完全实现同用户双向对话的结果，这个问题其他大模型都没遇到过。
所以deepSeek用两千张显卡实现v3，在现有的理论框架下的确是有可能的，但是否值得跟随，答案显然是否定的。
必要功能做删减迟早会在长期经营中暴露出来，导致严重的质量问题。即使是现在稳扎稳打去做，基于概率的AI都避免不了错误，一旦连很多基本能力都缺乏，那么我前面那个案例发生在关键时候会带来严重问题。）

针对宣传中的DeepSeek如何“震惊美国科技界”和“遥遥领先”，科技博主“水小木”也觉得不对劲。
“如果你把这几十年遥遥领先的新闻放在一起对比，会发现一个惊人的规律，每当国外出现什么重大的科技变革，我们这边都会立马有公司宣布遥遥领先。然而过了一段时间以后，你又会发现好像一瞬间再也听不到这些消息了。”“水小木”说。
他举例说，“每日经济新闻刚刚做了一个调研，他们发现如果你问DeepSeek你是谁？它会回答我是GPT4。如果你问他自己的编程接口是什么？它甚至会把OpenAI的编程接口使用说明给到你。如果你深入了解的话，就会发现就连笑话的笑点，DeepSeek和GPT4都是一模一样。有国外专家是这么说的，大概率是DeepSeek使用了GPT4蒸馏。
“简单说，如果你是一个学生，老师已经给了你这道题的答案，你只需要让自己的推理过程，等于这个答案就可以，就省了大量的思考和运算，等于省去了大量的时间和成本。这种学习方法不是不行，但是会出现一个问题，导致学生永远不可能超越老师。因为当没有老师给你提供答案时，你就没有办法工作了。”他说。
该博主表示，“现在你知道为什么这几十年来我们有那么多的公司遥遥领先，但到最后都只是昙花一现了吧。因为这么多年来，他们努力的方向都是做蒸馏技术，蒸馏技术是条捷径，但是这条路走得越深，离核心科技其实也就越远。”

点评
的确如此，这种铺天盖地的宣传，已经远远超过了正常的范畴。包括对社保缴费人数的质疑，你看平常质疑某某公司的新闻，报道中也会出现这家公司社保缴费人数非常少，甚至是零的内容。所以同样的逻辑也应该适用于deepseek，要不然不就成了双标了吗。

		自动登录	找回密码
密码			立即注册

美国海军下令禁止部队使用DeepSeek

本帖子中包含更多资源