首页 > 资讯详情

冷眼看热点系列---DEEPseek

发布时间:2024-12-27 09:10:02 浏览:4831
独立观察 中立评论

              

       这个春节,美国很生气,英伟达更生气,你看那股票!      
       国人很高兴,你看突然就超车了,会不会像新能源汽车一样玩到超车呢?    
       但是,英伟达的股票已经又抬升了,美国的新一轮AI已经在路上了。    
       国人当自强,路漫漫,上下求索是王道。    

   
   下面作者通过收集整理,从DEEPSEEK为什么强大、功能及优劣势等方面跟您交流一下。

 上、强大 ,是有理由的。    

         deepseek R1 为什么那么强,简单的说就是通过大量的自举 + 对弈的方式,在微调阶段堆了比之前传统方法高出 2 个数量级的算力,大幅改造了微调环节,最终提升了性能。所以这个方法也一样可以用在当前已经训练完成的其他模型上。在大语言模型性能 scaling law 上,预训练阶段很快摸到了天花  板,推理侧相信也会在一两年内摸到天花板,而微调环节现在也找到一个可以堆算力的技巧,于是今后算力卡的销路,模块化小型核电站的销路会更好,AI 对能源的需求更大,可劲儿往里砸钱,拼这第三次机会。这次 R1 的改进可以和 OpenAI 在推理侧推出思维链技术的意义相媲美,并且可能更大一些,因为这次 R1 的开源采用 MIT 协议,在所有开源协议中是最宽泛的一种,只要声明版权,之后无论是科研还是商用,都不要求后续改进者继续开源,也没有什么场景限制。而 OpenAI 那次推理侧的思维链技术根本没有开源。
     如果您还是不明白,下面我说的更简单点--便宜好用。DeepSeek是以极低的成本,实现顶级的性能。DeepSeek很可能掌握了利用更高效内存和学习策略,来降低模型训练成本的方法,它的模型生成信息的成本仅为OpenAI的ChatGPT模型的十分之一。

     AI领域的开源模型更新迭代层出不穷,那为什么这次DeepSeek的更新能引发如此广泛的关注呢?原因主要有两个。


第一个是性能。在多个基准测试中,V3的能力超过了许多开源对手,例如Meta公司的Llama-3.1模型和阿里巴巴的Qwen2.5模型。跟不了解这块的同学解释一下,Meta就是之前的Facebook,而Llama模型则是AI开源模型中一直处于顶尖水平的产品。在DeepSeek官网上,他们不仅展示了与其他开源模型的对比数据,还在多个任务中与OpenAI和Claude这类闭源模型进行了能力对比。一般情况下,顶级闭源模型的能力通常优于开源模型,但DeepSeek在代码生成、数学运算等方向表现出了非凡的实力。

第二个是在有限资源下的成本控制。这也是让其他同行视其为研究对象的核心原因。

我用几个数字来说明,你就能理解为什么其他企业对此感到震惊了:
     DeepSeek的V3模型只用了2048张英伟达H800显卡,两个月时间,便训练出了一个拥有6710亿参数的超大规模模型,训练成本约为550万美元。

    数据对比后,DeepSeek的厉害之处更为明显。如果是其他硅谷公司来完成同等能力的模型,通常会选择最高端的英伟达显卡,而不是价格较低的H800显卡。此外,他们至少需要1.6万块高端显卡才能达到类似水平,远无法像DeepSeek这样仅用2000块H800显卡完成任务。

    从算力上看,V3的训练耗费仅为同等规模硅谷公司模型的十一分之一。而在成本上,Meta的同等能力模型训练花费高达数亿美元,完全无法与DeepSeek的性价比相提并论。



 中、DEEPSEEK自己介绍自己

深度求索(DeepSeek)是一家专注于人工智能技术研发的公司,其智能助手DEEPsEEL是公司核心产品之一。以下是对DeepSeek发展历程及其产品优劣势的介绍:

发展历程:

  1. 1、成立初期:
    DeepSeek公司成立之初,聚焦于人工智能基础技术的研究,包括机器学习、自然语言处理等领域。

  2. 2、技术积累:
    通过不断的技术积累和创新,DeepSeek逐步构建起自己的技术体系,并在多个AI技术竞赛中取得优异成绩。

  3. 3、产品推出:
    随着技术的成熟,DeepSeek推出了智能助手DEEPsEEL,旨在为用户提供智能化的信息检索和交互体验。

  4. 4、市场拓展:
    DEEPsEEL逐渐进入市场,服务于教育、金融、医疗等多个行业,不断扩展其应用场景和用户基础。

  5. 5、持续迭代:
    DeepSeek持续对DEEPsEEL进行迭代升级,引入更多先进算法和功能,以适应用户需求的不断变化。

优势:

  1. 1、先进的技术:
    DeepSeek在人工智能领域拥有深厚的技术积累,DEEPsEEL集成了最新的自然语言理解和生成技术。

  2. 2、多样化的服务:
    DEEPsEEL能够提供多种服务,如问答、翻译、数据分析等,满足用户多样化的需求。

  3. 3、用户体验:
    注重用户体验的设计,使得DEEPsEEL在交互上更加人性化,易于用户操作和理解。

  4. 4、行业应用:
    DEEPsEEL能够根据不同行业的特点提供定制化解决方案,具有较强的行业适应性和实用性。


劣势:

  1. 1、市场竞争:
    人工智能助手市场竞争激烈,DEEPsEEL面临着来自其他成熟产品的竞争压力。

  2. 2、技术挑战:
    尽管技术先进,但在处理复杂、模糊或专业性强的问题时,DEEPsEEL可能仍需进一步提升准确性和深度。

  3. 3、数据隐私:
    随着用户对数据隐私的关注增加,DEEPsEEL需要不断加强数据保护措施,以赢得用户信任。

  4. 4、持续创新:
    人工智能技术发展迅速,DeepSeek需要持续投入研发,以保持DEEPsEEL的技术领先性和市场竞争力。

   总体而言,DeepSeek及其产品DEEPsEEL在人工智能领域具有一定的技术优势和市场潜力,但同时也面临着市场竞争和技术创新的挑战。


下、地缘政治下的deepseek

      地缘政治是指地理因素对国家政治、国际关系以及全球战略格局的影响。在这样一个复杂多变的国际环境中,像深度求索(DeepSeek)这样的科技公司,其运营和发展可能会受到多方面的影响。
        DeepSeek的出现对地缘政治格局产生了重大影响,加剧了中美在AI领域的博弈。美国会更变本加厉的实行对中国的制裁吗?‌

       DeepSeek作为一款创新的AI产品,通过其独有的深度思考和联网模式,在短时间内迅速走红,并登顶中美App Store。这一技术突破不仅引起了全球AI圈的广泛关注,也引发了地缘政治格局的变化。DeepSeek的技术优势,如算法创新、算力与数据潜力的释放,以及强化学习与数据效率的提升,都使其在中美AI博弈中占据了重要地位‌。

      从地缘政治的角度来看,DeepSeek的成功不仅展示了中国在AI领域的快速追赶能力,也对美国在这一领域的领先地位构成了挑战。白宫人工智能与加密货币主管戴维·萨克斯曾表示,美国在人工智能领域仍领先中国3到6个月,但DeepSeek公司的R1模型已接近OpenAI的o1模型水平,追赶速度非常快‌3。这种快速追赶的态势,无疑加剧了中美在AI领域的竞争。

      此外,DeepSeek的商业模式颠覆也对行业生态产生了深远影响。其开源与低价策略吸引了全球开发者共建生态,迫使闭源厂商面临竞争压力。这种商业模式不仅降低了AI技术的门槛,也推动了技术的普惠和普及。然而,这也对依赖高算力硬件和高资本投入的传统AI行业造成了冲击,引发了市场对硬件赛道过度乐观估值的修正‌2。

     从更广泛的地缘政治影响来看,DeepSeek的成功可能改变AI游戏规则,进而影响美国政府的出口管制制度和地缘政治战略。一些美国专家和智库成员认为,如果DeepSeek真的能改变AI游戏规则,那么美国政府重新制定复杂而详细的出口管制制度的努力将会很缓慢,而其地缘政治影响将会迅速显现‌


以下是在地缘政治背景下,DeepSeek可能面临的几个关键方面:

  1. 1、国际合作与竞争:
    DeepSeek作为一家科技公司,可能需要与国际伙伴合作,共同开发技术或进入新市场。地缘政治的变化可能会影响这些合作关系,例如贸易壁垒、技术转让限制等。

  2. 2、数据安全与隐私:
    在全球范围内,数据安全和隐私保护越来越受到重视。DeepSeek在处理跨国数据时,需要遵守不同国家的法律法规,如欧盟的通用数据保护条例(GDPR)等。

  3. 3、市场准入:
    地缘政治紧张可能导致某些国家对特定国家的企业实施市场准入限制。DeepSeek在拓展国际市场时,需要考虑这些潜在的政治风险。

  4. 4、供应链安全:
    科技公司的产品往往依赖于全球供应链。地缘政治冲突可能会影响供应链的稳定性,DeepSeek需要评估和应对可能的供应链中断风险。

  5. 5、技术标准与规范:
    不同国家可能会制定不同的技术标准和规范,DeepSeek在开发产品时需要考虑到这些差异,以确保产品符合目标市场的要求。

  6. 6、知识产权保护:
    在地缘政治紧张的情况下,知识产权保护可能会变得更加复杂。DeepSeek需要确保其技术和创新得到适当的法律保护。

  7. 7、政治风险与合规:
    DeepSeek在进行国际业务时,需要关注政治风险,包括制裁、出口管制等,并确保其业务活动符合所有相关的法律法规。

  8. 8、人才培养与流动:
    科技公司依赖于高素质的人才。地缘政治的变化可能会影响国际人才的流动,DeepSeek需要考虑如何吸引和保留全球人才。

      最后,概括一下,DEEP对中外AI发展的影响,其实--比较有限的。

  9. DeepSeek当然是重要的局部突破,
    但整体上中国AI领域尤其AI大模型领域与美国还是有着一定差距的。

  10. 首先,
           DeepSeek-R1代表大模型的“深度思考”能力,是通用大模型的一部分能力,因此其水平接近美国市场的头部同类模型,且是更早(4个月前)发布的模型,是一种局部突破,而非整体突破。

  11. 其次,
          尽管DeepSeek通用大模型V3也广受好评,但其受好评的前提是其具有极致的性价比,“性能接近”美国头部产品,且价格更低(是对方的百分之几)。显然,这不代表V3真的与ChatGPT在技术上没有差距。

  12. 再次,
          中国AI行业与美国行业在算法、算力和数据上的差距依然没有实质性改变。

  13.      算法方面,美国是AI大模型的原创研发国,技术路线和发展方向目前均主要由美国引领。算力方面,美国目前具有绝对优势,且随着美国对英伟达GPU芯片的出口限制日益严格,中国受限会愈加严重,而国内自主研发虽有重大进展,但尚需追赶和突破时间。数据方面,中文数据存在数量少且“互联  网孤岛”加剧之势。

  14. 最后,
         从市场表现看中美差距依然较大。与美国相比,我国AI企业数量较多,但核心产业规模明显偏小。并且,我国AI企业估值与美国AI企业估值有拉大之势,OpenAI市场估值超过1万亿元人民币,马斯克主导的xAI估值已达400亿美元,而我国“六小虎”估值普遍为100亿至数百亿人民币,互联网大厂则普遍没有因为发展AI大模型得到较多的AI赋分。