文章内容

山东农业大学 - 《山东农大报》

DeepSeek,激荡AI行业的“一股清流”

2025-02-26     浏览(41)     (0)

中国初创企业深度求索公司自主研发的人工智能大语言模型DeepSeek,凭借“好用、开源、免费”三大特点在全球范围内受到关注。其独特之处在于采用开源策略和人才培养政策,将打破AI技术的垄断格局。同时,低成本实现高性能的训练和构建AI系统的方法,提升了全球公司的市场竞争力。

近期,外媒纷纷将聚光灯投向中国初创企业深度求索公司,其自主研发的人工智能(AI)大语言模型“深度求索”(DeepSeek)凭借“好用、开源、免费”三大特点,在全球范围内引发热烈反响。这一创新成果不仅在中国本土大放异彩,更是在大洋彼岸的美国乃至全球科技界激起了广泛讨论并受到高度评价,被视为挑战现有AI巨头垄断地位的“一股清流”。


低成本兼具高性能


西班牙 《国家报》、澳大利亚《对话》杂志、美国《纽约时报》等多家外媒均关注到,DeepSeek的技术具有强大创新力,是因为它能在降低计算成本的同时实现尖端性能。

AI公司通常使用装有1.6万枚或更多专用芯片的超级计算机来训练聊天机器人,但深度求索公司表示,他们只用了大约2000枚芯片。同时,他们仅花了不到600万美元就训练了新模型,成功在两方面把构建AI的价格“打了下来”。

首先,DeepSeek模型使用数据蒸馏技术生成高质量数据,提升了训练效率;其次,DeepSeek采用了一种称为“混合专家”的方法。当用户提出一个问题时,模型会决定是否激活其医疗专家、翻译、律师或物理学家。传统模型会同时激活所有专家,这会浪费能源和计算能力。而DeepSeek则将这些小型“专家”系统与一个“通才”系统相结合,实现了相同的功能。通才系统对每个主题都有相当的了解,可帮助协调专家之间的互动。


开源策略打破技术垄断


Deepseek的独特之处还在于,其采取了开源策略。这犹如在美国及少数几个长期主导AI技术领域的巨头中投了一枚震撼弹,打破了既有格局。

如今,这项技术已向全世界敞开大门。鉴于DeepSeek模型免费可得,其他公司或将不得不调整价格策略,以保持市场地位。当能够以零成本获得类似技术时,没有人愿意支付额外费用。


得益于人才培养

与政策支持


《自然》杂志报道,2017年,中国政府宣布,计划到2030年将中国打造成为全球AI领域的领头羊。政府要求相关行业在2025年前实现AI领域的重大突破,“使相关技术和应用达到世界领先水平”。

据美国乔治城大学安全与新兴技术中心的一份报告,截至2022年,中国教育部已批准440所大学开设AI专业本科学位。美国智库MacroPolo数据显示,同年,在全球顶尖AI研究人员中,华人几乎占据了“半壁江山”,而美国人仅占18%。

来源:科技日报