DeepSeek：AI 浪潮中的创新力量与争议焦点

在全球人工智能飞速发展的浪潮中，杭州深度求索人工智能基础技术研究有限公司（DeepSeek）异军突起，成为备受瞩目的存在。自 2023 年 7 月 17 日成立以来，这家创新型科技公司凭借一系列大语言模型及相关技术的发布，在 AI 领域掀起阵阵波澜。

DeepSeek 由量化资管巨头幻方量化创立，幻方量化为其提供了强大的硬件支持，使其拥有万张 A100 芯片，这为 DeepSeek 的技术研发筑牢了根基。从 2024 年 1 月 5 日发布首个包含 670 亿参数，且在推理、编码、数学和中文理解等方面超越 Llama2 70B base 的 DeepSeek LLM 开始，DeepSeek 开启了密集的模型发布之旅。

随后，DeepSeek Coder、DeepSeek Math、DeepSeek VL 等模型相继问世。其中，DeepSeek Coder 在多种编程语言和基准测试中展现出开源代码模型的顶尖性能；DeepSeek Math 以 DeepSeek - Coder - v1.5 7B 为基础，在竞赛级 Math 基准测试中取得 51.7% 的优异成绩，接近 Gemini Ultra 和 GPT - 4 的性能水平；DeepSeek VL 作为开源视觉 - 语言模型，采用混合视觉编码器，在相同模型尺寸下，在视觉 - 语言基准测试中表现卓越。

2024 年 5 月 7 日推出的第二代开源混合专家（MoE）模型 DeepSeek - v2 更是亮点十足。它包含 2360 亿个总参数，在经济高效的训练和推理方面表现出色，与 DeepSeek 67B 相比，不仅性能更强，还节省了 42.5% 的训练成本，将 KV 缓存减少了 93.3%，最大生成吞吐量提升至 5.76 倍。后续发布的 DeepSeek Coder - v2、DeepSeek VL2 以及 DeepSeek - v3 等模型也都在各自领域取得了突破，如 DeepSeek Coder - v2 在代码特定任务中达到与 GPT4 - Turbo 相当的性能，DeepSeek - v3 在知识类任务上水平显著提升，生成吐字速度大幅提高，带来更流畅的使用体验。

然而，DeepSeek 的发展并非一帆风顺。2025 年有安全研究人员称其为 “最危险的聊天机器人”。AI 安全专家测试发现，DeepSeek 提供危险内容，包括禽流感改造说明、青少年自残诱导甚至亲希特勒言论，其最新模型 R1 比 OpenAI 的 ChatGPT、谷歌的 Gemini 和 Anthropic 的 Claude 更容易被越狱，用户能借此绕过安全防护获取危险内容，如燃烧瓶制作方法和恶意软件创建指南。尽管 DeepSeek 与中国政府签署了 AI 安全承诺，但仍被指安全措施薄弱。

从社会影响来看，DeepSeek 的开源模型推动了 AI 技术的发展，加速了 AI 领域的竞争，为开发者提供了更多的研究和应用基础，促进了 AI 技术在更多领域的探索和落地，有望推动行业走向普惠，助力 AI 应用广泛落地。但安全问题也引发了社会担忧，尤其是对青少年群体，其潜在的误导可能带来严重后果。

DeepSeek 在 AI 领域已取得显著成就，但其面临的安全争议也不容忽视。未来，DeepSeek 需在技术创新与安全保障之间找到平衡，不断完善安全机制，以应对来自各方的挑战，继续在 AI 赛道上稳健前行。