近日,我在东方日报和AiFM合作的直播采访中,与听众们探讨了 DeepSeek 及其对人工智能行业的深远影响。作为一款在 AI 领域引发广泛关注的创新产品,DeepSeek 的出现不仅降低了 AI 的使用门槛,还推动 AI 生态走向更加普及、开放和民主化。那么,DeepSeek 究竟是什么?它如何改变市场格局?它的未来发展趋势如何?本文将深入探讨。
DeepSeek 由梁文峰于 2023 年在中国创立,推出了 DeepSeek V3 和 DeepSeek R1,在中文理解、编程和数学等领域表现尤为突出。其核心优势体现在低成本和高效率方面。相比 OpenAI 等企业,DeepSeek 的训练和推理成本大幅降低,仅为 5.5 百万美元,而行业标准通常高达 1 亿美元,这使得 AI 技术的获取变得更加可行。此外,DeepSeek 应用迅速走红,登上了苹果 App Store 中美市场的榜首,其市场影响力也在快速扩展。与此同时,DeepSeek 模型兼容性强,可以运行在 NVIDIA、微软 Azure、AWS 等主流云平台上,大大增强了其适用性。
在技术方面,DeepSeek 具有开源与创新架构的双重优势。尽管 DeepSeek 不是第一家开源 AI(Meta Llama、Mistral 也属于开源派),但其优化的训练与推理成本,使 AI 进一步普及。它采用了 MOE(混合专家模型)架构,包含 671亿参数的专家网络,但推理时仅调用 37 亿参数,相比传统的密集神经网络(Dense NN),其性能更优,成本更低。此外,它还采用自动强化学习(Automated RL)来取代传统的监督微调(SFT),优化 AI 训练流程,并使用蒸馏模型(Distilled Model),使普通电脑也能运行 AI,无需昂贵的计算资源。
DeepSeek 的崛起,使 AI 价格战进入白热化阶段。OpenAI 近期推出 O3 Mini 免费版,以应对 DeepSeek 竞争。同时,AI 行业也形成了“开源 vs. 封闭”的竞争格局,其中,DeepSeek、Qwen、Meta Llama 代表 AI 开源生态,而 OpenAI、Google Gemini 等公司则坚持封闭模型。这种竞争不仅影响 AI 软件生态,也影响 AI 硬件市场。
随著开源 AI 的普及,未来 GPU 需求结构可能会发生重大变化。此外,在 MMLU 基准测试中,DeepSeek 在数学和编程任务上的表现卓越,尤其在中文处理能力上领先于同类开源模型,填补了市场空白。
然而,AI 发展迅猛,但安全与伦理问题不容忽视。DeepSeek 及其他 AI 产品的普及,使 AI 伦理成为关注重点。马来西亚已推出《人工智能治理与伦理指南》(AIGE),为安全使用 AI 提供参考。该指南强调了包容性、公平性、问责制、安全性、透明度、可靠性和人类福祉等原则。企业要确保负责任的 AI 应用,需要设立 AI 委员会,制定 AI 伦理准则,保护数据隐私,并建立 Prompt Library 以优化 AI 交互。同时,提供 AI 教育,如 MYMahir、Prompt Engineering 课程,提升公众对 AI 的理解,并进行 AI 审计与监控,以确保 AI 遵循道德和法律标准。
AI 的发展经历多个阶段,从最初的图像识别,到如今的生成式 AI(Gen AI),再到未来的代理型 AI(Agentic AI)和物理 AI(Physical AI)。AGI(通用人工智能)的演进路径大致可分为五个层级:最基础的是对话式 AI(Conversational AI),接著是推理型 AI(Reasoner AI),再到自主 AI(Autonomous AI),然后是创新 AI(Innovator AI),最终发展为组织 AI(Organizer AI)。DeepSeek 的愿景是让 AI 成为每个人都能平等使用的工具,不再是少数科技巨头的专利。在这个新时代,我们没有理由不去拥抱 AI。
未来已来,AI 将成为我们的得力助手,而不是竞争对手。让我们拥抱 AI,共创更智能的世界!你怎么看 DeepSeek 和 AI 未来?
要看最快最熱資訊,請來Follow我們 《東方日報》WhatsApp Channel.
