支持的 AI 平台及其意义¶

DeepExtension 致力于弥合企业用户与大语言模型（LLM）训练复杂性之间的鸿沟。实现这一使命的关键之一是支持在多种硬件和操作系统上兼顾性能、易用性与开发者友好度的 AI 平台。

本页面将介绍当前支持的平台、背后的技术选择逻辑，以及这些平台如何影响 DeepExtension 的用户体验。

为什么平台选择至关重要？¶

AI 平台的选择直接影响：

对于非 AI 专业人员或资源有限的团队，复杂的配置过程可能成为门槛。
DeepExtension 的目标是降低使用门槛，同时不牺牲性能，因此平台支持是一个战略性决策。

从 DeepExtension 的早期阶段开始，我们便采用 CUDA 作为主要的训练与推理后端。CUDA 支持的 NVIDIA GPU 仍是以下场景的事实标准：

这使得 CUDA 成为严肃训练任务中最可靠且高性能的选择。
DeepExtension 的训练模块（如 GRPO 和 SFT）已全面优化以适配 CUDA 环境。

对于需要大规模微调开源基础模型（如 Qwen、LLaMA、DeepSeek）的企业用户，强烈推荐使用 CUDA。

尽管 CUDA 性能强劲，但并非所有用户都易于获取 —— 尤其是个体研究者或缺乏 NVIDIA 硬件的小团队。

Apple 的 M 系列芯片（M1–M4）带来了新的机遇。凭借其统一内存架构（UMA）与出色的本地 AI 能力，它们具备：

我们曾尝试在 macOS 上测试 PyTorch 的 Metal 后端（MPS），但发现其性能不稳定、兼容性较差。

因此我们选择集成 MLX —— Apple 专为其芯片架构开发的新一代机器学习框架。MLX 的优势包括：

DeepExtension 已内置 MLX 演示训练任务，方便 Mac 用户即刻体验微调流程。

平台	后端	支持操作系统	典型应用场景
CUDA	PyTorch / TensorFlow	Linux，Windows（通过 WSL）	全流程模型训练，生产部署
MLX	MLX	macOS（M1–M4）	本地开发，小规模训练

其他平台暂不支持，未来将根据用户需求优先考虑。

我们理解全球用户在硬件与生态偏好方面存在多样性。

尽管 CUDA 与 MLX 已覆盖大多数当前使用场景，我们仍在积极收集反馈，以评估以下平台的支持优先级：

如果您有特定平台需求或环境限制，请通过支持页面联系我们。您的反馈将直接影响我们的产品路线图。

DeepExtension 旨在让 LLM 训练更易获取 —— 无论您是在数据中心、MacBook 还是创业阶段的预算环境下使用。