快速开始：运行您的首次训练任务¶

DeepExtension 通过完全可视化的界面，帮助您在无需编写代码的情况下轻松启动首次模型训练。

根据系统的 AI 平台，我们已预安装多个演示训练方法，助您快速上手。

可用的演示训练方法¶

GRPO-Demo：基于 GRPO（Guided Reinforcement with Prompt Optimization）方法的逻辑对齐微调示例。
SFT-Demo：适用于小规模任务的监督微调示例。

如流程依赖关系页面所述，确保以下组件已准备就绪：

建议使用以下示例数据集之一：

GRPO-Demo（openai/gsm8k 数据集前 100 行）：
openai-gsm8k_first_100_lines.jsonl
SFT-Demo（yahma/alpaca-cleaned 数据集前 100 行）：
alpaca_data_cleaned_first_100_lines.jsonl
MLX-Demo（来自 MLX 官方仓库）：
mlx-demo-train-dataset.jsonl
VL-SINGLE-Demo :
single-images-folder
VL-MULTI-Demo :
multi-images-folder
SFT-Demo-IN-VIDEO :
origin.jsonl merge.jsonl
SD-DEMO-IN-VIDEO : sd-in-video

也可以使用自己的数据集，需要确保其结构与上述任一示例保持一致，包括字段名的匹配。

以下为一套适用于所有演示训练方法的最小参数配置：

* 这些参数将在近期版本中提供。
** 并非所有演示训练方法都需要这些参数。

可以根据实际情况灵活调整上述参数配置。

完成训练后，可以：

DeepExtension —— 快速上手，全面掌控。