快速开始

这页只做一件事:从安装到生成第一批候选结构。跑通以后,再去看完整清洗流程和每张卡片的参数。

1. 安装

建议使用独立环境,Python 版本用 3.10 到 3.12。

conda create -n nepkit python=3.10
conda activate nepkit
pip install NepTrainKit

如果你需要 GPU backend,先让安装过程能找到 CUDA。

Linux / WSL2:

export CUDA_HOME=/usr/local/cuda-12.4
export PATH="$CUDA_HOME/bin:$PATH"
export LD_LIBRARY_PATH="$CUDA_HOME/lib64:${LD_LIBRARY_PATH}"
pip install NepTrainKit

Windows PowerShell:

$env:CUDA_PATH = "C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v12.4"
$env:Path = "$env:CUDA_PATH\bin;" + $env:Path
pip install NepTrainKit

启动软件:

nepkit

2. 打开 Make Dataset

第一次建议从 Make Dataset 开始。它的职责是制作训练集候选结构:输入一批基础结构, 选择一张或多张卡片,生成应变、扰动、缺陷、表面、掺杂或磁性构型。

切到 Make Dataset 后,先点击窗口顶部的 Open 按钮导入初始结构。这里的初始结构 通常是已经弛豫好的 xyzextxyzPOSCARCIF 文件;后面的卡片都会以这批结构 作为输入继续生成候选构型。

Make Dataset empty workspace

图中需要记住四个位置:

  • Open input structures:导入初始结构。没有输入结构时,多数生成卡片没有可处理对象。

  • Add new card:添加构型生成或筛选卡片。

  • Run selected cards:只运行已勾选的卡片。

  • Workflow workspace:卡片会按顺序放在这里,后续也在这里检查结果和导出。

3. 生成一组候选结构

这里用 Lattice Strain 作为第一张卡。它的输入是已有结构,输出是一组晶格被拉伸或压缩后的结构。 这一步得到的是候选结构,不是最终训练集。

  1. 先用 Open 导入初始结构。

  2. 点击 Add new card

  3. 选择 Lattice Strain

  4. 设置一个小范围,例如 X/Y/Z 都从 -2%2%,步长 1%

  5. 勾选这张卡,点击顶部 Run

  6. 运行完成后,从卡片上的导出按钮保存结果。

Lattice Strain quickstart

这张图对应的使用逻辑是:

  • 先添加卡片,不要一开始就改很多高级参数。

  • 只改与物理目标直接相关的范围,例如应变轴、最小值、最大值、步长。

  • 运行后先看输出数量是否符合预期,再导出到下一步检查。

4. 检查候选结构

Make Dataset 生成的是候选结构,不建议默认直接送 DFT。最短检查路径是:

NEP Dataset Display overview
  1. NEP Dataset Display 打开候选结构。

  2. 先看结构和明显异常点。

  3. 删除或单独导出异常样本。

  4. 清洗后再决定是否做 FPS 代表性采样。

5. 进入 DFT 和训练

清洗后的结构再送去做第一性原理计算。DFT 标注完成后,用 GPUMD 训练 NEP; 训练结束后,再回到 NEP Dataset Display 查看训练误差。

完整的清洗顺序、为什么不要先 FPS、以及如何用 NEP 预测做预筛,见 候选结构清洗后再进入 DFT

如果你在做缺陷、表面、掺杂或磁性结构,直接去看 Make Dataset 卡片手册。手册按卡片用途组织,比逐个试菜单更快。