Back to Colossalai

集群实用程序

docs/source/zh-Hans/features/cluster_utils.md

0.5.1461 B
Original Source

集群实用程序

作者: Hongxin Liu

前置教程:

引言

我们提供了一个实用程序类 colossalai.cluster.DistCoordinator 来协调分布式训练。它对于获取有关集群的各种信息很有用,例如节点数、每个节点的进程数等。

API 参考

{{ autodoc:colossalai.cluster.DistCoordinator }}

<!-- doc-test-command: echo -->