Skip to content

Commit

Permalink
fix typo
Browse files Browse the repository at this point in the history
  • Loading branch information
isno committed Nov 27, 2024
1 parent 708bfb0 commit 5606ccc
Showing 1 changed file with 3 additions and 3 deletions.
6 changes: 3 additions & 3 deletions container/Extended-Resource.md
Original file line number Diff line number Diff line change
Expand Up @@ -100,9 +100,9 @@ service DevicePlugin {

你注意到扩展资源与 Device Plugin 的问题了么?

Pod 只能通过“nvidia.com/gpu:2”这种简单的“计数形式”来申请 2 GPU。然而,对于这 2 个 GPU 的具体型号、拓扑结构、是否共享或独享等属性,用户无法进行选择。所以说,Device Plugin 仅实现了基本的入门级功能,无法满足更复杂的资源管理需求。
Pod 只能通过“nvidia.com/gpu:2”这种简单的“计数形式”申请 2 GPU,但这 2 个 GPU 的具体型号、拓扑结构、是否共享/独享等属性,用户并不清楚。也就是说,Device Plugin 仅实现了基本的入门级功能,无法满足更复杂的资源管理需求。

在这些特殊场景的催化下,Nvidia、Intel 等头部厂商联合推出了 DRA(Dynamic Resource Allocation,动态资源分配)机制,允许用户以更复杂的方式描述和发现可用的异构资源,而不仅仅是简单的计数形式。例如,它可以支持 GPU 型号、性能、拓扑结构等属性的描述。
在“成本要省”、“资源利用率更高”场景的催化下,Nvidia、Intel 等头部厂商联合推出了“动态资源分配”(Dynamic Resource Allocation,DRA)机制,允许用户以更复杂的方式描述异构资源,而不仅仅是简单的计数形式。例如,它可以支持 GPU 型号、性能、拓扑结构等属性的描述。

由于 DRA 是一种相对较新的机制,具体的接口规范可能会因硬件供应商和 Kubernetes 版本的不同而有所变化。限于篇幅,笔者就不再扩展讨论了,有兴趣的读者可以查阅其他资料。
由于 DRA 属于较新的机制,具体的接口规范可能因硬件供应商和 Kubernetes 版本的不同有所变化。限于篇幅,笔者就不再扩展讨论了,有兴趣的读者可以查阅其他资料。
:::

0 comments on commit 5606ccc

Please sign in to comment.