Question 1

Por que as instâncias de GPU são tão caras na cloud?

Accepted Answer

As instâncias de GPU são caras porque os aceleradores que as compõem são um hardware escasso, faminto por energia e com preço premium, e são cobradas pela instância inteira, esteja a GPU ocupada ou não. Os workloads costumam deixar as GPUs ociosas entre as rodadas de treinamento ou subutilizá-las, então as equipes pagam a tarifa cheia por uma capacidade que fica sem uso.

Question 2

Devo usar GPUs spot ou GPUs on-demand?

Accepted Answer

As GPUs spot são capacidade ociosa oferecida com um grande desconto, mas que pode ser retomada com pouco aviso, então combinam com jobs interrompíveis, como treinamento e inferência em batch, que conseguem salvar checkpoint e retomar. As GPUs on-demand custam mais, mas não podem ser retomadas, o que as torna a escolha mais segura para execuções longas e ininterruptas.

Otimização de custos de GPU

Perguntas frequentes

Termos relacionados