increase the efficiency
•
optimizing memory utilization
•
speeding up the training
동시에 고려해야할 사항 (training large models)
•
Data throughput/training time (처리량 증가 → 학습시간 감소)
◦
Throughput(처리량): 특정 시간 동안 처리할 수 있는 데이터의 양 (예: samples/sec, images/sec)
◦
Training Time(학습 시간): 전체 학습을 완료하는 데 걸리는 시간
•
Model performance