Error/Pytorch

ERROR:torch.distributed.elastic.multiprocessing.api:failed (exitcode: 1) local_rank: 1

  • -
728x90
반응형

1. 에러 화면

ERROR:torch.distributed.elastic.multiprocessing.api:failed (exitcode: 1) local_rank: 1 (pid: 2762685)

 

2. 발생 원인

컴퓨터의 자원(cpu, ram, gpu 등) 한계보다 더 큰 모델의 크기나, 데이터가 한 번에 들어온 경우

 

3. 발생 위치

본인의 파이썬 실행 파일 중, 모델을 구성하는 부분 혹은 데이터를 로드하는 부분

 

4. 해결 방법

모델의 크기 축소, 배치 크기 축소 등

728x90
반응형
Contents

포스팅 주소를 복사했습니다

이 글이 도움이 되었다면 공감 부탁드립니다.