1. 에러 화면ERROR:torch.distributed.elastic.multiprocessing.api:failed (exitcode: 1) local_rank: 1 (pid: 2762685) 2. 발생 원인컴퓨터의 자원(cpu, ram, gpu 등) 한계보다 더 큰 모델의 크기나, 데이터가 한 번에 들어온 경우 3. 발생 위치본인의 파이썬 실행 파일 중, 모델을 구성하는 부분 혹은 데이터를 로드하는 부분 4. 해결 방법모델의 크기 축소, 배치 크기 축소 등
ERROR:torch.distributed.elastic.multiprocessing.api:failed (exitcode: 1) local_rank: 1
1. 에러 화면ERROR:torch.distributed.elastic.multiprocessing.api:failed (exitcode: 1) local_rank: 1 (pid: 2762685) 2. 발생 원인컴퓨터의 자원(cpu, ram, gpu 등) 한계보다 더 큰 모델의 크기나, 데이터가 한 번에 들어온 경우 3. 발생 위치본인의 파이썬 실행 파일 중, 모델을 구성하는 부분 혹은 데이터를 로드하는 부분 4. 해결 방법모델의 크기 축소, 배치 크기 축소 등
2023.02.03