본문 바로가기

언어/Python

11/14 배운점

1. 난 그동안 파이썬 경로 막 써와서 몰랐는데

./ 이 경로는 현재 경로를 의미하고

../ 이게 현재 경로에서 한단계 이전 경로로 돌아가는 것..

 

이걸 모르고 살았으니,, 난 멍청이가 맞다.

 

2. cuda 메모리가 꽉차는 거로 나왓다. (CUDA out of memory)

그런데 아래에 보면 memory usage가 N/A로 나왔다.

이 문제가 아마도 cuda 11.7을 쓰는데, 가상환경에는 cuda에 맞지 않는 torch, torchvision, torchaudio 버전을 설치해서 발생한 오류인 것으로 보인다고 했다.

그래서 pytorch 들어가서 확인해보았다.

run this command를 복붙해서 실행하여 새로운 pytorch 버전을 받았다. (근데 이미 설치된 pytorch 어떻게 안하고 해도되나 모르겠다.)

 

음.. 여전히 메모리 사용이 제대로 분배되지 않았다.

사실 이게 뭔 개념인지 잘 모르는데,, 왜 안되는지 모르겠단 말이지..

 

캐시 지우고 다시 돌렸더니 일단 베이스라인 코드가 돌아갔다.

근데 금방이라도 에러 터질 것 같다.

25 에포크 중에 2번째 돌아가다가 터졌다ㅎㅎ

코랩 쓰면 해결이 될까?

 

일단 CUDA 버전이 nvidia-smi에서와 nvcc에서 서로 다르게 나타났다. 그 이유를 찾아보니 아래와 같았다.

 

nvidia-smiGPU driver installer에 의해 설치되는 것으로, driver API의 version을 보여주며,

nvccCUDA toolkit에 의해 설치되는 것으로, CUDA runtime version을 보여준다.