AI·머신러닝·딥러닝

CUDA/cuDNN 설치 ( Ubuntu Desktop 22.04LTS )

무한열정 2024. 3. 4. 15:47

■ 기본 설치환경

GPU : GTX-1050

Ubuntu Desktop 22.04 LTS

NVidia Driver v535 (2024-03-04 현재 최신)

CUDA x86_64 v11.8 (v12.2 호환 불가)
cuDNN v8.6.0.163 (v8.9.7 호환 불가)

* 주의 : Ubuntu Server 22.04 LTS에서는 설치가 되지 않았다. Linux X-Window의 어떤 패키지 의존성 요소가 필요한 걸로 보인다. ㅜㅠ

* 교육용이나 학습목적으로 동일한 환경에서 GTX-1050를 빼고 GTX-750 ti 설치하여 보니 이 역시도 인식하지 못한다. CUDA 사용을 위해서는 어느 등급 이상의 그래픽카드가 필요한 것으로보인다. ^^;;;

2024-03-14 11:13:49.405327: W tensorflow/compiler/tf2tensorrt/utils/py_utils.cc:38] TF-TRT Warning: Could not find TensorRT
2024-03-14 11:13:51.535303: E external/local_xla/xla/stream_executor/cuda/cuda_driver.cc:274] failed call to cuInit: CUDA_ERROR_NO_DEVICE: no CUDA-capable device is detected

 

■ 기타 설치환경

 Anaconda v2023.09-0 (Python 패키지 관리)
Python v3.10
Tensorflow v2.13.0
Tensorflow[and-cuda] v2.13.0

 

설치후 결론

CUDA v12.2, cuDNN v8.9.7, Python v3.11, Tensorflow v2.15.0 최신으로 설치는 불가능 하였다.

비슷한 관련 내용이 다음에도 소개 되어 있어서

"Tensorflow v2.13.0"으로 시도하여 성공하였다.

Tensorflow v2.15.0으로 설치가 성공하면 공유를 부탁드린다. ^^;

https://medium.com/@dev-charodeyka/tensorflow-conda-nvidia-gpu-on-ubuntu-22-04-3-lts-ad61c1d9ee32

설치난이도가 상당히 높다. 몇몇 글에서는 암에 걸릴것 같다거나 등등의 난이도에 관한 글이 있으며 실제로 꽤나 까다롭다고 생각한다.

 

■ 설치 방법

1) 그래픽카드 확인

$ lspci | grep -i VGA

 

2) NVidia Driver 설치

$ sudo add-apt-repository ppa:graphics-drivers/ppa
$  sudo apt update
$  sudo apt install nvidia-driver-535
$  nvidia-smi

 

3) CUDA 다운로드

https://developer.nvidia.com/cuda-toolkit-archive

Tensorflow v2.13.0을 목표로 설치하다보니 CUDA v11.8이 채택 되었다.

 

[runfile(local)]을 선택하면 Linux용 설치 스크립트가 화면에 표시된다.

해당 스크립트를 터미널에 복사 붙여넣기 하면 된다.

 

CUDA 다운로드

$ wget https://developer.download.nvidia.com/compute/cuda/11.8.0/local_installers/cuda_11.8.0_520.61.05_linux.run

 

4) CUDA 설치

CUDA 설치 파일 구동

$ sudo sh cuda_11.8.0_520.61.05_linux.run

 

에디터에서 bash 설정파일 수정

$ sudo vi ~/.bashrc

 

맨 뒤에 다음 구문 추가

export PATH=/usr/local/cuda-11.8/bin${PATH:+:${PATH}}
export LD_LIBRARY_PATH=/usr/local/cuda-11.8/lib64\${LD_LIBRARY_PATH:+:${LD_LIBRARY_PATH}}

 

bash 설정내용 즉시 적용

$ source ~/.bashrc

 

CUDA 설치 확인

nvcc -V 

 

5) cuDNN 다운로드

CUDA v11.8에 맞는 cuDNN v8.6.0 tar 파일을 다운로드 한다.

https://developer.nvidia.com/cudnn-downloads

 

cuDNN tar파일 압축해제

$ tar xvf cudnn-linux-x86_64-8.6.0.163_cuda11-archive.tar.xz

 

cuDNN tar파일 설치

$ sudo cp cudnn-linux-x86_64-8.6.0.163_cuda11-archive/include/cudnn*.h /usr/local/cuda/include
$ sudo cp -P cudnn-linux-x86_64-8.6.0.163_cuda11-archive/lib/libcudnn* /usr/local/cuda/lib64
$ sudo chmod a+r /usr/local/cuda/include/cudnn*.h /usr/local/cuda/lib64/libcudnn*

 

cuDNN 설치 확인

$ cat /usr/local/cuda/include/cudnn_version.h | grep CUDNN_MAJOR -A 2

 

 CUDA 동작 확인

Python을 이용한 동작 확인

$ python -c "import tensorflow as tf; print(tf.config.list_physical_devices('GPU'))"

 

로그에 Warning이 보이나 다른 Python 예제들의 동작에는 문제가 없었다.

 

 

Tensorflow, CUDA, cuDNN 버전 매칭 정보

다음을 페이지를 참조해서 궁합이 맞는 버전을 매칭해야 한다.

https://www.tensorflow.org/install/source?hl=ko

 

소스에서 빌드  |  TensorFlow

이 페이지는 Cloud Translation API를 통해 번역되었습니다. 소스에서 빌드 컬렉션을 사용해 정리하기 내 환경설정을 기준으로 콘텐츠를 저장하고 분류하세요. 소스에서 TensorFlow pip 패키지를 빌드하

www.tensorflow.org

 

GPU 사용량 확인

$ watch -n .1 -d nvidia-smi
#0.1초간격으로 gpu사용량을 계속 확인가능

 

 참고문서

CUDA 설치가 너무 까다로웠으며 다행히 다음 글을 참고하여 설치를 완료 할 수 있었다. ^^;;;

* Tensorflow v2.15.0 설치 이슈 (설치시 오류 발생) 및 v2.13.0 설치 관련

https://medium.com/@dev-charodeyka/tensorflow-conda-nvidia-gpu-on-ubuntu-22-04-3-lts-ad61c1d9ee32

* CUDA 설치를 간단하고 쉽게 설명하는 영상 (강추)

https://www.youtube.com/watch?v=mmp-hay0eeM