Troubleshooting (7) 썸네일형 리스트형 arXiv 올리기 기존 출판되었던 논문을 arXiv에 올리려다 보니, 몇가지 시행착오가 있어 기록으로 남긴다.그냥 pdf를 다운받아서 올리면 되는 줄 알았는데, Latex으로 제출해야 한다. 나는 Overleaf에서 논문을 작성했었는데, 이를 기준으로 순서를 정리하자면, 0. 먼저 오버리프 로그를 보면서 에러나 워닝은 최대한 처리해준다. 워닝의 경우 arxiv에서 그냥 넘어갈 수도 있으나,,,, arxiv 컴파일이 워낙 예민해서 오버리프에서 최대한 없애고 가는게 좋은 것 같다. 1. Overleaf 우측 상단에 보면 "Submit" 메뉴가 있다. 이걸 누른 뒤에 arXiv를 선택해준다. 그 다음에 뜨는 메뉴에서 아래 arXiv를 선택한다.2. 위 버튼을 누르면 arXiv에 제출할 수 있는 형태로 zip 파일을 생성해준다... WSL2에서 쿠다 사용 현재 개인 작업용으로 윈도우 PC를 사용하고 있는데, 여기에는 NVIDIA RTX3090이 설치되어 있다.사실 PC에서도 모델 학습, 테스트를 하고자 GPU 달린 것으로 샀는데 윈도우에서 뭔가 하기에는 좀 답답한 면이 많아서 잘 안쓰고 있었다. 그런데 최근에 WSL2 (Windows Service for Linux)가 굉장히 원활하게 잘 작동한다고 해서 이걸 써보기로 했다. CUDA on WSL (nvidia.com) CUDA on WSL6.1. Notice This document is provided for information purposes only and shall not be regarded as a warranty of a certain functionality, condition, or q.. Tensorflow GPU를 잘 인식하지 못하는 경우 Anaconda를 이용해서 Tensorflow를 설치하였는데, GPU가 안잡히는 문제가 발생하였다.설치를 하고, 아래와 같이 명령어를 입력했을 때 GPU 리스트가 떠야 하는데, 빈 리스트만 나오는 문제가 발생..(PyTorch를 쓰면, 명령어가 잘 정리되어 있는데.. Tensorflow는 좀 난잡하게 되어 있어서 이런 문제가 상대적으로 잦은 것 같다.)python3 -c "import tensorflow as tf; print(tf.config.list_physical_devices('GPU'))"2024-05-06 22:21:44.368198: I tensorflow/core/util/port.cc:113] oneDNN custom operations are on. You may see slightly.. Distributed learning이 시작되지 않는 경우 Tensorflow docker를 새로 생긴 A100 GPU 서버에 옮겨놓고 코드를 돌려보려고 하는데트레이닝이 시작이 안되고... 계속 멈춰 있는 현상이 발생하였다.(강제 종료도 안되고... ㅠㅠ) Tensorflow에서 다음과 같이 Mirrored strategy를 사용했는데, NCCL (CUDA에서 GPU간 커뮤니케이션 관련 라이브러리인듯) 을 기본으로 사용한다고 한다. 그런데 NCCL 설정에 문제가 있으면 이런 현상이 발생한다고 한다. mirrored_strategy = tf.distribute.MirroredStrategy() 코드 실행하기 전에 Shell에서 다음과 같이 설정을 바꾸어주니 돌아가는 것 같다.export NCCL_P2P_DISABLE="1"export NCCL_IB_DISABLE=.. Torch Cuda compiler version mismatch Anaconda를 이용하여 아래와 같이 torch, cudatoolkit, cudnn 등을 설치하였다. conda install pytorch==1.13.1 torchvision==0.14.1 torchaudio==0.13.1 pytorch-cuda=11.7 -c pytorch -c nvidia 그리고 나서 Torch에서 cuda로 작성된 custom module을 컴파일하려고 하니 다음과 같은 에러가 발생하였다. The detected CUDA version (12.0) mismatches the version that was used to compile PyTorch (11.7). Please make sure to use the same CUDA versions Anaconda에서 cuda 관련된 .. Jetson Nano SDK manager 활용하여 설치 일반적으로 Jetson nano에 처음 세팅을 할때 SD card image를 하나 구워서 끼워 넣는 방식으로 많이 사용했었다. 그런데 이번에 JetPack 4.3버전으로 세팅해야 할 일이 생겼는데 JetPack 4.3은 SD Image를 제공하지 않아서 SDK manager를 이용하여 세팅을 해야했다. SD card image를 사용할 때는 세팅하는게 상당히 간단했었는데... SDK manager를 이용하려니 정보도 파편화되어있고, 하드웨어 세팅도 까다로워서 쉽지가 않았다. 공식 홈페이지에 설명이 어느 정도 되어 있긴 한데, Jetson을 Host computer와 연결하는 것이 문서에 쓰인 것처럼 간단하지만은 않아서 시행착오가 있었다. Install Jetson Software with SDK Man.. RTX 3090에 맞는 Tensorflow 설치(Anaconda이용) 최근에 대학원에서 RTX3090을 새로 설치하면서 이를 활용해보고자 했는데 Tensorflow 버전 때문에 잘 작동하 않았다. 조금 알아보지 Tensorflow 최신버전에서만 잘 작동하는 것 같다. RTX3090을 쓰기 위한 몇가지 버전 관련한 요구사항은 아래와 같다. Tensorflow 2.5 이상 cudatoolkit 11.2 이상 cudnn 8.1이상 다음 링크에서 확인할 수 있다: https://www.tensorflow.org/install/source#tested_build_configurations 이를 설치하기 위하여 아래 커맨드를 실행해 주었다. cudatoolkit, cudnn 버전을 특정해주지 않았는데, 2021년 9월 30일 기준으로 cudatoolkit은 11.3.1, cudnn은.. 이전 1 다음