CUDNN是英偉達公司(NVIDIA)開發的一個深度學習加速庫,它基于CUDA技術,可以加速深度學習算法的運行,提高計算效率和速度。CUDNN包含了大量的高性能算法和優化技術,可以幫助深度學習開發者更加高效地訓練和優化神經網絡模型。CUDNN支持各種不同的深度學習框架,例如TensorFlow、Caffe、PyTorch等,可以在不同的平臺和設備上運行,例如GPU、CPU等。CUDNN還提供了各種不同的API,例如卷積、池化、歸一化等,可以方便地集成到深度學習應用程序中??偟膩碚f,CUDNN是一個非常強大和實用的深度學習加速庫,可以幫助深度學習開發者更快地訓練和優化神經網絡模型。
CUDNN軟件功能:
·支持Volta-GPU架構,包括新的Tesla V100 加速器
·協作組,一個用于管理通信線程組的新編程模型
·用于編程Tensor Core矩陣的新型API在Tesla V100上進行乘法或加法的操作
·更快的程序庫用于線性代數,圖像處理,FFT等
·在CuSolver和nvGroup中的新算法
·新的NVIDIA Visual Profiler支持Volta V100以及改進同一內存的分析功能
·提高編譯器性能
·在CUDA設備代碼中支持 C++14
·擴大開發平臺和主機編譯器,包括Microsoft Visual Studio 2017, Clang 3.9, PGI17.1和GCC6.x
CUDA 支持新的NVIDIA Volta 架構
CUDA 的核心是支持新型Volta架構,特別是GTC 2017推出的新Tesla V100 GPU加速器。
Tesla V100新的SM(流式多處理器)為深度學習和HPC提供了極高的浮點和整數性能。新的Volta SM比上一代Pascal設計能效高50%,在相同的功率范圍內可大幅度提升FP32和FP64性能。在深度學習訓練上,有12倍的峰值TFLOPs提升,在深度學習推理上,有6倍提升。通過獨立的并行整數和浮點數據路徑,Volta SM在計算和尋址計算的組合下,對工作負載的效率也更高。Volta的新獨立線程調度能力使得并行線程之間的細粒度同步協同成為可能。最終,新型的L1 Data Cache 與Shared Memory子系統的結合極大地提升了性能,同時也簡化了編程。
CUDNN軟件的特點如下:
1. 高效性:CUDNN使用了多種高效的算法和優化技術,可以提高深度學習算法的運行速度和計算效率。
2. 靈活性:CUDNN支持各種不同的深度學習框架和平臺,可以在不同的設備上運行,并且可以方便地集成到應用程序中。
3. 易用性:CUDNN提供了各種不同的API,例如卷積、池化、歸一化等,可以方便地使用和調用。
4. 可擴展性:CUDNN支持多GPU并行計算,可以提高計算效率和速度。
5. 準確性:CUDNN使用了精確的數值計算方法,可以保證深度學習算法的準確性和穩定性。
總的來說,CUDNN是一個非常強大和實用的深度學習加速庫,可以幫助深度學習開發者更快地訓練和優化神經網絡模型。
CUDNN安裝教程:
1、首先需要確認你的電腦顯卡已經安裝好了驅動并且是支持Cuda
的,從本站下載cudnn,我選擇的版本是cuda_10.1.243_426.00_win10.exe
2\安裝的時候建議選擇自定義而不是“精簡”(從下面的英文解釋可以看出,其實這里的精簡寫成完整應該更貼切,他會安裝所有組件并覆蓋現有驅動,然而我并不想安裝全家桶,何況我的官方顯卡驅動比他的新)。
3\如下圖所示,我們只需選擇CUDA項(默認是全選的),這一步之后,會詢問這些組件的安裝路徑,可以直接使用C盤的默認位置,當然我們可以可以自己定義(請記住這些安裝路徑,后面配置環境變量需要用到)。
環境變量和測試
檢查系統變量
添加環境變量后如下圖所示:
可以通過如下指令測試安裝和配置是否成功:
nvcc --version
nvcc -V
輸出結果如下所示:
顯示cuda版本號10.1 V10.1.243
,說明安裝成功!
Cudnn 安裝
解壓文件夾,顯示內容如下:
將解壓文件夾cuda
目錄下的文件分別復制到cuda
安裝目錄下的對應文件夾下面,如下所示:
恭喜你,安裝完成?。。?/p>