安装过CUDA&tensorflow后重新拾起:PyTorch1.8.1+CUDA11.1
由于我早在2017年就安装过tensorflow gpu版本,所以已经安装过CUDA 9.0。在过去的几年里都没有再使用过tensorflow进行深度学习的代码编写。现在要重新拾起来,发现比重新装还困难一些,颇有整饬山河的感觉,没有安装过的也可以跟着重新安装。
1、重新安装Geforce experience
2、更新NVIDIA显卡的驱动程序
3、安装符合驱动程序要求的CUDA软件版本
4、安装 与CUDA版本对应的 cuDNN
5、添加环境变量
6、安装PyTorch
1、重新安装Geforce experience
为什么要重新安装Geforce experience?
因为在旧版本的Geforce experience可能无法安装最新版本的显卡驱动,就像我这次一样,一直显示无法继续安装。
Geforce experience下载安装地址:https://www.nvidia.cn/geforce/geforce-experience/download/
2、更新NVIDIA显卡的驱动程序
2.1 更新驱动程序
打开安装好的Geforce experience,点击驱动程序,可以看到可用的Geforce Game Ready驱动程序,点击下载并安装。
安装过程中,顺便看看2.2的内容。
备注:有的人可能会像我一样,明明安装过Geforce experience,却连账号都没有(虽然我清楚的记得自己有账号,却登不上去),同时,又遇到Geforce experience上却无法注册账号( 祸不单行啊 -_-|| )的问题,我找到的解决方法可能能够帮到你:英伟达账号为什么不能注册
2.2 查看NVIDIA显卡
在桌面上右击如果能找到NVIDA控制面板,则说明该电脑有GPU。控制面板如下,并通过帮助→系统信息查看GPU及其驱动程序版本。
更新到最新版本的GPU驱动程序后,再次查看,可以看到已经是最新版本,目前的最新版本为466.27。
点击图中的组件,切换到组件,查看当前可以安装的CUDA版本。
3 安装最新版本的CUDA
3.1 查看已安装CUDA的版本
一般情况下,CUDA安装路径为:
C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v9.0
CUDA文件下的子文件夹v9.0就是目前安装的CUDA版本。
3.2 根据显卡驱动程序选择安装正确的CUDA版本
点击CUDA发行说明查看现有驱动程序可以安装的CUDA版本。
点击CUDA官网安装CUDA。
这里我下载的是最新版本的CUDA11.1
在安装过程中,我选择的是简明安装。安装前在查看已安装在C盘的CUDA v9.0 发现大小为1个多G,也就没有在意了,直接装C盘吧。安装向导的最后勾选了launch samples。
3.3 查看是否安装成功
打开控制台CMD,修改路径为安装CUDA的路径,在这里,我的路径为C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA
1、先修改路径到CUDA的文件夹,代码如下:
cd C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA
2、修改路径到当前版本,我目前为v11.1
cd v11.1
3、修改路径到bin文件夹
cd bin
4、输入指令:nvcc -V(这里V是大写字母)
nvcc -V
结果如图:
4、安装cuDNN
1、CUDA和cuDNN版本对应关系:https://developer.nvidia.com/rdp/cudnn-archive#a-collapse742-10,如下图,由于我安装的是CUDA11.1,所以我应该安装cuDNN v8.1.1。点击对应的版本进行下载。
2、解压cuDNN压缩包,可以看到cuda文件夹里面有bin、include、lib三个子文件夹。打开CUDA的安装目录,将cuDNN压缩包内对应目录下的文件分别复制到bin、include、lib\x64目录。复制的是文件,不是文件夹。
5、添加环境变量
1、在系统变量的path里添加以下两个变量,参照格式修改为你的安装路径和版本
C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v11.1
C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v11.1\lib\x64
2、测试安装成功:
打开控制台CMD,修改路径为:
cd C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v11.1\extras\demo_suite
分别输入命令:
.\deviceQuery.exe
.\bandwidthTest.exe
得到结果:
6、安装PyTorch
PyTorch官网:https://pytorch.org/
可以采用很多种方式安装,这里采用anaconda进行安装。
6.1 更新anaconda
应该可以直接更新anaconda,当然也可以在anaconda的安装路径中找到Uninstall-Anaconda3.exe文件,双击删除,再重新安装。
而我则是直接删除了文件,所以重新安装的时候报错已经安装过了,又把注册表里的删除了,才能够重新安装。
这里需要注意的是安装包似乎需要以管理员身份进行安装。
安装的教程可以参考我之前写的博客:Anaconda的安装教程,也可以结合以下别人的教程。
6.2 搭建python环境
1)打开Anaconda Prompt
2)切换文件路径
打开的控制台的路径应该是C盘,切换到其他磁盘,以切换到E盘为例,输入如下代码:
e:
切换到目标路径,用于新建文件夹存放未来要安装的环境,使用cd
切换路径,使用Tab键
自动查找相似的路径名称:
cd Application
3)新建工作文件夹,使用md+新建文件名称
新建文件夹(make directory),也可以直接打开对应的路径新建文件夹
md AnacondaWorkspace
4)切换目录到工作文件夹
cd AnacondaWorkspace
之后的环境将安装到这个文件路径下。(这里有错误,环境依旧是安装到了Anaconda3\envs
路径下。)
5)使用清华镜像源
conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/free/
conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/main/
conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/pytorch/
conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/conda-forge/
conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/pro/
conda config --set show_channel_urls yes
conda config --set show_channel_urls yes
的意思是从channel中安装包时显示channel的url,这样就可以知道包的安装来源了。更多内容可以参考这篇博客:conda 镜像杂谈
6)建立虚拟环境pytorch
conda create --name pytorch(这个名字自己随便起) python=3.8(这里要写成3.8可能与anaconda版本有关系) anaconda
conda create --name pytorch python=3.8 anaconda
中间需要你确认Proceed ([y]/n)? 不建议输入y,我输入y后安装了2.4Gb的依赖包,好像之后也可以安装吧。
7)启动虚拟环境pytorch
activate pytorch
8)激活虚拟环境pytorch
conda activate pytorch
9)查看Python版本
python -V
6.3 anaconda安装PyTorch
1)在PyTorh的下载页面查看对应的pytorc下载指令
我安装的是CUDA 11.1,Windows平台,使用conda安装,Python语言
2)输入安装指令到Anaconda Prompt中:
conda install pytorch torchvision torchaudio cudatoolkit=11.1 -c pytorch -c nvidia
如果报错无法找到依赖包(PackagesNotFoundError -cudatoolkit=11.1),可以尝试指令:
conda install pytorch torchvision torchaudio cudatoolkit=11.1 -c pytorch -c nvidia -c conda-forge
经常由于网络中断导致下载失败。
对于网络中断的问题,找到的下面几篇篇博客进行了讲解:
conda安装pytorch总是失败(下载中断):这篇文章提出设置超时时间来解决问题,指令如下:
pip --default-timeout=1000 install requests
conda安装太慢问题解决:下载其需要的软件,采用conda本地安装。这里没有进行尝试。
Anaconda清华镜像下载大文件频繁出错:暂时没看懂这篇文章在讲啥。
现在是晚上十二点半,好像下载速度变快了不少。
半夜一点之后,让电脑继续慢慢下载了,第二天早上起床,发现运气挺好,已经下载安装完成了。
3)测试是否安装成功
进入Python,输入指令:
python
python状态下,命令行输入如下指令:
import torch
import torchvision
print(torch.__version__)
pytorch安装成功: