田麦 发表于 2022-5-20 10:56

【PI后期4】利用显卡GPU加速Starnet++,速度快了5倍以上







Starnet++是一个免费的优秀去星软件。可惜运行的速度太慢了。怎样才能使它运行更快一些呢?方法是让显卡的GPU参与运算。借助GPU的算力,可以比单独使用CPU运算时的运行速度快了5倍以上。

本文介绍的GPU加速方法有一个前提:仅适用于64位的WINDOWS和nVidia GPU显卡的特定型号:(可官网查询支持CUDA的GPU显卡:https://developer.nvidia.com/cuda-gpus,需要列表中的Compute Capability达到或超过7.0以上)

需用到的软件:
nVidia CUDA 10.1 (Update 2)
nVidia cuDNN v7.6.5, for CUDA 10.1
libtensorflow-gpu 2.3.0
网盘下载链接:https://pan.baidu.com/s/1T5r3dnEXOC7H5jQssrPuRg
提取码:0000

(新增软件可以安装在Pixinsight同一个硬盘中,也可以安装在其它硬盘中,下面以X: 代替,请留意替换为具体盘符。安装过程中因为需要下载库数据,故要联网)

一、替换 tensorflow.dll
在libtensorflow-gpu-windows-x86_64-2.3.0\lib文件夹中,将tensorflow.dll 复制粘贴到“X:\Program Files\PixInsight\bin”下,覆盖现有文件。
(为保险起见,可以事先把原来的tensorflow.dll 改名为tensorflow_old.dll )

二、安装CUDA
1、运行 cuda_10.1.243_win10_network.exe
2、选择“自定义(高级)”
https://bbs.imufu.cn/data/attachment/forum/202205/20/103609icxtcq4ka63ezq5a.png

3、组件中仅仅勾选CUDA-Runtime-Libraries。请仔细检查,确保除此之外的其它所有内容都取消勾选。然后按下一步,直至安装完成。
https://bbs.imufu.cn/data/attachment/forum/202205/20/103727ibqkbq00x93f9psq.jpg


三、安装 cuDNN
将cudnn-v7.6.5.32_cuda10.1-windows10-x64\cuda\中的子文件夹“bin”和“lib”复制粘贴到“X:\Program Files\NVIDIA GPU Computing Toolit\CUDA\V10.1”中。
https://bbs.imufu.cn/data/attachment/forum/202205/20/103746jr8x2gewu0j51eg5.png

四、编辑环境变量
您将需要在 Windows 中设置 2 个环境变量,以便一切正常运行。
1、在Win开始菜单的搜索栏中搜索“编辑”,选择“编辑系统环境变量(控制面板)”,并点击后进入系统属性窗口。
https://bbs.imufu.cn/data/attachment/forum/202205/20/103800vwa88y5dkzkyy4ow.jpg

2、在“系统属性”窗口中点击其中的“环境变量N”
https://bbs.imufu.cn/data/attachment/forum/202205/20/103812cgp58zc7cgtuug2g.jpg

3、在弹窗下部的“系统变量S”窗口下,单击“新建”并输入“ TF_FORCE_GPU_ALLOW_GROWTH ”作为变量名和“ true ”作为变量值,按 确认。
https://bbs.imufu.cn/data/attachment/forum/202205/20/103849zaq78ovir6azrb89.jpg

4、在弹窗下部的“系统变量S”列表中找到名为“Path”的变量,点选它并单击“编辑”。
https://bbs.imufu.cn/data/attachment/forum/202205/20/103925p5n1xjlt7b2ex7ct.jpg

5、点击“新建”,新建 X:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v10.1\bin”后按“确定”退出。
https://bbs.imufu.cn/data/attachment/forum/202205/20/103951gojnllnxw7nv29cw.jpg
到此,软件全部安装完毕。(安装后最好重启一次电脑)

五、验证
打开 Windows 任务管理器,转到“性能”选项卡并选择 GPU 0,点击左下方图表上方的Video Encode,在下拉菜单中找到CUDA并选择它。
在Pixinsight中运行Starnet++,您会看到随着进程的开始,GPU曲线急剧上升,还有Starnet++运行速度的大大加快。
如果看不到这样的结果,很多时候是有关环境变量的问题。请详细检查环境变量的设定是否正确。
https://bbs.imufu.cn/data/attachment/forum/202205/20/104021lkzs8agpm6zps0l3.jpg

利用GPU加速后,用Starnet++(256)处理一个 6248 X 4176的彩色图像,用时仅29.523秒!一般地说来,采用GPU加速,Starnet++可以加速5倍以上。你也不妨试试。
https://bbs.imufu.cn/data/attachment/forum/202205/20/104038rludsd3t03xt3xtk.jpg

(本文编译于DARKARCHON的《 PIXINSIGHT, STARNET++ AND CUDA – GOTTA GO FAST》)



                                       目       录—————————————————————————【深空前期 1】用买单反的钱,组装入门级深空拍摄设备【深空前期 2】介绍几款好用的手机天文APP【深空前期 3】亮场、偏置、暗场、平场、暗平场拍摄的实操【深空前期 4】据说无dither不拍星,您dither了吗?【深空前期 5】天爱者永恒的话题之一:对极轴【深空前期 6】天爱者永恒的话题之二:调平衡【深空前期 7】天爱者永恒的话题之三:调焦【深空前期 8】天爱者永恒的话题之四:导星【深空前期 9】天爱者永恒的话题之五:后截距【深空前期 10】天文摄影常用器材图文对照表(更新)【深空前期 11】天文摄影用到的各种滤镜知多少?
【行星前期 1】行星拍摄利器——ADC(大气色散矫正器)——————————————————————————【深空后期 1】PixInsight 1.8 快餐式操作全纪录【深空后期 2】Siril 0.9.12 中文版快餐式操作实录【深空后期 3】MaxIm DL 6(MDL6) 快餐式后期操作全纪录【深空后期 4】DeepSkyStacker4.2.1 (DSS)快餐式操作全纪录【深空后期 5】介绍Siril-0.99.10.1新功能——深空图像处理大加速【深空后期 6】Siril 1.0.0-RC2 新增传感器倾斜度判断等新功能【深空后期 7】神奇软件,新版 Starnet V2 发布了
【行星后期 1】行星拍摄与后期PIPP、AS!3、RS6、WinJupos一条龙
【PI 后期 1】PixInsight 1.8.8 快捷键一览表【PI 后期 2】PixInsight哈勃色以及各类窄带彩色映射方法(1)【PI 后期 3】PixInsight产生伪亮度并进行窄带合成的SHO-AIP脚本(2)【PI 后期 4】利用显卡GPU加速Starnet++,速度快了5倍以上—————————————————————————






宋城冬叶 发表于 2023-8-26 19:37

请教田老师,starnet打开报错0XC0000142有解决方法吗?我系统也重装了还是这样子

田麦 发表于 2023-8-26 20:06

宋城冬叶 发表于 2023-8-26 19:37
请教田老师,starnet打开报错0XC0000142有解决方法吗?我系统也重装了还是这样子

...

不清楚原因,不妨换一个starnet软件试试

宋城冬叶 发表于 2023-9-2 20:37

田麦 发表于 2023-08-26 20:06
不清楚原因,不妨换一个starnet软件试试

好的

spiderh 发表于 2024-1-10 16:07

宋城冬叶 发表于 2023-8-26 19:37
请教田老师,starnet打开报错0XC0000142有解决方法吗?我系统也重装了还是这样子

...

我的是0xc000001d,找了一轮原因是CPU是Xeon E5645 太老了没有支持这个AVX指令集,调用tensorflow报错。您也可以下个cpu-z查查CPU是不是没支持这个AVX,显卡够新的话换按照此贴把tensorflow换成GPU运算说不定就可以了。我的显卡是没办法了:'(
页: [1]
查看完整版本: 【PI后期4】利用显卡GPU加速Starnet++,速度快了5倍以上