folding@home gpu on linux is failing for me

Moderators: Site Moderators, PandeGroup

folding@home gpu on linux is failing for me

Postby beer » Mon Apr 17, 2017 6:21 am

Hi
I am trying to install and run folding@home on Debian 9 and I have run into a problem with the GPU's I cannot figure out. When I try to add a GPU slots then I get the error "on client "local" 127.0.0.1: 3633: no available GPU's"

I think it is because "OpenCL: Not detected: clGetPlatformIDs() returned -1001" but I dont know how to solve it. Any idear?

Code: Select all
*********************** Log Started 2017-04-17T06:10:13Z ***********************
06:10:13:************************* Folding@home Client *************************
06:10:13:      Website: http://folding.stanford.edu/
06:10:13:    Copyright: (c) 2009-2016 Stanford University
06:10:13:       Author: Joseph Coffland <joseph@cauldrondevelopment.com>
06:10:13:         Args: --child --lifeline 11436 /etc/fahclient/config.xml --run-as
06:10:13:               fahclient --pid-file=/var/run/fahclient.pid --daemon
06:10:13:       Config: /etc/fahclient/config.xml
06:10:13:******************************** Build ********************************
06:10:13:      Version: 7.4.16
06:10:13:         Date: Jan 6 2017
06:10:13:         Time: 08:08:33
06:10:13:   Repository: Git
06:10:13:     Revision: e12187cbb0bd6937c067b9749af011374563b7b9
06:10:13:       Branch: master
06:10:13:     Compiler: GNU 4.9.2
06:10:13:      Options: -std=gnu++98 -O3 -funroll-loops -ffast-math -mfpmath=sse
06:10:13:               -fno-unsafe-math-optimizations -msse2
06:10:13:     Platform: linux2 4.8.0-2-amd64
06:10:13:         Bits: 64
06:10:13:         Mode: Release
06:10:13:******************************* System ********************************
06:10:13:          CPU: Intel(R) Core(TM) i7-4770S CPU @ 3.10GHz
06:10:13:       CPU ID: GenuineIntel Family 6 Model 60 Stepping 3
06:10:13:         CPUs: 8
06:10:13:       Memory: 7.74GiB
06:10:13:  Free Memory: 3.78GiB
06:10:13:      Threads: POSIX_THREADS
06:10:13:   OS Version: 4.9
06:10:13:  Has Battery: false
06:10:13:   On Battery: false
06:10:13:   UTC Offset: 2
06:10:13:          PID: 11438
06:10:13:          CWD: /var/lib/fahclient
06:10:13:           OS: Linux 4.9.0-2-amd64 x86_64
06:10:13:      OS Arch: AMD64
06:10:13:         GPUs: 0
06:10:13:CUDA Device 0: Platform:0 Device:0 Bus:1 Slot:0 Compute:6.1 Driver:8.0
06:10:13:       OpenCL: Not detected: clGetPlatformIDs() returned -1001
06:10:13:***********************************************************************

beer
 
Posts: 213
Joined: Tue Dec 13, 2011 11:18 am

Re: folding@home gpu on linux is failing for me

Postby ChristianVirtual » Mon Apr 17, 2017 6:41 am

What GPU are in and what driver version is installed (and what is the source of the driver).
Sometimes driver from non-vendor repositories don't contain all relevant components (e.g. OpenCL for nV)
ImageImage
Please contribute your logs to http://ppd.fahmm.net
User avatar
ChristianVirtual
 
Posts: 1475
Joined: Tue May 28, 2013 12:14 pm
Location: 日本 東京

Re: folding@home gpu on linux is failing for me

Postby beer » Mon Apr 17, 2017 7:17 am

GPU: Geforce 1070
Driver version: 375.39
Install way: Via apt-get from repo

What components do you think that is missing`?
beer
 
Posts: 213
Joined: Tue Dec 13, 2011 11:18 am

Re: folding@home gpu on linux is failing for me

Postby ChristianVirtual » Mon Apr 17, 2017 8:44 am

Exactly the OpenCL-libs ; my preferred way is the manual installation with the .run file from the nV site; I run 378.13 (the one needed for 1080ti.
There is a Linux install guide here in the forum describing the steps (can't link the link right now)
User avatar
ChristianVirtual
 
Posts: 1475
Joined: Tue May 28, 2013 12:14 pm
Location: 日本 東京

Re: folding@home gpu on linux is failing for me

Postby beer » Mon Apr 17, 2017 7:13 pm

Hi

I did manage to install the OpenCL-libs from nvidia. And it did look like I also needed the cuda-stuff. Now the setup looks like:
Code: Select all
*********************** Log Started 2017-04-17T19:07:47Z ***********************
19:07:47:************************* Folding@home Client *************************
19:07:47:        Website: http://folding.stanford.edu/
19:07:47:      Copyright: (c) 2009-2016 Stanford University
19:07:47:         Author: Joseph Coffland <joseph@cauldrondevelopment.com>
19:07:47:           Args: --child --lifeline 1061 /etc/fahclient/config.xml --run-as
19:07:47:                 fahclient --pid-file=/var/run/fahclient.pid --daemon
19:07:47:         Config: /etc/fahclient/config.xml
19:07:47:******************************** Build ********************************
19:07:47:        Version: 7.4.16
19:07:47:           Date: Jan 6 2017
19:07:47:           Time: 08:08:33
19:07:47:     Repository: Git
19:07:47:       Revision: e12187cbb0bd6937c067b9749af011374563b7b9
19:07:47:         Branch: master
19:07:47:       Compiler: GNU 4.9.2
19:07:47:        Options: -std=gnu++98 -O3 -funroll-loops -ffast-math -mfpmath=sse
19:07:47:                 -fno-unsafe-math-optimizations -msse2
19:07:47:       Platform: linux2 4.8.0-2-amd64
19:07:47:           Bits: 64
19:07:47:           Mode: Release
19:07:47:******************************* System ********************************
19:07:47:            CPU: Intel(R) Core(TM) i7-4770S CPU @ 3.10GHz
19:07:47:         CPU ID: GenuineIntel Family 6 Model 60 Stepping 3
19:07:47:           CPUs: 8
19:07:47:         Memory: 7.74GiB
19:07:47:    Free Memory: 6.59GiB
19:07:47:        Threads: POSIX_THREADS
19:07:47:     OS Version: 4.9
19:07:47:    Has Battery: false
19:07:47:     On Battery: false
19:07:47:     UTC Offset: 2
19:07:47:            PID: 1063
19:07:47:            CWD: /var/lib/fahclient
19:07:47:             OS: Linux 4.9.0-2-amd64 x86_64
19:07:47:        OS Arch: AMD64
19:07:47:           GPUs: 0
19:07:47:  CUDA Device 0: Platform:0 Device:0 Bus:1 Slot:0 Compute:6.1 Driver:8.0
19:07:47:OpenCL Device 0: Platform:0 Device:0 Bus:1 Slot:0 Compute:1.2 Driver:375.39
19:07:47:***********************************************************************


But Folding@home cannot find my gpu ( "on client "local" 127.0.0.1: 3633: no available GPU's"). And this time I dont have a clue about why. ANy suggestions?
beer
 
Posts: 213
Joined: Tue Dec 13, 2011 11:18 am

Re: folding@home gpu on linux is failing for me

Postby ComputerGenie » Mon Apr 17, 2017 8:11 pm

I forget where it was, but wasn't there a post last month (or the month before) about something removed from the new Linux betas (Debian included)?
User avatar
ComputerGenie
 
Posts: 242
Joined: Mon Dec 12, 2016 4:06 am

Re: folding@home gpu on linux is failing for me

Postby SteveWillis » Mon Apr 17, 2017 8:16 pm

are you sure your GPU is in the GPUs.txt file you have? I believe in some Linux installs the most recent version doesn't get installed automatically. That's the error I got when the 1080's weren't included and I had to manually download the file. It can be found at fah.stanford.edu/file-releases/public/GPUs.txt
Last edited by SteveWillis on Mon Apr 17, 2017 8:25 pm, edited 1 time in total.
Image
My thanks to my very indulgent wife
http://folding.extremeoverclocking.com/user_summary.php?s=&u=712804

3 AMD Linux rigs 3, 4, and 5 GPUs 7 X GTX 1080, 5 X GTX 1080 TI
SteveWillis
 
Posts: 216
Joined: Fri Apr 15, 2016 12:42 am

Re: folding@home gpu on linux is failing for me

Postby Joe_H » Mon Apr 17, 2017 8:21 pm

If you installed without the proper video drivers in place, the client will probably configured for no GPU's present. There is an option related to that that needs to be removed or changed. Easiest is to completely uninstall and then reinstall the client.
Image

iMac 2.8 i7 12 GB smp8, Mac Pro 2.8 quad 12 GB smp6
MacBook Pro 2.9 i7 8 GB smp3
Joe_H
Site Admin
 
Posts: 3816
Joined: Tue Apr 21, 2009 4:41 pm
Location: W. MA

Re: folding@home gpu on linux is failing for me

Postby beer » Tue Apr 18, 2017 12:03 pm

# ComputerGenie. Yes there was. I solved that with taken the dependency from stable
# SteveWillis: Do you know where the file should be stored on Linux?
# Joe_H: I tried that. Did not work
beer
 
Posts: 213
Joined: Tue Dec 13, 2011 11:18 am

Re: folding@home gpu on linux is failing for me

Postby ChristianVirtual » Tue Apr 18, 2017 1:22 pm

under Linux the default location for GPU white/blacklist is at /var/lib/fahclient

Are you sure the open source driver nouveau is not loaded; that one must not run.

lsmod to check if not loaded (and to check nV driver is loaded)

Can you get us the output of FAHClient --lspci

And from nvidia-smi


And a last question: do you have any X running (it's also needed for the GForce driver)

(I had a similar case in the last, just so t remember how I recovered)
User avatar
ChristianVirtual
 
Posts: 1475
Joined: Tue May 28, 2013 12:14 pm
Location: 日本 東京

Re: folding@home gpu on linux is failing for me

Postby beer » Tue Apr 18, 2017 7:11 pm

#ChristianVirtual
I am a bit confused. In /var/lib/fahclientI can onlu see those items:
configs cores logs log.txt work
eg I don't see anything resembling a list of graphic cards that should be usable.

I tried to put th file from fah.stanford.edu/file-releases/public/GPUs.txt into /var/lib/fahclient/GPUs.txt but it did not work


Code: Select all
root@debian:/var/lib/fahclient# lsmod
Module                  Size  Used by
nvidia_uvm            638976  8
snd_hda_codec_hdmi     49152  1
binfmt_misc            20480  1
intel_rapl             20480  0
eeepc_wmi              16384  0
asus_wmi               28672  1 eeepc_wmi
x86_pkg_temp_thermal    16384  0
sparse_keymap          16384  1 asus_wmi
intel_powerclamp       16384  0
snd_hda_codec_realtek    90112  1
coretemp               16384  0
snd_hda_codec_generic    69632  1 snd_hda_codec_realtek
kvm_intel             192512  0
kvm                   589824  1 kvm_intel
irqbypass              16384  1 kvm
snd_hda_intel          36864  5
snd_hda_codec         135168  4 snd_hda_intel,snd_hda_codec_hdmi,snd_hda_codec_generic,snd_hda_codec_realtek
crct10dif_pclmul       16384  0
crc32_pclmul           16384  0
snd_hda_core           81920  5 snd_hda_intel,snd_hda_codec,snd_hda_codec_hdmi,snd_hda_codec_generic,snd_hda_codec_realtek
ghash_clmulni_intel    16384  0
snd_hwdep              16384  1 snd_hda_codec
iTCO_wdt               16384  0                                                                                                                                                   
snd_pcm               110592  4 snd_hda_intel,snd_hda_codec,snd_hda_core,snd_hda_codec_hdmi                                                                                       
intel_cstate           16384  0                                                                                                                                                   
rfkill                 24576  4 asus_wmi                                                                                                                                         
iTCO_vendor_support    16384  1 iTCO_wdt                                                                                                                                         
evdev                  24576  8                                                                                                                                                   
mxm_wmi                16384  0                                                                                                                                                   
snd_timer              32768  1 snd_pcm                                                                                                                                           
snd                    86016  18 snd_hda_intel,snd_hwdep,snd_hda_codec,snd_timer,snd_hda_codec_hdmi,snd_hda_codec_generic,snd_hda_codec_realtek,snd_pcm                           
intel_uncore          118784  0                                                                                                                                                   
mei_me                 36864  0                                                                                                                                                                                                                                               
mei                   102400  1 mei_me                                                                                                                                                                                                                                         
soundcore              16384  1 snd                                                                                                                                                                                                                                           
lpc_ich                24576  0                                                                                                                                                                                                                                               
sg                     32768  0                                                                                                                                                                                                                                               
mfd_core               16384  1 lpc_ich                                                                                                                                                                                                                                       
pcspkr                 16384  0                                                                                                                                                                                                                                               
intel_rapl_perf        16384  0                                                                                                                                                                                                                                               
shpchp                 36864  0                                                                                                                                                                                                                                               
serio_raw              16384  0                                                                                                                                                                                                                                               
battery                16384  0                                                                                                                                                                                                                                               
wmi                    16384  2 asus_wmi,mxm_wmi                                                                                                                                                                                                                               
video                  40960  1 asus_wmi                                                                                                                                                                                                                                       
tpm_infineon           20480  0                                                                                                                                                                                                                                               
tpm_tis                16384  0                                                                                                                                                                                                                                               
nvidia_drm             45056  1                                                                                                                                                                                                                                               
tpm_tis_core           20480  1 tpm_tis                                                                                                                                                                                                                                       
button                 16384  0                                                                                                                                                                                                                                               
tpm                    45056  3 tpm_infineon,tpm_tis,tpm_tis_core                                                                                                                                                                                                             
drm_kms_helper        155648  1 nvidia_drm                                                                                                                                                                                                                                     
drm                   360448  4 nvidia_drm,drm_kms_helper                                                                                                                                                                                                                     
nvidia_modeset        790528  7 nvidia_drm                                                                                                                                                                                                                                     
nvidia              12144640  243 nvidia_modeset,nvidia_uvm                                                                                                                                                                                                                   
ip_tables              24576  0                                                                                                                                                                                                                                               
x_tables               36864  1 ip_tables                                                                                                                                                                                                                                     
autofs4                40960  2                                                                                                                                                                                                                                               
ext4                  585728  1
hid_generic            16384  0
usbhid                 53248  0
hid                   122880  2 hid_generic,usbhid
crc16                  16384  1 ext4
jbd2                  106496  1 ext4
crc32c_generic         16384  0
fscrypto               28672  1 ext4
ecb                    16384  0
mbcache                16384  2 ext4
sd_mod                 45056  3
crc32c_intel           24576  2
ahci                   36864  2
libahci                32768  1 ahci
libata                249856  2 ahci,libahci
aesni_intel           167936  0
xhci_pci               16384  0
xhci_hcd              188416  1 xhci_pci
ehci_pci               16384  0
aes_x86_64             20480  1 aesni_intel
ehci_hcd               81920  1 ehci_pci
glue_helper            16384  1 aesni_intel
lrw                    16384  1 aesni_intel
gf128mul               16384  1 lrw
scsi_mod              225280  3 sd_mod,libata,sg
ablk_helper            16384  1 aesni_intel
cryptd                 24576  3 ablk_helper,ghash_clmulni_intel,aesni_intel
usbcore               249856  5 usbhid,ehci_hcd,xhci_pci,xhci_hcd,ehci_pci
psmouse               135168  0
r8169                  81920  0
i2c_i801               24576  0
i2c_smbus              16384  1 i2c_i801
mii                    16384  1 r8169
usb_common             16384  1 usbcore
thermal                20480  0
fan                    16384  0


Code: Select all
root@debian:/var/lib/fahclient# FAHClient --lspci
terminate called after throwing an instance of 'std::logic_error'
  what():  basic_string::_S_construct null not valid
Aborted



Code: Select all
root@debian:/var/lib/fahclient# nvidia-smi
Tue Apr 18 21:10:35 2017       
+-----------------------------------------------------------------------------+
| NVIDIA-SMI 375.39                 Driver Version: 375.39                    |
|-------------------------------+----------------------+----------------------+
| GPU  Name        Persistence-M| Bus-Id        Disp.A | Volatile Uncorr. ECC |
| Fan  Temp  Perf  Pwr:Usage/Cap|         Memory-Usage | GPU-Util  Compute M. |
|===============================+======================+======================|
|   0  GeForce GTX 1070    Off  | 0000:01:00.0      On |                  N/A |
|  0%   41C    P8    13W / 151W |    402MiB /  8113MiB |      8%      Default |
+-------------------------------+----------------------+----------------------+
                                                                               
+-----------------------------------------------------------------------------+
| Processes:                                                       GPU Memory |
|  GPU       PID  Type  Process name                               Usage      |
|=============================================================================|
|    0       562    G   /usr/lib/xorg/Xorg                             194MiB |
|    0       791    G   kwin_x11                                        67MiB |
|    0       807    G   /usr/bin/krunner                                10MiB |
|    0       811    G   /usr/bin/plasmashell                            71MiB |
|    0      1109    G   /proc/self/exe                                  55MiB |
+-----------------------------------------------------------------------------+

beer
 
Posts: 213
Joined: Tue Dec 13, 2011 11:18 am

Re: folding@home gpu on linux is failing for me

Postby ChristianVirtual » Tue Apr 18, 2017 7:53 pm

Should like like this

Code: Select all
  4 drwxrwxrwx. 2 fahclient root   4096 Apr 17 08:10 configs
  0 drwxrwxrwx. 3 fahclient root     33 Mar 13 14:45 cores
 84 -rw-r--r--. 1 fahclient root  82906 Apr 14 22:19 GPUs.txt
  4 drwxrwxrwx. 2 fahclient root   4096 Apr 17 05:48 logs
492 -rw-r--r--. 1 fahclient root 498652 Apr 19 04:49 log.txt
  0 drwxrwxrwx. 4 fahclient root     64 Apr 19 02:24 work


Please check/change ownership if different.

FAHCLient --lspci is reading the GPUS,txt at begin, if that one also not working I think once we have that file up and running we come closer to success.

Also make sure have X running (and maybe try to upgrade the driver to 378.13; in between we have some driver troubles)

Code: Select all
+-----------------------------------------------------------------------------+
| NVIDIA-SMI 378.13                 Driver Version: 378.13                    |
|-------------------------------+----------------------+----------------------+
| GPU  Name        Persistence-M| Bus-Id        Disp.A | Volatile Uncorr. ECC |
| Fan  Temp  Perf  Pwr:Usage/Cap|         Memory-Usage | GPU-Util  Compute M. |
|===============================+======================+======================|
|   0  GeForce GTX 980 Ti  Off  | 0000:01:00.0      On |                  N/A |
| 45%   68C    P2   255W / 260W |    385MiB /  6077MiB |    100%      Default |
+-------------------------------+----------------------+----------------------+
|   1  Graphics Device     Off  | 0000:02:00.0      On |                  N/A |
| 70%   72C    P2   222W / 250W |    400MiB / 11172MiB |    100%      Default |
+-------------------------------+----------------------+----------------------+
                                                                               
+-----------------------------------------------------------------------------+
| Processes:                                                       GPU Memory |
|  GPU       PID  Type  Process name                               Usage      |
|=============================================================================|
|    0      2455    G   /usr/bin/X                                      58MiB |
|    0      2545    G   /usr/bin/gnome-shell                            83MiB |
|    0      6751    C   .../NVIDIA/Fermi/beta/Core_21.fah/FahCore_21   166MiB |
|    1      2455    G   /usr/bin/X                                      16MiB |
|    1      6723    C   .../NVIDIA/Fermi/beta/Core_21.fah/FahCore_21   307MiB |
+-----------------------------------------------------------------------------+

I feel you can run the graphical NVIDIA xsetting tool you should be fine.
User avatar
ChristianVirtual
 
Posts: 1475
Joined: Tue May 28, 2013 12:14 pm
Location: 日本 東京

Re: folding@home gpu on linux is failing for me

Postby Joe_H » Tue Apr 18, 2017 8:32 pm

Please post enough of the beginning of your log file to show the configuration information. That would include the information on whether the client is configured to even look for GPU's. Or post the config.xml file with your passkey removed.
Joe_H
Site Admin
 
Posts: 3816
Joined: Tue Apr 21, 2009 4:41 pm
Location: W. MA

Re: folding@home gpu on linux is failing for me

Postby beer » Wed Apr 19, 2017 5:13 am

The /etc/fahclient/config.xml contains:

Code: Select all
<config>
  <!-- Client Control -->
  <fold-anon v='true'/>

  <!-- Folding Slot Configuration -->
  <gpu v='false'/>

  <!-- Network -->
  <proxy v=':8080'/>

  <!-- Folding Slots -->
  <slot id='0' type='CPU'/>
</config>
beer
 
Posts: 213
Joined: Tue Dec 13, 2011 11:18 am

Re: folding@home gpu on linux is failing for me

Postby Joe_H » Wed Apr 19, 2017 5:26 am

You need to change the line that says "<gpu v='false'/>" to the value of true.
Joe_H
Site Admin
 
Posts: 3816
Joined: Tue Apr 21, 2009 4:41 pm
Location: W. MA

Next

Return to Discussions of General-FAH topics

Who is online

Users browsing this forum: No registered users and 4 guests

cron