[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

[HTCondor-users] condor problem



Hi master:
when I deploy and use condor in aws ec2 instance,I meet some probelm,log as follows:
007 (012.000.000) 07/14 10:00:47 Shadow exception!
 Can no longer talk to condor_starter <14.12.70.174:9618>
 0  -  Run Bytes Sent By Job
 0  -  Run Bytes Received By Job
...
007 (012.000.000) 07/14 10:00:47 Shadow exception!
 Can no longer talk to condor_starter <14.12.70.174:9618>
 0  -  Run Bytes Sent By Job
 0  -  Run Bytes Received By Job
...
007 (012.000.000) 07/14 10:00:47 Shadow exception!
 Can no longer talk to condor_starter <14.12.70.174:9618>
 0  -  Run Bytes Sent By Job
 0  -  Run Bytes Received By Job

StarterLog:
07/14/17 10:01:47 (pid:91637) init_local_hostname_impl: ipv6_getaddrinfo() could not look up 'ip-14-12-70-174': Name or service not known (-2).  Error is not recoverable; giving up.  Problems are likely.
07/14/17 10:01:47 (pid:91637) init_local_hostname_impl: ipv6_getaddrinfo() could not look up 'ip-14-12-70-174': Name or service not known (-2).  Error is not recoverable; giving up.  Problems are likely.
07/14/17 10:01:47 (pid:91637) ******************************************************
07/14/17 10:01:47 (pid:91637) ** condor_starter (CONDOR_STARTER) STARTING UP
07/14/17 10:01:47 (pid:91637) ** /usr/sbin/condor_starter
07/14/17 10:01:47 (pid:91637) ** SubsystemInfo: name=STARTER type=STARTER(8) class=DAEMON(1)
07/14/17 10:01:47 (pid:91637) ** Configuration: subsystem:STARTER local:<NONE> class:DAEMON
07/14/17 10:01:47 (pid:91637) ** $CondorVersion: 8.7.2 Jun 21 2017 BuildID: 408717 $
07/14/17 10:01:47 (pid:91637) ** $CondorPlatform: x86_64_Ubuntu14 $
07/14/17 10:01:47 (pid:91637) ** PID = 91637
07/14/17 10:01:47 (pid:91637) ** Log last touched 7/14 10:01:47
07/14/17 10:01:47 (pid:91637) ******************************************************
07/14/17 10:01:47 (pid:91637) Using config source: /etc/condor/condor_config
07/14/17 10:01:47 (pid:91637) Using local config sources: 
07/14/17 10:01:47 (pid:91637)    /etc/condor/condor_config.local
07/14/17 10:01:47 (pid:91637) config Macros = 68, Sorted = 67, StringBytes = 1668, TablesBytes = 2488
07/14/17 10:01:47 (pid:91637) CLASSAD_CACHING is OFF
07/14/17 10:01:47 (pid:91637) Daemon Log is logging: D_ALWAYS D_ERROR
07/14/17 10:01:47 (pid:91637) SharedPortEndpoint: waiting for connections to named socket 88959_69bb_410
07/14/17 10:01:47 (pid:91637) DaemonCore: command socket at <14.12.70.174:9618?addrs=14.12.70.174-9618&noUDP&sock=88959_69bb_410>
07/14/17 10:01:47 (pid:91637) DaemonCore: private command socket at <14.12.70.174:9618?addrs=14.12.70.174-9618&noUDP&sock=88959_69bb_410>
07/14/17 10:01:47 (pid:91637) Communicating with shadow <14.12.70.174:9618?addrs=14.12.70.174-9618&noUDP&sock=88958_b55b_528>
07/14/17 10:01:47 (pid:91637) Submitting machine is "M014012070174.v4.enabler.ne.jp"
Stack dump for process 91637 at timestamp 1500026507 (12 frames)
/usr/lib/condor/libcondor_utils_8_7_2.so(dprintf_dump_stack+0x72)[0x7f1374872952]
/usr/lib/condor/libcondor_utils_8_7_2.so(_Z18linux_sig_coredumpi+0x24)[0x7f1374a4c5e4]
/lib/x86_64-linux-gnu/libpthread.so.0(+0x11390)[0x7f1372f2b390]
/lib/x86_64-linux-gnu/libc.so.6(strlen+0x26)[0x7f1372bdb746]
condor_starter(_ZN9JICShadow18publishStarterInfoEPN14compat_classad7ClassAdE+0x26)[0x4337a6]
condor_starter(_ZN9JICShadow19registerStarterInfoEv+0x2c)[0x43823c]
condor_starter(_ZN9JICShadow4initEv+0xc1)[0x437951]
condor_starter(_ZN8CStarter4InitEP19JobInfoCommunicatorPKcbiii+0x41e)[0x45de4e]
condor_starter(_Z9main_initiPPc+0x70)[0x4555a0]
/usr/lib/condor/libcondor_utils_8_7_2.so(_Z7dc_mainiPPc+0x13e0)[0x7f1374a4fc90]
/lib/x86_64-linux-gnu/libc.so.6(__libc_start_main+0xf0)[0x7f1372b70830]
condor_starter[0x4227e7]

my condor_status is:
ubuntu@ip-14-12-70-174:~$ condor_status
Name         OpSys      Arch   State     Activity LoadAv Mem   ActvtyTime

slot1@       LINUX      X86_64 Unclaimed Idle      0.000 7679  0+00:00:08
slot2@       LINUX      X86_64 Unclaimed Idle      0.000 7679  0+00:00:08
slot3@       LINUX      X86_64 Unclaimed Idle      0.000 7679  0+00:00:08
slot4@       LINUX      X86_64 Unclaimed Idle      0.000 7679  0+00:00:08
slot5@       LINUX      X86_64 Unclaimed Idle      0.000 7679  0+00:00:07
slot6@       LINUX      X86_64 Unclaimed Idle      0.000 7679  0+00:00:08
slot7@       LINUX      X86_64 Unclaimed Idle      0.000 7679  0+00:00:08
slot8@       LINUX      X86_64 Unclaimed Idle      0.000 7679  0+00:00:08
slot9@       LINUX      X86_64 Unclaimed Idle      0.000 7679  0+00:00:08
slot10@      LINUX      X86_64 Unclaimed Idle      0.000 7679  0+00:00:07
slot11@      LINUX      X86_64 Unclaimed Idle      0.000 7679  0+00:00:08
slot12@      LINUX      X86_64 Unclaimed Idle      0.000 7679  0+00:10:03
slot13@      LINUX      X86_64 Unclaimed Idle      0.000 7679  0+00:10:03
slot14@      LINUX      X86_64 Unclaimed Idle      0.000 7679  0+00:10:03
slot15@      LINUX      X86_64 Unclaimed Idle      0.000 7679  0+00:10:03
slot16@      LINUX      X86_64 Unclaimed Idle      0.000 7679  0+00:10:03

my condor version is:
ubuntu@ip-14-12-70-174:~$ condor_version
$CondorVersion: 8.7.2 Jun 21 2017 BuildID: 408717 $
$CondorPlatform: x86_64_Ubuntu14 $