<div dir="ltr">Hi!<br clear="all"><div><div class="gmail_signature"><div dir="ltr"><div dir="ltr"><div dir="ltr"><div dir="ltr"><div dir="ltr"><div dir="ltr"><div style="font-family:arial;font-size:small"><br></div><div style="font-family:arial;font-size:small">Our provider had network maintenance this night, so 2 of our 4 servers got disconnected and reconnected. Since we knew this was coming, we shifted all work load off the affected servers. This morning, most of the cluster seems fine, but for one volume, no heal info can be retrieved, so we basically don&#39;t know about the healing state of the volume. The volume is a replica 2 volume between vhost4-int/brick1 and vhost3-int/brick2.</div><div style="font-family:arial;font-size:small"><br></div><div style="font-family:arial;font-size:small">The volume is accessible, but since I don&#39;t get any heal info, I don&#39;t know if it is probably replicated. Any help to resolve this situation is highly appreciated. </div><div style="font-family:arial;font-size:small"><br></div><div style="font-family:arial;font-size:small">hangs forever:</div><div style=""><font face="monospace, monospace">[root@vhost4 ~]# gluster volume heal vol4 info</font><br></div><div style=""><font face="arial"><br></font></div><div style=""><span style="font-family:arial">glfsheal-vol4.log:</span><font face="arial"><br></font></div><div style=""><div><div><font face="monospace, monospace">[2015-09-24 07:47:59.284723] I [MSGID: 101190] [event-epoll.c:632:event_dispatch_epoll_worker] 0-epoll: Started thread with index 1</font></div><div><font face="monospace, monospace">[2015-09-24 07:47:59.293735] I [MSGID: 101190] [event-epoll.c:632:event_dispatch_epoll_worker] 0-epoll: Started thread with index 2</font></div><div><font face="monospace, monospace">[2015-09-24 07:47:59.294061] I [MSGID: 104045] [glfs-master.c:95:notify] 0-gfapi: New graph 76686f73-7434-2e61-6c6c-61626f757461 (0) coming up</font></div><div><font face="monospace, monospace">[2015-09-24 07:47:59.294081] I [MSGID: 114020] [client.c:2118:notify] 0-vol4-client-1: parent translators are ready, attempting connect on transport</font></div><div><font face="monospace, monospace">[2015-09-24 07:47:59.309470] I [MSGID: 114020] [client.c:2118:notify] 0-vol4-client-2: parent translators are ready, attempting connect on transport</font></div><div><font face="monospace, monospace">[2015-09-24 07:47:59.310525] I [rpc-clnt.c:1819:rpc_clnt_reconfig] 0-vol4-client-1: changing port to 49155 (from 0)</font></div><div><font face="monospace, monospace">[2015-09-24 07:47:59.315958] I [MSGID: 114057] [client-handshake.c:1437:select_server_supported_programs] 0-vol4-client-1: Using Program GlusterFS 3.3, Num (1298437), Version (330)</font></div><div><font face="monospace, monospace">[2015-09-24 07:47:59.316481] I [MSGID: 114046] [client-handshake.c:1213:client_setvolume_cbk] 0-vol4-client-1: Connected to vol4-client-1, attached to remote volume &#39;/storage/brick2/brick2&#39;.</font></div><div><font face="monospace, monospace">[2015-09-24 07:47:59.316495] I [MSGID: 114047] [client-handshake.c:1224:client_setvolume_cbk] 0-vol4-client-1: Server and Client lk-version numbers are not same, reopening the fds</font></div><div><font face="monospace, monospace">[2015-09-24 07:47:59.316538] I [MSGID: 108005] [afr-common.c:3960:afr_notify] 0-vol4-replicate-0: Subvolume &#39;vol4-client-1&#39; came back up; going online.</font></div><div><font face="monospace, monospace">[2015-09-24 07:47:59.317150] I [MSGID: 114035] [client-handshake.c:193:client_set_lk_version_cbk] 0-vol4-client-1: Server lk version = 1</font></div><div><font face="monospace, monospace">[2015-09-24 07:47:59.320898] I [rpc-clnt.c:1819:rpc_clnt_reconfig] 0-vol4-client-2: changing port to 49154 (from 0)</font></div><div><font face="monospace, monospace">[2015-09-24 07:47:59.325633] I [MSGID: 114057] [client-handshake.c:1437:select_server_supported_programs] 0-vol4-client-2: Using Program GlusterFS 3.3, Num (1298437), Version (330)</font></div><div><font face="monospace, monospace">[2015-09-24 07:47:59.325780] I [MSGID: 114046] [client-handshake.c:1213:client_setvolume_cbk] 0-vol4-client-2: Connected to vol4-client-2, attached to remote volume &#39;/storage/brick1/brick1&#39;.</font></div><div><font face="monospace, monospace">[2015-09-24 07:47:59.325791] I [MSGID: 114047] [client-handshake.c:1224:client_setvolume_cbk] 0-vol4-client-2: Server and Client lk-version numbers are not same, reopening the fds</font></div><div><font face="monospace, monospace">[2015-09-24 07:47:59.333346] I [MSGID: 114035] [client-handshake.c:193:client_set_lk_version_cbk] 0-vol4-client-2: Server lk version = 1</font></div><div><font face="monospace, monospace">[2015-09-24 07:47:59.334545] I [MSGID: 108031] [afr-common.c:1745:afr_local_discovery_cbk] 0-vol4-replicate-0: selecting local read_child vol4-client-2</font></div><div><font face="monospace, monospace">[2015-09-24 07:47:59.335833] I [MSGID: 104041] [glfs-resolve.c:862:__glfs_active_subvol] 0-vol4: switched to graph 76686f73-7434-2e61-6c6c-61626f757461 (0)</font></div></div><div><br></div><div><span style="font-family:arial">Questions to this output: </span></div><div><span style="font-family:arial">-) Why does it report &quot;</span><span style="font-family:monospace,monospace">Using Program GlusterFS 3.3, Num (1298437), Version (330)</span><span style="font-family:arial">&quot;. We run 3.7.3 ?!</span></div><div><span style="font-family:arial">-) guster logs timestamps in UTC not taking server timezone into account. Is there a way to fix this?</span><br></div><div><span style="font-family:arial"><br></span></div><div><font face="arial">etc-glusterfs-glusterd.vol.log:</font><br></div><div><span style="font-family:arial">no logs to after volume heal info command</span><br></div><div><font face="arial"><br></font></div><div><font face="arial">storage-brick1-brick1.log:</font><br></div><div><div><font face="monospace, monospace">[2015-09-24 07:47:59.325720] I [login.c:81:gf_auth] 0-auth/login: allowed user names: 67ef1559-d3a1-403a-b8e7-fb145c3acf4e</font></div><div><font face="monospace, monospace">[2015-09-24 07:47:59.325743] I [MSGID: 115029] [server-handshake.c:610:server_setvolume] 0-vol4-server: accepted client from vhost4.allaboutapps.at-14900-2015/09/24-07:47:59:282313-vol4-client-2-0-0 (version: 3.7.3)</font></div></div><div><font face="arial"><br></font></div><div><span style="font-family:arial">storage-brick2-brick2.log:</span><br></div><div><span style="font-family:arial">no logs to after volume heal info command</span></div><div><br></div><div><span style="font-family:arial"><br></span></div><div><span style="font-family:arial">Thanks,</span></div><div><span style="font-family:arial"><br></span></div><div><span style="font-family:arial">- Andreas</span></div><div><span style="font-family:arial"><br></span></div><div><span style="font-family:arial"><br></span></div></div></div></div></div></div></div></div></div></div>
</div>