<div dir="ltr">Not historically, but we are using bonding for replication between the servers.Â  It&#39;s been stable for at least 6 months, but it&#39;s possible that one of the links in the bond is failing or something.<div><br></div><div>Would this type of restart be triggered by a loss of communication between bricks in a replica set?Â  It seems like it would defeat one of the points of having a replicated volume if that were the case.</div></div><div class="gmail_extra"><br clear="all"><div><div class="gmail_signature"><div dir="ltr"><br><div>Thank You,</div><div><br></div><div>Logan Barfield</div><div>Tranquil Hosting</div></div></div></div>

<br><div class="gmail_quote">On Tue, Feb 2, 2016 at 12:02 AM, Atin Mukherjee <span dir="ltr">&lt;<a href="mailto:amukherj@redhat.com" target="_blank">amukherj@redhat.com</a>&gt;</span> wrote:<br><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">Initially I was suspecting about server-quorum be the culprit which is<br>

not the case. By any chance is your network flaky?<br>

<div><div class="h5"><br>

On 02/01/2016 10:33 PM, Logan Barfield wrote:<br>

&gt; Volume Name: data02<br>

&gt; Type: Replicate<br>

&gt; Volume ID: 1c8928b1-f49e-4950-be06-0f8ce5adf870<br>

&gt; Status: Started<br>

&gt; Number of Bricks: 1 x 2 = 2<br>

&gt; Transport-type: tcp<br>

&gt; Bricks:<br>

&gt; Brick1: gluster-stor01:/export/data/brick02Â  Â &lt;-- 10.1.1.10<br>

&gt; Brick2: gluster-stor02:/export/data/brick02Â  Â &lt;-- 10.1.1.11<br>

&gt; Options Reconfigured:<br>

&gt; server.event-threads: 5<br>

&gt; client.event-threads: 11<br>

&gt; geo-replication.indexing: on<br>

&gt; geo-replication.ignore-pid-check: on<br>

&gt; changelog.changelog: on<br>

&gt; server.statedump-path: /tmp<br>

&gt; server.outstanding-rpc-limit: 128<br>

&gt; performance.io-thread-count: 64<br>

&gt; performance.nfs.read-ahead: on<br>

&gt; performance.nfs.io-cache: on<br>

&gt; performance.nfs.quick-read: on<br>

&gt; performance.cache-max-file-size: 1MB<br>

&gt; performance.client-io-threads: on<br>

&gt; cluster.lookup-optimize: on<br>

&gt; performance.cache-size: 1073741824<br>

&gt; performance.write-behind-window-size: 4MB<br>

&gt; performance.nfs.write-behind-window-size: 4MB<br>

&gt; performance.read-ahead: off<br>

&gt; performance.nfs.stat-prefetch: on<br>

&gt;<br>

&gt;<br>

&gt; Status of volume: data02<br>

&gt; Gluster processÂ  Â  Â  Â  Â  Â  Â  Â  Â  Â  Â  Â  Â  Â  Â TCP PortÂ  RDMA PortÂ  OnlineÂ  Pid<br>

&gt; ------------------------------------------------------------------------------<br>

&gt; Brick gluster-stor01:/export/data/brick02Â  Â  Â  49153Â  Â  Â 0Â  Â  Â  Â  Â  Y<br>

&gt;Â  Â  Â 17411<br>

&gt; Brick gluster-stor02:/export/data/brick02Â  Â  Â  49155Â  Â  Â 0Â  Â  Â  Â  Â  Y<br>

&gt;Â  Â  Â 4717<br>

&gt; NFS Server on localhostÂ  Â  Â  Â  Â  Â  Â  Â  Â  Â  Â 2049Â  Â  Â  0Â  Â  Â  Â  Â  Y<br>

&gt; 17395<br>

&gt; Self-heal Daemon on localhostÂ  Â  Â  Â  Â  Â  Â  Â N/AÂ  Â  Â  Â N/AÂ  Â  Â  Â  Y<br>

&gt; 17405<br>

&gt; NFS Server on gluster-stor02Â  Â  Â  Â  Â  Â  Â  Â  Â  Â 2049Â  Â  Â  0Â  Â  Â  Â  Â  Y<br>

&gt;Â  Â  Â 4701<br>

&gt; Self-heal Daemon on gluster-stor02Â  Â  Â  Â  Â  Â  Â N/AÂ  Â  Â  Â N/AÂ  Â  Â  Â  Y<br>

&gt;Â  Â  Â 4712<br>

&gt;<br>

&gt; Task Status of Volume data02<br>

&gt; ------------------------------------------------------------------------------<br>

&gt; There are no active volume tasks<br>

&gt;<br>

&gt;<br>

&gt;<br>

&gt; Note that this problem was occurring with the same frequency before we<br>

&gt; added all of the volume options above.Â  We were running defaults up<br>

&gt; until last week, and changing them had no impact on this particular problem.<br>

&gt;<br>

&gt;<br>

&gt;<br>

&gt;<br>

&gt; Thank You,<br>

&gt;<br>

&gt; Logan Barfield<br>

&gt; Tranquil Hosting<br>

&gt;<br>

&gt; On Fri, Jan 29, 2016 at 9:28 PM, Atin Mukherjee &lt;<a href="mailto:amukherj@redhat.com">amukherj@redhat.com</a><br>

</div></div><div><div class="h5">&gt; &lt;mailto:<a href="mailto:amukherj@redhat.com">amukherj@redhat.com</a>&gt;&gt; wrote:<br>

&gt;<br>

&gt;Â  Â  Â Could you paste output of gluster volume info?<br>

&gt;<br>

&gt;Â  Â  Â ~Atin<br>

&gt;<br>

&gt;Â  Â  Â On 01/29/2016 11:59 PM, Logan Barfield wrote:<br>

&gt;Â  Â  Â &gt; We&#39;re running a fairly large 2-replica volume across two servers.Â  The<br>

&gt;Â  Â  Â &gt; volume is approximately 20TB of small 1K-4MB files.Â  The volume is<br>

&gt;Â  Â  Â &gt; exported via NFS, and mounted remotely by two clients.<br>

&gt;Â  Â  Â &gt;<br>

&gt;Â  Â  Â &gt; For the past few weeks the Gluster brick processes have been randomly<br>

&gt;Â  Â  Â &gt; restarting.Â  Luckily they&#39;ve been doing so at non-peak times, so we<br>

&gt;Â  Â  Â &gt; didn&#39;t notice until our monitoring checks happened to pick up on<br>

&gt;Â  Â  Â zombied<br>

&gt;Â  Â  Â &gt; &#39;glusterfs&#39; process.<br>

&gt;Â  Â  Â &gt;<br>

&gt;Â  Â  Â &gt; From the logs it looks like something is blocking communication to the<br>

&gt;Â  Â  Â &gt; brick processes, and Gluster automatically restarts everything to<br>

&gt;Â  Â  Â &gt; compensate.Â  I&#39;ve so far not been able to figure out the<br>

&gt;Â  Â  Â underlying cause.<br>

&gt;Â  Â  Â &gt;<br>

&gt;Â  Â  Â &gt; I&#39;ve included log snippets from &#39;glustershd.log&#39; and<br>

&gt;Â  Â  Â &gt; &#39;etc-glusterfs-glusterd.vol.log&#39; here.Â  If anyone can provide some<br>

&gt;Â  Â  Â &gt; insight into the issue it would be greatly appreciated.Â  I&#39;ll also be<br>

&gt;Â  Â  Â &gt; happy to provide any further details as needed.<br>

&gt;Â  Â  Â &gt;<br>

&gt;Â  Â  Â &gt;<br>

&gt;Â  Â  Â &gt; [2016-01-29 05:03:47.039886] I [MSGID: 106144]<br>

&gt;Â  Â  Â &gt; [glusterd-pmap.c:274:pmap_registry_remove] 0-pmap: removing brick<br>

&gt;Â  Â  Â &gt; /export/data/brick02 on port 49155<br>

&gt;Â  Â  Â &gt; [2016-01-29 05:03:47.075521] W [socket.c:588:__socket_rwv]<br>

&gt;Â  Â  Â 0-management:<br>

&gt;Â  Â  Â &gt; readv on /var/run/gluster/53a233b05f5d4be45dc94391bc3ebfe5.socket<br>

&gt;Â  Â  Â failed<br>

&gt;Â  Â  Â &gt; (No data available)<br>

&gt;Â  Â  Â &gt; [2016-01-29 05:03:47.078282] I [MSGID: 106005]<br>

&gt;Â  Â  Â &gt; [glusterd-handler.c:4908:__glusterd_brick_rpc_notify] 0-management:<br>

&gt;Â  Â  Â &gt; Brick gluster-stor02:/export/data/brick02 has disconnected from<br>

&gt;Â  Â  Â glusterd.<br>

&gt;Â  Â  Â &gt; [2016-01-29 05:03:47.149161] W [glusterfsd.c:1236:cleanup_and_exit]<br>

&gt;Â  Â  Â &gt; (--&gt;/lib64/libpthread.so.0() [0x3e47a079d1]<br>

&gt;Â  Â  Â &gt; --&gt;/usr/sbin/glusterd(glusterfs_sigwaiter+0xcd) [0x405e6d]<br>

&gt;Â  Â  Â &gt; --&gt;/usr/sbin/glusterd(cleanup_and_exit+0x65) [0x4059d5] ) 0-: recei<br>

&gt;Â  Â  Â &gt; ved signum (15), shutting down<br>

&gt;Â  Â  Â &gt; [2016-01-29 05:03:54.067012] I [MSGID: 100030]<br>

&gt;Â  Â  Â [glusterfsd.c:2318:main]<br>

&gt;Â  Â  Â &gt; 0-/usr/sbin/glusterd: Started running /usr/sbin/glusterd version 3.7.6<br>

&gt;Â  Â  Â &gt; (args: /usr/sbin/glusterd --pid-file=/var/run/glusterd.pid)<br>

&gt;Â  Â  Â &gt; [2016-01-29 05:03:54.071901] I [MSGID: 106478] [glusterd.c:1350:init]<br>

&gt;Â  Â  Â &gt; 0-management: Maximum allowed open file descriptors set to 65536<br>

&gt;Â  Â  Â &gt; [2016-01-29 05:03:54.071935] I [MSGID: 106479] [glusterd.c:1399:init]<br>

&gt;Â  Â  Â &gt; 0-management: Using /var/lib/glusterd as working directory<br>

&gt;Â  Â  Â &gt; [2016-01-29 05:03:54.075655] E<br>

&gt;Â  Â  Â [rpc-transport.c:292:rpc_transport_load]<br>

&gt;Â  Â  Â &gt; 0-rpc-transport: /usr/lib64/glusterfs/3.7.6/rpc-transport/rdma.so:<br>

&gt;Â  Â  Â &gt; cannot open shared object file: No such file or directory<br>

&gt;Â  Â  Â &gt; [2016-01-29 05:03:54.075672] W<br>

&gt;Â  Â  Â [rpc-transport.c:296:rpc_transport_load]<br>

&gt;Â  Â  Â &gt; 0-rpc-transport: volume &#39;rdma.management&#39;: transport-type &#39;rdma&#39;<br>

&gt;Â  Â  Â is not<br>

&gt;Â  Â  Â &gt; valid or not found on this machine<br>

&gt;Â  Â  Â &gt; [2016-01-29 05:03:54.075680] W [rpcsvc.c:1597:rpcsvc_transport_create]<br>

&gt;Â  Â  Â &gt; 0-rpc-service: cannot create listener, initing the transport failed<br>

&gt;Â  Â  Â &gt; [2016-01-29 05:03:54.075687] E [MSGID: 106243] [glusterd.c:1623:init]<br>

&gt;Â  Â  Â &gt; 0-management: creation of 1 listeners failed, continuing with<br>

&gt;Â  Â  Â succeeded<br>

&gt;Â  Â  Â &gt; transport<br>

&gt;Â  Â  Â &gt; [2016-01-29 05:03:55.869717] I [MSGID: 106513]<br>

&gt;Â  Â  Â &gt; [glusterd-store.c:2047:glusterd_restore_op_version] 0-glusterd:<br>

&gt;Â  Â  Â &gt; retrieved op-version: 30702<br>

&gt;Â  Â  Â &gt; [2016-01-29 05:03:55.995747] I [MSGID: 106498]<br>

&gt;Â  Â  Â &gt; [glusterd-handler.c:3579:glusterd_friend_add_from_peerinfo]<br>

&gt;Â  Â  Â &gt; 0-management: connect returned 0<br>

&gt;Â  Â  Â &gt; [2016-01-29 05:03:55.995866] I<br>

&gt;Â  Â  Â [rpc-clnt.c:984:rpc_clnt_connection_init]<br>

&gt;Â  Â  Â &gt; 0-management: setting frame-timeout to 600<br>

&gt;Â  Â  Â &gt; [2016-01-29 05:03:56.000937] I [MSGID: 106544]<br>

&gt;Â  Â  Â &gt; [glusterd.c:159:glusterd_uuid_init] 0-management: retrieved UUID:<br>

&gt;Â  Â  Â &gt; 9b103ea8-d248-44fc-8f80-3e87f7c4971c<br>

&gt;Â  Â  Â &gt; Final graph:<br>

&gt;Â  Â  Â &gt;<br>

&gt;Â  Â  Â +------------------------------------------------------------------------------+<br>

&gt;Â  Â  Â &gt;Â  Â 1: volume management<br>

&gt;Â  Â  Â &gt;Â  Â 2:Â  Â  Â type mgmt/glusterd<br>

&gt;Â  Â  Â &gt;Â  Â 3:Â  Â  Â option rpc-auth.auth-glusterfs on<br>

&gt;Â  Â  Â &gt;Â  Â 4:Â  Â  Â option rpc-auth.auth-unix on<br>

&gt;Â  Â  Â &gt;Â  Â 5:Â  Â  Â option rpc-auth.auth-null on<br>

&gt;Â  Â  Â &gt;Â  Â 6:Â  Â  Â option rpc-auth-allow-insecure on<br>

&gt;Â  Â  Â &gt;Â  Â 7:Â  Â  Â option transport.socket.listen-backlog 128<br>

&gt;Â  Â  Â &gt;Â  Â 8:Â  Â  Â option ping-timeout 30<br>

&gt;Â  Â  Â &gt;Â  Â 9:Â  Â  Â option transport.socket.read-fail-log off<br>

&gt;Â  Â  Â &gt;Â  10:Â  Â  Â option transport.socket.keepalive-interval 2<br>

&gt;Â  Â  Â &gt;Â  11:Â  Â  Â option transport.socket.keepalive-time 10<br>

&gt;Â  Â  Â &gt;Â  12:Â  Â  Â option transport-type rdma<br>

&gt;Â  Â  Â &gt;Â  13:Â  Â  Â option working-directory /var/lib/glusterd<br>

&gt;Â  Â  Â &gt;Â  14: end-volume<br>

&gt;Â  Â  Â &gt;Â  15:<br>

&gt;Â  Â  Â &gt;<br>

&gt;Â  Â  Â +------------------------------------------------------------------------------+<br>

&gt;Â  Â  Â &gt; [2016-01-29 05:03:56.002570] I [MSGID: 101190]<br>

&gt;Â  Â  Â &gt; [event-epoll.c:632:event_dispatch_epoll_worker] 0-epoll: Started<br>

&gt;Â  Â  Â thread<br>

&gt;Â  Â  Â &gt; with index 2<br>

&gt;Â  Â  Â &gt; [2016-01-29 05:03:56.003098] I [MSGID: 101190]<br>

&gt;Â  Â  Â &gt; [event-epoll.c:632:event_dispatch_epoll_worker] 0-epoll: Started<br>

&gt;Â  Â  Â thread<br>

&gt;Â  Â  Â &gt; with index 1<br>

&gt;Â  Â  Â &gt; [2016-01-29 05:03:56.003158] I [MSGID: 101190]<br>

&gt;Â  Â  Â &gt; [event-epoll.c:632:event_dispatch_epoll_worker] 0-epoll: Started<br>

&gt;Â  Â  Â thread<br>

&gt;Â  Â  Â &gt; with index 2<br>

&gt;Â  Â  Â &gt; [2016-01-29 05:03:56.855628] I [MSGID: 106493]<br>

&gt;Â  Â  Â &gt; [glusterd-rpc-ops.c:480:__glusterd_friend_add_cbk] 0-glusterd:<br>

&gt;Â  Â  Â Received<br>

&gt;Â  Â  Â &gt; ACC from uuid: 388a8bb4-c530-44ff-838b-8f7b9e4c95db, host: 10.1.1.10,<br>

&gt;Â  Â  Â &gt; port: 0<br>

&gt;Â  Â  Â &gt; [2016-01-29 05:03:56.856787] I<br>

&gt;Â  Â  Â [rpc-clnt.c:984:rpc_clnt_connection_init]<br>

&gt;Â  Â  Â &gt; 0-nfs: setting frame-timeout to 600<br>

&gt;Â  Â  Â &gt; [2016-01-29 05:03:57.859093] I [MSGID: 106540]<br>

&gt;Â  Â  Â &gt; [glusterd-utils.c:4191:glusterd_nfs_pmap_deregister] 0-glusterd:<br>

&gt;Â  Â  Â &gt; De-registered MOUNTV3 successfully<br>

&gt;Â  Â  Â &gt; [2016-01-29 05:03:57.860228] I [MSGID: 106540]<br>

&gt;Â  Â  Â &gt; [glusterd-utils.c:4200:glusterd_nfs_pmap_deregister] 0-glusterd:<br>

&gt;Â  Â  Â &gt; De-registered MOUNTV1 successfully<br>

&gt;Â  Â  Â &gt; [2016-01-29 05:03:57.861329] I [MSGID: 106540]<br>

&gt;Â  Â  Â &gt; [glusterd-utils.c:4209:glusterd_nfs_pmap_deregister] 0-glusterd:<br>

&gt;Â  Â  Â &gt; De-registered NFSV3 successfully<br>

&gt;Â  Â  Â &gt; [2016-01-29 05:03:57.862421] I [MSGID: 106540]<br>

&gt;Â  Â  Â &gt; [glusterd-utils.c:4218:glusterd_nfs_pmap_deregister] 0-glusterd:<br>

&gt;Â  Â  Â &gt; De-registered NLM v4 successfully<br>

&gt;Â  Â  Â &gt; [2016-01-29 05:03:57.863510] I [MSGID: 106540]<br>

&gt;Â  Â  Â &gt; [glusterd-utils.c:4227:glusterd_nfs_pmap_deregister] 0-glusterd:<br>

&gt;Â  Â  Â &gt; De-registered NLM v1 successfully<br>

&gt;Â  Â  Â &gt; [2016-01-29 05:03:57.864600] I [MSGID: 106540]<br>

&gt;Â  Â  Â &gt; [glusterd-utils.c:4236:glusterd_nfs_pmap_deregister] 0-glusterd:<br>

&gt;Â  Â  Â &gt; De-registered ACL v3 successfully<br>

&gt;Â  Â  Â &gt; [2016-01-29 05:03:57.870948] W [socket.c:3009:socket_connect] 0-nfs:<br>

&gt;Â  Â  Â &gt; Ignore failed connection attempt on , (No such file or directory)<br>

&gt;Â  Â  Â &gt;<br>

&gt;Â  Â  Â &gt;<br>

&gt;Â  Â  Â &gt;<br>

&gt;Â  Â  Â &gt;<br>

&gt;Â  Â  Â &gt;<br>

&gt;Â  Â  Â &gt;<br>

&gt;Â  Â  Â &gt;<br>

&gt;Â  Â  Â &gt; [2016-01-29 05:03:47.075614] W [socket.c:588:__socket_rwv]<br>

</div></div>&gt;Â  Â  Â &gt; 0-data02-client-1: readv on <a href="http://10.1.1.10:49155" rel="noreferrer" target="_blank">10.1.1.10:49155</a> &lt;<a href="http://10.1.1.10:49155" rel="noreferrer" target="_blank">http://10.1.1.10:49155</a>&gt;<br>

<span class="">&gt;Â  Â  Â &gt; &lt;<a href="http://10.1.1.10:49155/" rel="noreferrer" target="_blank">http://10.1.1.10:49155/</a>&gt; failed (No data available)<br>

&gt;Â  Â  Â &gt; [2016-01-29 05:03:47.076871] I [MSGID: 114018]<br>

&gt;Â  Â  Â &gt; [client.c:2042:client_rpc_notify] 0-data02-client-1: disconnected from<br>

&gt;Â  Â  Â &gt; data02-client-1. Client process will keep trying to connect to glusterd<br>

&gt;Â  Â  Â &gt; until brick&#39;s port is available<br>

&gt;Â  Â  Â &gt; [2016-01-29 05:03:47.170284] W [socket.c:588:__socket_rwv] 0-glusterfs:<br>

</span>&gt;Â  Â  Â &gt; readv on <a href="http://127.0.0.1:24007" rel="noreferrer" target="_blank">127.0.0.1:24007</a> &lt;<a href="http://127.0.0.1:24007" rel="noreferrer" target="_blank">http://127.0.0.1:24007</a>&gt;<br>

<span class="">&gt;Â  Â  Â &lt;<a href="http://127.0.0.1:24007/" rel="noreferrer" target="_blank">http://127.0.0.1:24007/</a>&gt; failed (No data<br>

&gt;Â  Â  Â &gt; available)<br>

&gt;Â  Â  Â &gt; [2016-01-29 05:03:47.639163] W [socket.c:588:__socket_rwv]<br>

</span>&gt;Â  Â  Â &gt; 0-data02-client-0: readv on <a href="http://10.1.1.11:49153" rel="noreferrer" target="_blank">10.1.1.11:49153</a> &lt;<a href="http://10.1.1.11:49153" rel="noreferrer" target="_blank">http://10.1.1.11:49153</a>&gt;<br>

<div><div class="h5">&gt;Â  Â  Â &gt; &lt;<a href="http://10.1.1.11:49153/" rel="noreferrer" target="_blank">http://10.1.1.11:49153/</a>&gt; failed (No data available)<br>

&gt;Â  Â  Â &gt; [2016-01-29 05:03:47.639206] I [MSGID: 114018]<br>

&gt;Â  Â  Â &gt; [client.c:2042:client_rpc_notify] 0-data02-client-0: disconnected from<br>

&gt;Â  Â  Â &gt; data02-client-0. Client process will keep trying to connect to<br>

&gt;Â  Â  Â glusterd<br>

&gt;Â  Â  Â &gt; until brick&#39;s port is available<br>

&gt;Â  Â  Â &gt; [2016-01-29 05:03:47.640222] E [MSGID: 108006]<br>

&gt;Â  Â  Â &gt; [afr-common.c:3880:afr_notify] 0-data02-replicate-0: All<br>

&gt;Â  Â  Â subvolumes are<br>

&gt;Â  Â  Â &gt; down. Going offline until atleast one of them comes back up.<br>

&gt;Â  Â  Â &gt; [2016-01-29 05:03:57.872983] W [glusterfsd.c:1236:cleanup_and_exit]<br>

&gt;Â  Â  Â &gt; (--&gt;/lib64/libpthread.so.0() [0x3e47a079d1]<br>

&gt;Â  Â  Â &gt; --&gt;/usr/sbin/glusterfs(glusterfs_sigwaiter+0xcd) [0x405e6d]<br>

&gt;Â  Â  Â &gt; --&gt;/usr/sbin/glusterfs(cleanup_and_exit+0x65) [0x4059d5] ) 0-: rec<br>

&gt;Â  Â  Â &gt; eived signum (15), shutting down<br>

&gt;Â  Â  Â &gt; [2016-01-29 05:03:58.881541] I [MSGID: 100030]<br>

&gt;Â  Â  Â [glusterfsd.c:2318:main]<br>

&gt;Â  Â  Â &gt; 0-/usr/sbin/glusterfs: Started running /usr/sbin/glusterfs version<br>

&gt;Â  Â  Â 3.7.6<br>

&gt;Â  Â  Â &gt; (args: /usr/sbin/glusterfs -s localhost --volfile-id<br>

&gt;Â  Â  Â gluster/glustershd<br>

&gt;Â  Â  Â &gt; -p /var/lib/glusterd/<br>

&gt;Â  Â  Â &gt; glustershd/run/glustershd.pid -l /var/log/glusterfs/glustershd.log -S<br>

&gt;Â  Â  Â &gt; /var/run/gluster/8d72de580ccac07d2ecfc2491a9b1648.socket<br>

&gt;Â  Â  Â --xlator-option<br>

&gt;Â  Â  Â &gt; *replicate*.node-uuid=9b103ea8-d248-44fc-8f80-3e87f7c4971c)<br>

&gt;Â  Â  Â &gt; [2016-01-29 05:03:58.890833] I [MSGID: 101190]<br>

&gt;Â  Â  Â &gt; [event-epoll.c:632:event_dispatch_epoll_worker] 0-epoll: Started<br>

&gt;Â  Â  Â thread<br>

&gt;Â  Â  Â &gt; with index 1<br>

&gt;Â  Â  Â &gt; [2016-01-29 05:03:59.340030] I [graph.c:269:gf_add_cmdline_options]<br>

&gt;Â  Â  Â &gt; 0-data02-replicate-0: adding option &#39;node-uuid&#39; for volume<br>

&gt;Â  Â  Â &gt; &#39;data02-replicate-0&#39; with value &#39;9b103ea8-d248-44fc-8f80-3e87f7c4971c&#39;<br>

&gt;Â  Â  Â &gt; [2016-01-29 05:03:59.342682] I [MSGID: 101190]<br>

&gt;Â  Â  Â &gt; [event-epoll.c:632:event_dispatch_epoll_worker] 0-epoll: Started<br>

&gt;Â  Â  Â thread<br>

&gt;Â  Â  Â &gt; with index 2<br>

&gt;Â  Â  Â &gt; [2016-01-29 05:03:59.342742] I [MSGID: 101190]<br>

&gt;Â  Â  Â &gt; [event-epoll.c:632:event_dispatch_epoll_worker] 0-epoll: Started<br>

&gt;Â  Â  Â thread<br>

&gt;Â  Â  Â &gt; with index 3<br>

&gt;Â  Â  Â &gt; [2016-01-29 05:03:59.342827] I [MSGID: 101190]<br>

&gt;Â  Â  Â &gt; [event-epoll.c:632:event_dispatch_epoll_worker] 0-epoll: Started<br>

&gt;Â  Â  Â thread<br>

&gt;Â  Â  Â &gt; with index 4<br>

&gt;Â  Â  Â &gt; [2016-01-29 05:03:59.342892] I [MSGID: 101190]<br>

&gt;Â  Â  Â &gt; [event-epoll.c:632:event_dispatch_epoll_worker] 0-epoll: Started<br>

&gt;Â  Â  Â thread<br>

&gt;Â  Â  Â &gt; with index 5<br>

&gt;Â  Â  Â &gt; [2016-01-29 05:03:59.342917] I [MSGID: 101190]<br>

&gt;Â  Â  Â &gt; [event-epoll.c:632:event_dispatch_epoll_worker] 0-epoll: Started<br>

&gt;Â  Â  Â thread<br>

&gt;Â  Â  Â &gt; with index 6<br>

&gt;Â  Â  Â &gt; [2016-01-29 05:03:59.343563] I [MSGID: 101190]<br>

&gt;Â  Â  Â &gt; [event-epoll.c:632:event_dispatch_epoll_worker] 0-epoll: Started<br>

&gt;Â  Â  Â thread<br>

&gt;Â  Â  Â &gt; with index 8<br>

&gt;Â  Â  Â &gt; [2016-01-29 05:03:59.343569] I [MSGID: 101190]<br>

&gt;Â  Â  Â &gt; [event-epoll.c:632:event_dispatch_epoll_worker] 0-epoll: Started<br>

&gt;Â  Â  Â thread<br>

&gt;Â  Â  Â &gt; with index 7<br>

&gt;Â  Â  Â &gt; [2016-01-29 05:03:59.343657] I [MSGID: 101190]<br>

&gt;Â  Â  Â &gt; [event-epoll.c:632:event_dispatch_epoll_worker] 0-epoll: Started<br>

&gt;Â  Â  Â thread<br>

&gt;Â  Â  Â &gt; with index 9<br>

&gt;Â  Â  Â &gt; [2016-01-29 05:03:59.343705] I [MSGID: 101190]<br>

&gt;Â  Â  Â &gt; [event-epoll.c:632:event_dispatch_epoll_worker] 0-epoll: Started<br>

&gt;Â  Â  Â thread<br>

&gt;Â  Â  Â &gt; with index 11<br>

&gt;Â  Â  Â &gt; [2016-01-29 05:03:59.343710] I [MSGID: 101190]<br>

&gt;Â  Â  Â &gt; [event-epoll.c:632:event_dispatch_epoll_worker] 0-epoll: Started<br>

&gt;Â  Â  Â thread<br>

&gt;Â  Â  Â &gt; with index 10<br>

&gt;Â  Â  Â &gt; [2016-01-29 05:03:59.344278] I [MSGID: 114020] [client.c:2118:notify]<br>

&gt;Â  Â  Â &gt; 0-data02-client-0: parent translators are ready, attempting connect on<br>

&gt;Â  Â  Â &gt; transport<br>

&gt;Â  Â  Â &gt; [2016-01-29 05:03:59.346553] I [MSGID: 114020] [client.c:2118:notify]<br>

&gt;Â  Â  Â &gt; 0-data02-client-1: parent translators are ready, attempting connect on<br>

&gt;Â  Â  Â &gt; transport<br>

&gt;Â  Â  Â &gt; Final graph:<br>

&gt;Â  Â  Â &gt;<br>

&gt;Â  Â  Â +------------------------------------------------------------------------------+<br>

&gt;Â  Â  Â &gt;Â  Â 1: volume data02-client-0<br>

&gt;Â  Â  Â &gt;Â  Â 2:Â  Â  Â type protocol/client<br>

&gt;Â  Â  Â &gt;Â  Â 3:Â  Â  Â option ping-timeout 42<br>

&gt;Â  Â  Â &gt;Â  Â 4:Â  Â  Â option remote-host gluster-stor01<br>

&gt;Â  Â  Â &gt;Â  Â 5:Â  Â  Â option remote-subvolume /export/data/brick02<br>

&gt;Â  Â  Â &gt;Â  Â 6:Â  Â  Â option transport-type socket<br>

&gt;Â  Â  Â &gt;Â  Â 7:Â  Â  Â option username 5cc4f5d1-bcc8-4e06-ac74-520b20e2b452<br>

&gt;Â  Â  Â &gt;Â  Â 8:Â  Â  Â option password 66b85782-5833-4f2d-ad0e-8de75247b094F<br>

&gt;Â  Â  Â &gt;Â  Â 9:Â  Â  Â option event-threads 11<br>

&gt;Â  Â  Â &gt;Â  10: end-volume<br>

&gt;Â  Â  Â &gt;Â  11:<br>

&gt;Â  Â  Â &gt;Â  12: volume data02-client-1<br>

&gt;Â  Â  Â &gt;Â  13:Â  Â  Â type protocol/client<br>

&gt;Â  Â  Â &gt;Â  14:Â  Â  Â option ping-timeout 42<br>

&gt;Â  Â  Â &gt;Â  15:Â  Â  Â option remote-host gluster-stor02<br>

&gt;Â  Â  Â &gt;Â  16:Â  Â  Â option remote-subvolume /export/data/brick02<br>

&gt;Â  Â  Â &gt;Â  17:Â  Â  Â option transport-type socket<br>

&gt;Â  Â  Â &gt;Â  18:Â  Â  Â option username 5cc4f5d1-bcc8-4e06-ac74-520b20e2b452<br>

&gt;Â  Â  Â &gt;Â  19:Â  Â  Â option password 66b85782-5833-4f2d-ad0e-8de75247b094<br>

&gt;Â  Â  Â &gt;Â  20:Â  Â  Â option event-threads 11<br>

&gt;Â  Â  Â &gt;Â  21: end-volume<br>

&gt;Â  Â  Â &gt;Â  22:<br>

&gt;Â  Â  Â &gt;Â  23: volume data02-replicate-0<br>

&gt;Â  Â  Â &gt;Â  24:Â  Â  Â type cluster/replicate<br>

&gt;Â  Â  Â &gt;Â  25:Â  Â  Â option node-uuid 9b103ea8-d248-44fc-8f80-3e87f7c4971c<br>

&gt;Â  Â  Â &gt;Â  26:Â  Â  Â option background-self-heal-count 0<br>

&gt;Â  Â  Â &gt;Â  27:Â  Â  Â option metadata-self-heal on<br>

&gt;Â  Â  Â &gt;Â  28:Â  Â  Â option data-self-heal on<br>

&gt;Â  Â  Â &gt;Â  29:Â  Â  Â option entry-self-heal on<br>

&gt;Â  Â  Â &gt;Â  30:Â  Â  Â option self-heal-daemon enable<br>

&gt;Â  Â  Â &gt;Â  31:Â  Â  Â option iam-self-heal-daemon yes<br>

&gt;Â  Â  Â &gt;Â  32:Â  Â  Â subvolumes data02-client-0 data02-client-1<br>

&gt;Â  Â  Â &gt;Â  33: end-volume<br>

&gt;Â  Â  Â &gt;Â  34:<br>

&gt;Â  Â  Â &gt;Â  35: volume glustershd<br>

&gt;Â  Â  Â &gt;Â  36:Â  Â  Â type debug/io-stats<br>

&gt;Â  Â  Â &gt;Â  37:Â  Â  Â subvolumes data02-replicate-0<br>

&gt;Â  Â  Â &gt;Â  38: end-volume<br>

&gt;Â  Â  Â &gt;Â  39:<br>

&gt;Â  Â  Â &gt;<br>

&gt;Â  Â  Â +------------------------------------------------------------------------------+<br>

&gt;Â  Â  Â &gt; [2016-01-29 05:03:59.348913] E [MSGID: 114058]<br>

&gt;Â  Â  Â &gt; [client-handshake.c:1524:client_query_portmap_cbk] 0-data02-client-1:<br>

&gt;Â  Â  Â &gt; failed to get the port number for remote subvolume. Please run<br>

&gt;Â  Â  Â &#39;gluster<br>

&gt;Â  Â  Â &gt; volume status&#39; on server to see if brick process<br>

&gt;Â  Â  Â &gt; is running.<br>

&gt;Â  Â  Â &gt; [2016-01-29 05:03:59.348960] I [MSGID: 114018]<br>

&gt;Â  Â  Â &gt; [client.c:2042:client_rpc_notify] 0-data02-client-1: disconnected from<br>

&gt;Â  Â  Â &gt; data02-client-1. Client process will keep trying to connect to<br>

&gt;Â  Â  Â glusterd<br>

&gt;Â  Â  Â &gt; until brick&#39;s port is available<br>

&gt;Â  Â  Â &gt; [2016-01-29 05:03:59.436909] E [MSGID: 114058]<br>

&gt;Â  Â  Â &gt; [client-handshake.c:1524:client_query_portmap_cbk] 0-data02-client-0:<br>

&gt;Â  Â  Â &gt; failed to get the port number for remote subvolume. Please run<br>

&gt;Â  Â  Â &#39;gluster<br>

&gt;Â  Â  Â &gt; volume status&#39; on server to see if brick process<br>

&gt;Â  Â  Â &gt; is running.<br>

&gt;Â  Â  Â &gt; [2016-01-29 05:03:59.436974] I [MSGID: 114018]<br>

&gt;Â  Â  Â &gt; [client.c:2042:client_rpc_notify] 0-data02-client-0: disconnected from<br>

&gt;Â  Â  Â &gt; data02-client-0. Client process will keep trying to connect to<br>

&gt;Â  Â  Â glusterd<br>

&gt;Â  Â  Â &gt; until brick&#39;s port is available<br>

&gt;Â  Â  Â &gt; [2016-01-29 05:03:59.436991] E [MSGID: 108006]<br>

&gt;Â  Â  Â &gt; [afr-common.c:3880:afr_notify] 0-data02-replicate-0: All<br>

&gt;Â  Â  Â subvolumes are<br>

&gt;Â  Â  Â &gt; down. Going offline until atleast one of them comes back up.<br>

&gt;Â  Â  Â &gt; [2016-01-29 05:04:02.886317] I [rpc-clnt.c:1847:rpc_clnt_reconfig]<br>

&gt;Â  Â  Â &gt; 0-data02-client-0: changing port to 49153 (from 0)<br>

&gt;Â  Â  Â &gt; [2016-01-29 05:04:02.888761] I [rpc-clnt.c:1847:rpc_clnt_reconfig]<br>

&gt;Â  Â  Â &gt; 0-data02-client-1: changing port to 49155 (from 0)<br>

&gt;Â  Â  Â &gt; [2016-01-29 05:04:02.891105] I [MSGID: 114057]<br>

&gt;Â  Â  Â &gt; [client-handshake.c:1437:select_server_supported_programs]<br>

&gt;Â  Â  Â &gt; 0-data02-client-0: Using Program GlusterFS 3.3, Num (1298437),<br>

&gt;Â  Â  Â Version (330)<br>

&gt;Â  Â  Â &gt; [2016-01-29 05:04:02.891360] I [MSGID: 114046]<br>

&gt;Â  Â  Â &gt; [client-handshake.c:1213:client_setvolume_cbk] 0-data02-client-0:<br>

&gt;Â  Â  Â &gt; Connected to data02-client-0, attached to remote volume<br>

&gt;Â  Â  Â &gt; &#39;/export/data/brick02&#39;.<br>

&gt;Â  Â  Â &gt; [2016-01-29 05:04:02.891373] I [MSGID: 114047]<br>

&gt;Â  Â  Â &gt; [client-handshake.c:1224:client_setvolume_cbk] 0-data02-client-0:<br>

&gt;Â  Â  Â Server<br>

&gt;Â  Â  Â &gt; and Client lk-version numbers are not same, reopening the fds<br>

&gt;Â  Â  Â &gt; [2016-01-29 05:04:02.891403] I [MSGID: 108005]<br>

&gt;Â  Â  Â &gt; [afr-common.c:3841:afr_notify] 0-data02-replicate-0: Subvolume<br>

&gt;Â  Â  Â &gt; &#39;data02-client-0&#39; came back up; going online.<br>

&gt;Â  Â  Â &gt; [2016-01-29 05:04:02.891518] I [MSGID: 114035]<br>

&gt;Â  Â  Â &gt; [client-handshake.c:193:client_set_lk_version_cbk] 0-data02-client-0:<br>

&gt;Â  Â  Â &gt; Server lk version = 1<br>

&gt;Â  Â  Â &gt; [2016-01-29 05:04:02.893074] I [MSGID: 114057]<br>

&gt;Â  Â  Â &gt; [client-handshake.c:1437:select_server_supported_programs]<br>

&gt;Â  Â  Â &gt; 0-data02-client-1: Using Program GlusterFS 3.3, Num (1298437),<br>

&gt;Â  Â  Â Version (330)<br>

&gt;Â  Â  Â &gt; [2016-01-29 05:04:02.893251] I [MSGID: 114046]<br>

&gt;Â  Â  Â &gt; [client-handshake.c:1213:client_setvolume_cbk] 0-data02-client-1:<br>

&gt;Â  Â  Â &gt; Connected to data02-client-1, attached to remote volume<br>

&gt;Â  Â  Â &gt; &#39;/export/data/brick02&#39;.<br>

&gt;Â  Â  Â &gt; [2016-01-29 05:04:02.893276] I [MSGID: 114047]<br>

&gt;Â  Â  Â &gt; [client-handshake.c:1224:client_setvolume_cbk] 0-data02-client-1:<br>

&gt;Â  Â  Â Server<br>

&gt;Â  Â  Â &gt; and Client lk-version numbers are not same, reopening the fds<br>

&gt;Â  Â  Â &gt; [2016-01-29 05:04:02.893401] I [MSGID: 114035]<br>

&gt;Â  Â  Â &gt; [client-handshake.c:193:client_set_lk_version_cbk] 0-data02-client-1:<br>

&gt;Â  Â  Â &gt; Server lk version = 1<br>

&gt;Â  Â  Â &gt;<br>

&gt;Â  Â  Â &gt;<br>

&gt;Â  Â  Â &gt; _______________________________________________<br>

&gt;Â  Â  Â &gt; Gluster-devel mailing list<br>

</div></div>&gt;Â  Â  Â &gt; <a href="mailto:Gluster-devel@gluster.org">Gluster-devel@gluster.org</a> &lt;mailto:<a href="mailto:Gluster-devel@gluster.org">Gluster-devel@gluster.org</a>&gt;<br>

&gt;Â  Â  Â &gt; <a href="http://www.gluster.org/mailman/listinfo/gluster-devel" rel="noreferrer" target="_blank">http://www.gluster.org/mailman/listinfo/gluster-devel</a><br>

&gt;Â  Â  Â &gt;<br>

&gt;<br>

&gt;<br>

</blockquote></div><br></div>