<div dir="ltr">Hi Pranith,<div><br></div><div>Will this patch improve the heal performance on distributed disperse volume?. Currently we are getting 10MB/s heal performance on 10G backed network. SHD daemon takes 5 days to complete the heal operation for single 4TB( 3.5 TB data) disk failure.</div><div><br></div><div>Regards,</div><div>Backer</div><div class="gmail_extra"><br><div class="gmail_quote">On Wed, Oct 14, 2015 at 9:08 PM, Ben Turner <span dir="ltr">&lt;<a href="mailto:bturner@redhat.com" target="_blank">bturner@redhat.com</a>&gt;</span> wrote:<br><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex"><div class="HOEnZb"><div class="h5">----- Original Message -----<br>
&gt; From: &quot;Pranith Kumar Karampuri&quot; &lt;<a href="mailto:pkarampu@redhat.com">pkarampu@redhat.com</a>&gt;<br>
&gt; To: &quot;Ben Turner&quot; &lt;<a href="mailto:bturner@redhat.com">bturner@redhat.com</a>&gt;, &quot;Humble Devassy Chirammal&quot; &lt;<a href="mailto:humble.devassy@gmail.com">humble.devassy@gmail.com</a>&gt;, &quot;Atin Mukherjee&quot;<br>
&gt; &lt;<a href="mailto:atin.mukherjee83@gmail.com">atin.mukherjee83@gmail.com</a>&gt;<br>
&gt; Cc: &quot;gluster-users&quot; &lt;<a href="mailto:gluster-users@gluster.org">gluster-users@gluster.org</a>&gt;<br>
&gt; Sent: Wednesday, October 14, 2015 1:39:14 AM<br>
&gt; Subject: Re: [Gluster-users] Speed up heal performance<br>
&gt;<br>
&gt;<br>
&gt;<br>
&gt; On 10/13/2015 07:11 PM, Ben Turner wrote:<br>
&gt; &gt; ----- Original Message -----<br>
&gt; &gt;&gt; From: &quot;Humble Devassy Chirammal&quot; &lt;<a href="mailto:humble.devassy@gmail.com">humble.devassy@gmail.com</a>&gt;<br>
&gt; &gt;&gt; To: &quot;Atin Mukherjee&quot; &lt;<a href="mailto:atin.mukherjee83@gmail.com">atin.mukherjee83@gmail.com</a>&gt;<br>
&gt; &gt;&gt; Cc: &quot;Ben Turner&quot; &lt;<a href="mailto:bturner@redhat.com">bturner@redhat.com</a>&gt;, &quot;gluster-users&quot;<br>
&gt; &gt;&gt; &lt;<a href="mailto:gluster-users@gluster.org">gluster-users@gluster.org</a>&gt;<br>
&gt; &gt;&gt; Sent: Tuesday, October 13, 2015 6:14:46 AM<br>
&gt; &gt;&gt; Subject: Re: [Gluster-users] Speed up heal performance<br>
&gt; &gt;&gt;<br>
&gt; &gt;&gt;&gt; Good news is we already have a WIP patch <a href="http://review.glusterd.org/10851" rel="noreferrer" target="_blank">review.glusterd.org/10851</a> to<br>
&gt; &gt;&gt; introduce multi threaded shd. Credits to Richard/Shreyas from facebook for<br>
&gt; &gt;&gt; this. IIRC, we also have a BZ for the same<br>
&gt; &gt;&gt; Isnt it the same bugzilla (<br>
&gt; &gt;&gt; <a href="https://bugzilla.redhat.com/show_bug.cgi?id=1221737" rel="noreferrer" target="_blank">https://bugzilla.redhat.com/show_bug.cgi?id=1221737</a>) mentioned in the<br>
&gt; &gt;&gt; commit log?<br>
&gt; &gt; @Lindsay - No need for a BZ, the above BZ should suffice.<br>
&gt; &gt;<br>
&gt; &gt; @Anyone - In the commit I see:<br>
&gt; &gt;<br>
&gt; &gt;          { .key        = &quot;cluster.shd-max-threads&quot;,<br>
&gt; &gt;            .voltype    = &quot;cluster/replicate&quot;,<br>
&gt; &gt;            .option     = &quot;shd-max-threads&quot;,<br>
&gt; &gt;            .op_version = 1,<br>
&gt; &gt;            .flags      = OPT_FLAG_CLIENT_OPT<br>
&gt; &gt;          },<br>
&gt; &gt;          { .key        = &quot;cluster.shd-thread-batch-size&quot;,<br>
&gt; &gt;            .voltype    = &quot;cluster/replicate&quot;,<br>
&gt; &gt;            .option     = &quot;shd-thread-batch-size&quot;,<br>
&gt; &gt;            .op_version = 1,<br>
&gt; &gt;            .flags      = OPT_FLAG_CLIENT_OPT<br>
&gt; &gt;          },<br>
&gt; &gt;<br>
&gt; &gt; So we can tune max threads and thread batch size?  I understand max<br>
&gt; &gt; threads, but what is batch size?  In my testing on 10G NICs with a backend<br>
&gt; &gt; that will service 10G throughput I see about 1.5 GB per minute of SH<br>
&gt; &gt; throughput.  To Lindsay&#39;s other point, will this patch improve SH<br>
&gt; &gt; throughput?  My systems can write at 1.5 GB / Sec and NICs can to 1.2 GB /<br>
&gt; &gt; sec but I only see ~1.5 GB per _minute_ of SH throughput.  If we can not<br>
&gt; &gt; only make SH multi threaded, but improve the performance of a single<br>
&gt; &gt; thread that would be awesome.  Super bonus points if we can have some sort<br>
&gt; &gt; of tunible that can limit the bandwidth each thread can consume.  It would<br>
&gt; &gt; be great to be able to crank things up when the systems aren&#39;t busy and<br>
&gt; &gt; slow things down when load increases.<br>
&gt; This patch is not merged because I thought we needed throttling feature<br>
&gt; to go in before we can merge this for better control of the self-heal<br>
&gt; speed. We are doing that for 3.8. So expect to see both of these for 3.8.<br>
<br>
</div></div>Great news!  You da man Pranith, next time I am on your side of the world beers are on me :)<br>
<span class="HOEnZb"><font color="#888888"><br>
-b<br>
</font></span><div class="HOEnZb"><div class="h5"><br>
&gt;<br>
&gt; Pranith<br>
&gt; &gt;<br>
&gt; &gt; -b<br>
&gt; &gt;<br>
&gt; &gt;<br>
&gt; &gt;&gt; --Humble<br>
&gt; &gt;&gt;<br>
&gt; &gt;&gt;<br>
&gt; &gt;&gt; On Tue, Oct 13, 2015 at 7:26 AM, Atin Mukherjee<br>
&gt; &gt;&gt; &lt;<a href="mailto:atin.mukherjee83@gmail.com">atin.mukherjee83@gmail.com</a>&gt;<br>
&gt; &gt;&gt; wrote:<br>
&gt; &gt;&gt;<br>
&gt; &gt;&gt;&gt; -Atin<br>
&gt; &gt;&gt;&gt; Sent from one plus one<br>
&gt; &gt;&gt;&gt; On Oct 13, 2015 3:16 AM, &quot;Ben Turner&quot; &lt;<a href="mailto:bturner@redhat.com">bturner@redhat.com</a>&gt; wrote:<br>
&gt; &gt;&gt;&gt;&gt; ----- Original Message -----<br>
&gt; &gt;&gt;&gt;&gt;&gt; From: &quot;Lindsay Mathieson&quot; &lt;<a href="mailto:lindsay.mathieson@gmail.com">lindsay.mathieson@gmail.com</a>&gt;<br>
&gt; &gt;&gt;&gt;&gt;&gt; To: &quot;gluster-users&quot; &lt;<a href="mailto:gluster-users@gluster.org">gluster-users@gluster.org</a>&gt;<br>
&gt; &gt;&gt;&gt;&gt;&gt; Sent: Friday, October 9, 2015 9:18:11 AM<br>
&gt; &gt;&gt;&gt;&gt;&gt; Subject: [Gluster-users] Speed up heal performance<br>
&gt; &gt;&gt;&gt;&gt;&gt;<br>
&gt; &gt;&gt;&gt;&gt;&gt; Is there any way to max out heal performance? My cluster is unused<br>
&gt; &gt;&gt;&gt; overnight,<br>
&gt; &gt;&gt;&gt;&gt;&gt; and lightly used at lunchtimes, it would be handy to speed up a heal.<br>
&gt; &gt;&gt;&gt;&gt;&gt;<br>
&gt; &gt;&gt;&gt;&gt;&gt; The only tuneable I found was cluster.self-heal-window-size, which<br>
&gt; &gt;&gt;&gt; doesn&#39;t<br>
&gt; &gt;&gt;&gt;&gt;&gt; seem to make much difference.<br>
&gt; &gt;&gt;&gt;&gt; I don&#39;t know of any way to speed this up, maybe someone else could chime<br>
&gt; &gt;&gt;&gt; in here that knows the heal daemon better than me.  Maybe you could open<br>
&gt; &gt;&gt;&gt; an<br>
&gt; &gt;&gt;&gt; RFE on this?  In my testing I only see 2 files getting healed at a time<br>
&gt; &gt;&gt;&gt; per<br>
&gt; &gt;&gt;&gt; replica pair.  I would like to see this be multi threaded(if its not<br>
&gt; &gt;&gt;&gt; already) with the ability to tune it to control resource usage(similar to<br>
&gt; &gt;&gt;&gt; what we did in the rebalance refactoring done recently).  If you let me<br>
&gt; &gt;&gt;&gt; know the BZ # I&#39;ll add my data + suggestions, I have been testing this<br>
&gt; &gt;&gt;&gt; pretty extensively in recent weeks and good data + some ideas on how to<br>
&gt; &gt;&gt;&gt; speed things up.<br>
&gt; &gt;&gt;&gt; Good news is we already have a WIP patch <a href="http://review.glusterd.org/10851" rel="noreferrer" target="_blank">review.glusterd.org/10851</a> to<br>
&gt; &gt;&gt;&gt; introduce multi threaded shd. Credits to Richard/Shreyas from facebook<br>
&gt; &gt;&gt;&gt; for<br>
&gt; &gt;&gt;&gt; this. IIRC, we also have a BZ for the same but the patch is in rfc as of<br>
&gt; &gt;&gt;&gt; now. AFAIK, this is a candidate to land in 3.8 as well, Vijay can correct<br>
&gt; &gt;&gt;&gt; me otherwise.<br>
&gt; &gt;&gt;&gt;&gt; -b<br>
&gt; &gt;&gt;&gt;&gt;<br>
&gt; &gt;&gt;&gt;&gt;&gt; thanks,<br>
&gt; &gt;&gt;&gt;&gt;&gt; --<br>
&gt; &gt;&gt;&gt;&gt;&gt; Lindsay<br>
&gt; &gt;&gt;&gt;&gt;&gt;<br>
&gt; &gt;&gt;&gt;&gt;&gt; _______________________________________________<br>
&gt; &gt;&gt;&gt;&gt;&gt; Gluster-users mailing list<br>
&gt; &gt;&gt;&gt;&gt;&gt; <a href="mailto:Gluster-users@gluster.org">Gluster-users@gluster.org</a><br>
&gt; &gt;&gt;&gt;&gt;&gt; <a href="http://www.gluster.org/mailman/listinfo/gluster-users" rel="noreferrer" target="_blank">http://www.gluster.org/mailman/listinfo/gluster-users</a><br>
&gt; &gt;&gt;&gt;&gt; _______________________________________________<br>
&gt; &gt;&gt;&gt;&gt; Gluster-users mailing list<br>
&gt; &gt;&gt;&gt;&gt; <a href="mailto:Gluster-users@gluster.org">Gluster-users@gluster.org</a><br>
&gt; &gt;&gt;&gt;&gt; <a href="http://www.gluster.org/mailman/listinfo/gluster-users" rel="noreferrer" target="_blank">http://www.gluster.org/mailman/listinfo/gluster-users</a><br>
&gt; &gt;&gt;&gt; _______________________________________________<br>
&gt; &gt;&gt;&gt; Gluster-users mailing list<br>
&gt; &gt;&gt;&gt; <a href="mailto:Gluster-users@gluster.org">Gluster-users@gluster.org</a><br>
&gt; &gt;&gt;&gt; <a href="http://www.gluster.org/mailman/listinfo/gluster-users" rel="noreferrer" target="_blank">http://www.gluster.org/mailman/listinfo/gluster-users</a><br>
&gt; &gt;&gt;&gt;<br>
&gt; &gt; _______________________________________________<br>
&gt; &gt; Gluster-users mailing list<br>
&gt; &gt; <a href="mailto:Gluster-users@gluster.org">Gluster-users@gluster.org</a><br>
&gt; &gt; <a href="http://www.gluster.org/mailman/listinfo/gluster-users" rel="noreferrer" target="_blank">http://www.gluster.org/mailman/listinfo/gluster-users</a><br>
&gt;<br>
&gt;<br>
_______________________________________________<br>
Gluster-users mailing list<br>
<a href="mailto:Gluster-users@gluster.org">Gluster-users@gluster.org</a><br>
<a href="http://www.gluster.org/mailman/listinfo/gluster-users" rel="noreferrer" target="_blank">http://www.gluster.org/mailman/listinfo/gluster-users</a><br>
</div></div></blockquote></div><br><br clear="all"><div><br></div><div class="gmail_signature"><br><br></div>
</div></div>