<div dir="ltr"><br><div class="gmail_extra"><br><div class="gmail_quote">On Mon, Nov 14, 2016 at 8:24 PM, Niels de Vos <span dir="ltr">&lt;<a href="mailto:ndevos@redhat.com" target="_blank">ndevos@redhat.com</a>&gt;</span> wrote:<br><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex"><div class="HOEnZb"><div class="h5">On Mon, Nov 14, 2016 at 04:50:44PM +0530, Pranith Kumar Karampuri wrote:<br>
&gt; On Mon, Nov 14, 2016 at 4:38 PM, Gandalf Corvotempesta &lt;<br>
&gt; <a href="mailto:gandalf.corvotempesta@gmail.com">gandalf.corvotempesta@gmail.<wbr>com</a>&gt; wrote:<br>
&gt;<br>
&gt; &gt; 2016-11-14 11:50 GMT+01:00 Pranith Kumar Karampuri &lt;<a href="mailto:pkarampu@redhat.com">pkarampu@redhat.com</a>&gt;:<br>
&gt; &gt; &gt; To make gluster stable for VM images we had to add all these new features<br>
&gt; &gt; &gt; and then fix all the bugs Lindsay/Kevin reported. We just fixed a<br>
&gt; &gt; corruption<br>
&gt; &gt; &gt; issue that can happen with replace-brick which will be available in 3.9.0<br>
&gt; &gt; &gt; and 3.8.6. The only 2 other known issues that can lead to corruptions are<br>
&gt; &gt; &gt; add-brick and the bug you filed Gandalf. Krutika just 5 minutes back saw<br>
&gt; &gt; &gt; something that could possibly lead to the corruption for the add-brick<br>
&gt; &gt; bug.<br>
&gt; &gt; &gt; Is that really the Root cause? We are not sure yet, we need more time.<br>
&gt; &gt; &gt; Without Lindsay/Kevin/David Gossage&#39;s support this workload would have<br>
&gt; &gt; been<br>
&gt; &gt; &gt; in much worse condition. These bugs are not easy to re-create thus not<br>
&gt; &gt; easy<br>
&gt; &gt; &gt; to fix. At least that has been Krutika&#39;s experience.<br>
&gt; &gt;<br>
&gt; &gt; Ok, but this changes should be placed in a &quot;test&quot; version and not<br>
&gt; &gt; marked as stable.<br>
&gt; &gt; I don&#39;t see any development release, only stable releases here.<br>
&gt; &gt; Do you want all features ? Try the &quot;beta/rc/unstable/alpha/dev&quot; version.<br>
&gt; &gt; Do you want the stable version without known bugs but slow on VMs<br>
&gt; &gt; workload? Use the &quot;-stable&quot; version.<br>
&gt; &gt;<br>
&gt; &gt; If you relase as stable, users tend to upgrade their cluster and use<br>
&gt; &gt; the newer feature (that you are marking as stable).<br>
&gt; &gt; What If I upgrade a production cluster to a stable version and try to<br>
&gt; &gt; add-brick that lead to data corruption ?<br>
&gt; &gt; I have to restore terabytes worth of data? Gluster is made for<br>
&gt; &gt; scale-out, what I my cluster was made with 500TB of VMs ?<br>
&gt; &gt; Try to restore 500TB from a backup....................<br>
&gt; &gt;<br>
&gt; &gt; This is unacceptable. add-brick/replace-brick should be common &quot;daily&quot;<br>
&gt; &gt; operations. You should heavy check these for regression or bug.<br>
&gt; &gt;<br>
&gt;<br>
&gt; This is a very good point. Adding other maintainers.<br></div></div></blockquote><div><br></div><div>I think Pranith&#39;s intention here was to bring to other maintainers&#39; attention the point about<br></div><div>development releases vs stable releases although his inline comment may have been a<br></div><div>bit out-of-place (I was part of the discussion that took place before this reply of his, in office<br>today, hence taking the liberty to clarify).<br></div><div><br></div><div>-Krutika<br><br></div><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex"><div class="HOEnZb"><div class="h5">
<br>
</div></div>Obviously this is unacceptible for versions that have sharding as a<br>
functional (not experimental) feature. All supported features are<br>
expected to function without major problems (like corruption) for all<br>
standard Gluster operations. Add-brick/replace-brick are surely such<br>
Gluster operations.<br>
<br>
Of course it is possible that this does not always happen, and our tests<br>
did not catch the problem. In that case, we really need to have a bug<br>
report with all the details, and preferably a script that can be used to<br>
reproduce and detect the failure.<br>
<br>
FWIW sharding has several open bugs (like any other component), but it<br>
is not immediately clear to me if the problem reported in this email is<br>
in Bugzilla yet. These are the bugs that are expected to get fixed in<br>
upcoming minor releases:<br>
  <a href="https://bugzilla.redhat.com/buglist.cgi?component=sharding&amp;f1=bug_status&amp;f2=version&amp;o1=notequals&amp;o2=notequals&amp;product=GlusterFS&amp;query_format=advanced&amp;v1=CLOSED&amp;v2=mainline" rel="noreferrer" target="_blank">https://bugzilla.redhat.com/<wbr>buglist.cgi?component=<wbr>sharding&amp;f1=bug_status&amp;f2=<wbr>version&amp;o1=notequals&amp;o2=<wbr>notequals&amp;product=GlusterFS&amp;<wbr>query_format=advanced&amp;v1=<wbr>CLOSED&amp;v2=mainline</a><br>
<br>
HTH,<br>
Niels<br>
<br>______________________________<wbr>_________________<br>
Gluster-users mailing list<br>
<a href="mailto:Gluster-users@gluster.org">Gluster-users@gluster.org</a><br>
<a href="http://www.gluster.org/mailman/listinfo/gluster-users" rel="noreferrer" target="_blank">http://www.gluster.org/<wbr>mailman/listinfo/gluster-users</a><br></blockquote></div><br></div></div>