<html><body><div style="font-family: times new roman, new york, times, serif; font-size: 12pt; color: #000000"><div><br></div><div>Yes Gandalf, I think you are missing a point, the way we configure EC.<br></div><div>To explain that I would like to take less number of disks. Lets say you have 6 disk of 1TB each on 6 different nodes.<br></div><div><br></div><div>1- Replica 2 using gluster<br></div><div>There will be 3 sub volume of replica - afr-1, afr-2,&nbsp; afr-3 each with pair of 2 disk.<br></div><div>A file name file.txt will be saved on 2 disks of any one sub volume. That means you are cutting the storage space to half - 3TB<br></div><div>Also at any point of time you can afford to kill only 1 brick. <br></div><div><br></div><div><div>2- Replica 3 using gluster</div><div>There will be 2 sub volume of replica - afr-1, afr-2, each with 3 disks.</div><div>A file name file.txt will be saved on 3 disks of any one sub volume lets say afr-1. That means you are cutting the storage space to 1/3rd&nbsp; - 2TB</div><div>Also at any point of time you can afford to kill only 2 bricks of afr-1.</div><div><br></div><div>3 - EC with redundancy 2 that is 4+2<br></div><div>The over all storage space you get is 4TB and any 2 bricks can be down at any point of time. So it is as good as replica 3 but providing more space.<br></div><div><br></div><div>Now when you give example of 108 disks. You should not have 106+2 configuration&nbsp; of EC as you were saying. That is really very poor setup and you are right about redundancy.<br></div><div>But when you say that you will create replica 3 that means you will have 108/3 = 36 sub volume each with on 1TB storage space.&nbsp; So you will get 36TB of storage if each brick is of 1TB.<br></div><div><br></div><div>So I would say that you should create EC with configuration of 4+2. There will be 108/6 = 18 sub volumes each with&nbsp; 4TB of capacity. Total space you get is 18 X 4 = 72TB of data.<br></div><div><br></div><div>In both the above cases even if you kill 2 bricks from the same volume, data will be served. If you kill 3rd brick from the same sub volume you will loose data in&nbsp; replica as well as in EC sub volume.</div><br><div>----<br></div><div>Ashish<br></div><div><br></div><div><br></div><div><br></div><div><br></div></div><div><br></div><hr id="zwchr"><div style="color:#000;font-weight:normal;font-style:normal;text-decoration:none;font-family:Helvetica,Arial,sans-serif;font-size:12pt;" data-mce-style="color: #000; font-weight: normal; font-style: normal; text-decoration: none; font-family: Helvetica,Arial,sans-serif; font-size: 12pt;"><b>From: </b>"Gandalf Corvotempesta" &lt;gandalf.corvotempesta@gmail.com&gt;<br><b>To: </b>"Ashish Pandey" &lt;aspandey@redhat.com&gt;<br><b>Cc: </b>gluster-users@gluster.org<br><b>Sent: </b>Tuesday, August 9, 2016 8:33:31 PM<br><b>Subject: </b>Re: [Gluster-users] Need help to design a data storage<br><div><br></div><p dir="ltr">Il 09 ago 2016 10:06 AM, "Ashish Pandey" &lt;<a href="mailto:aspandey@redhat.com" target="_blank" data-mce-href="mailto:aspandey@redhat.com">aspandey@redhat.com</a>&gt; ha scritto:<br> &gt; If your main concern is data redundancy, I would suggest you to go for erasure coded volume provided by gluster.</p><p dir="ltr">Anyway EC volumes has a lower redundancy level than standard replicated volumes.</p><p dir="ltr">Let's assume a 9 nodes cluster with 12 disks on each node, redundancy set to 2</p><p dir="ltr">You have 9*12 = 108 disks/bricks<br> with redundancy 2 you can loose up to 2 bricks/disks at the same time before loosing data. Using cheap sata disks (gluster is made to run on commodity hardware) loosing 3 disks over 108 in a very short time could happen frequently and this frequency grow as cluster grows</p><p dir="ltr">With a standard replicated volume,&nbsp; with replica 3, you can loose up to 3 servers (not bricks) because each brick in a replica set must be on a different server.</p><p dir="ltr">I think EC is something like raid6 (with more "parity") and standard replication is like raid10 but with 3 disks for each mirror.</p><p dir="ltr">Raid10 is safer as you can loose as many disks as you want,&nbsp; if in different replica set, while raid 6 can loose up to 2 disks in the whole cluster<br> Higher the number of disks, higher the probability of data loss with raid6/EC</p><p dir="ltr">Am i missed something?</p><br>_______________________________________________<br>Gluster-users mailing list<br>Gluster-users@gluster.org<br>http://www.gluster.org/mailman/listinfo/gluster-users</div><div><br></div></div></body></html>