<html>
  <head>

    <meta http-equiv="content-type" content="text/html; charset=utf-8">
  </head>
  <body bgcolor="#FFFFFF" text="#000000">
    <p>This is the reason behind my earlier questions re replacing a
      node.</p>
    <p><br>
    </p>
    <p>I had *yet another* disk failure. However I have now replaced all
      desktop drives on the server (WD Blacks &amp; Blues) with WD reds
      which are rated for 24/7 NAS operation. Two nodes are 4*WD red in
      Zfs Raid10, one node has 8 SAS drives in raid 10.</p>
    <p><br>
    </p>
    <p>However :( the ZFS resilver on node vng revealed data corruption
      in one file:</p>
    <p><br>
    </p>
    <p><tt> 
/tank/vmdata/datastore4/.glusterfs/d7/0f/d70f39ea-e831-45ef-b2bc-899d921ea572</tt></p>
    <p><br>
    </p>
    <p>However checking its hard link, its not linked to a data file,
      rather to what was presumably a shard of the data file</p>
    <blockquote>
      <p><tt>find . -inum 291341</tt><tt><br>
        </tt><tt>./.shard/719041d0-d755-4bc6-a5fc-6b59071fac17.911</tt><tt><br>
        </tt><tt>./.glusterfs/d7/0f/d70f39ea-e831-45ef-b2bc-899d921ea572</tt></p>
    </blockquote>
    <p><br>
    </p>
    <p>Checking the shard directory, there are 1024 64MB
      "719041d0-d755-4bc6-a5fc-6b59071fac17.*" files. Checking the
      actually gluster mount, there are no files with a gfid of
      "719041d0-d755-4bc6-a5fc-6b59071fac17". All three nodes are the
      same in this regard.</p>
    <p><br>
    </p>
    <p>1.    I'm not to concerned about it as it seems to be a result of
      straight out undetected disk corruption, a result of a crappy
      setup on our part, since corrected.</p>
    <p>2.    I have no idea as to what image file was originally
      represented by these shards or if its possible to find out. After
      a quick check they all appear to be ok.</p>
    <p>3.     Not sure what to do about it - should I just delete the
      shards?</p>
    <p><br>
    </p>
    <p>Or a broader note, I contemplating putting together some scripts
      to do basically integrity checks on a sharded setup:</p>
    <p>- Check for orphaned shards</p>
    <p>- check for files missing shards (is it possible)</p>
    <p>- Anything else?</p>
    <p><br>
    </p>
    <p>I'd also like to write a service (c/c++) that can do an online
      scrub (md5 check) of shards. Would that be possible via the gfapi
      or is to high level for that?</p>
    <p><br>
    </p>
    <p>Thanks,<br>
    </p>
    <p><br>
    </p>
    <p><br>
    </p>
    <br>
    <pre class="moz-signature" cols="72">-- 
Lindsay Mathieson</pre>
  </body>
</html>