<div dir="ltr"><br><div class="gmail_extra">Hi kevin,</div><div class="gmail_extra"><br><div class="gmail_quote">On 15 November 2016 at 20:56, Kevin Leigeb <span dir="ltr">&lt;<a href="mailto:kevin.leigeb@wisc.edu" target="_blank">kevin.leigeb@wisc.edu</a>&gt;</span> wrote:<br><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">





<div lang="EN-US" link="#0563C1" vlink="#954F72">
<div class="m_-3529927827351627520WordSection1">
<p class="MsoNormal">All -<u></u><u></u></p>
<p class="MsoNormal"><u></u> <u></u></p>
<p class="MsoNormal">We recently moved from an old cluster running 3.7.9 to a new one running 3.8.4. To move the data we rsync’d all files from the old gluster nodes that were not in the .glusterfs directory and had a size of greater-than zero (to avoid stub
 files) through the front-end of the new cluster. </p></div></div></blockquote><div><br></div><div>Did you rsync via the mount point or directly from the bricks?</div><div> </div><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex"><div lang="EN-US" link="#0563C1" vlink="#954F72"><div class="m_-3529927827351627520WordSection1"><p class="MsoNormal">However, it has recently come to our attention that some of the files copied over were already “corrupted” on the old back-end. That is, these files had permissions of 1000 (like a stub file) yet were the full
 size of the actual file.</p></div></div></blockquote><div><br></div><div>Does this correspond to a file permission of ___T when viewed using ls? If yes, these are dht linkto files. They were possibly created during a rebalance and left behind because the file was skipped. They should be ignored when accessing the gluster volume via the mount point.</div><div><br></div><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex"><div lang="EN-US" link="#0563C1" vlink="#954F72"><div class="m_-3529927827351627520WordSection1"><p class="MsoNormal"> In some cases, these were the only copies of the file that existed at all on any of the bricks, in others, another version of the file existed that was also full size and had the proper permissions. In some cases, we believe, these
 correct files were rsync’d but then overwritten by the 1000 permission version resulting in a useless file on the new cluster.
<u></u><u></u></p>
<p class="MsoNormal"><u></u> </p></div></div></blockquote><div>This sounds like you were running rsync directly on the bricks. Can you please confirm if that is the case?</div><div> </div><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex"><div lang="EN-US" link="#0563C1" vlink="#954F72"><div class="m_-3529927827351627520WordSection1"><p class="MsoNormal"><u></u></p>
<p class="MsoNormal">These files are thought by the OS to be binaries when trying to open them using vim, but they are actually text files (or at least were originally). We can cat the file to see that it has a length of zero and so far that is our only reliable
 test to find which files are indeed corrupted (find . -type f | xargs wc -l). With nearly 50 million files on our cluster, this is really a non-starter because of the speed.<u></u><u></u></p>
<p class="MsoNormal"><u></u> <u></u></p>
<p class="MsoNormal">Has anyone seen this issue previously? We’re hoping to find a solution that doesn’t involve overthinking the problem and thought this might be a great place to start.<u></u><u></u></p>
<p class="MsoNormal"><u></u> <u></u></p>
<p class="MsoNormal">Let me know if there’s any info I may have omitted that could be of further use.<u></u><u></u></p>
<p class="MsoNormal"><u></u> <u></u></p>
<p class="MsoNormal">Thanks,<u></u><u></u></p>
<p class="MsoNormal">Kevin<u></u><u></u></p>
</div>
</div>

<br></blockquote><div>Thanks,</div><div>Nithya </div><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">______________________________<wbr>_________________<br>
Gluster-users mailing list<br>
<a href="mailto:Gluster-users@gluster.org">Gluster-users@gluster.org</a><br>
<a href="http://www.gluster.org/mailman/listinfo/gluster-users" rel="noreferrer" target="_blank">http://www.gluster.org/<wbr>mailman/listinfo/gluster-users</a><br></blockquote></div><br></div></div>