<div dir="ltr"><div class="gmail_default" style="font-family:tahoma,sans-serif">Hello everyone,<br><br></div><div class="gmail_default" style="font-family:tahoma,sans-serif">I am curious to know other people&#39;s experience with reading data straight from the underlying volume. According to the documentation it should be fine:<br></div><div class="gmail_default" style="font-family:tahoma,sans-serif"><br><a href="http://www.gluster.org/documentation/Technical_FAQ/">http://www.gluster.org/documentation/Technical_FAQ/</a><br><br><blockquote style="margin:0px 0px 0px 0.8ex;border-left:1px solid rgb(204,204,204);padding-left:1ex" class="gmail_quote"><b>Can I directly access the data on the underlying storage volumes?</b><br><br>If you are just doing just read()/access()/stat() like operations, you should be fine. If you are not using any new features (like quota/geo-replication etc etc) then technically, you can modify (but surely not rename(2) and link(2)) the data inside.<br><br>Note that this is not tested as part of gluster’s release cycle and not recommended for production use.<br clear="all"></blockquote><div><br></div><div>The last sentence doesn&#39;t recommend it for production use. I was wondering if there&#39;s any other concern besides the fact that it&#39;s not tested as part of the release cycle or one could expect actual some problems with the data being read while doing so?<br><br></div><div>What I am interested is <b>only</b> read operations (readdir, stat, read data). All the write operations will continue going over the shared/mounted drive. So what I want to know is that the data that I am reading will be consistent with the rest of the bricks and not corrupted in any way.<br><br></div><div>The reason why I am looking into this is two-fold:<br></div><div>1. I have a lot of small files (hundreds of thousands) that need to be read and reread very frequently. Doing so directly from the underlying disk is way faster.<br></div><div>2. Once I&#39;ve read them once both metadata and actual data is automatically cached in the OS filesystem cache, thus subsequent reads take almost no time since very few of those files actually change between reruns.<br></div><div><br></div></div><div class="gmail_default" style="font-family:tahoma,sans-serif">I run a three (or five) way mirror and nothing fancy (no geo and such) so if I could, I would prefer to read of the local disk​ but I want to be certain that those reads, in terms of correctness and consistency, will be equivalent to reading of the shared drive itself.<br></div><br><div class="gmail_default" style="font-family:tahoma,sans-serif">​Thank you in advance for sharing your experience.​<br><br></div><div class="gmail_default" style="font-family:tahoma,sans-serif">Regards,<br></div>-- <br><div class="gmail_signature"><div dir="ltr"><div><span style="font-family:tahoma,sans-serif">Rumen Telbizov</span><div><span style="font-family:tahoma,sans-serif"><a href="http://telbizov.com" target="_blank">Unix Systems Administrator</a></span></div></div></div></div>
</div>