<div dir="ltr">Hi,<div>I&#39;m trying to setup a GlusterFS cluster on AWS for hosting static content which will be served by an Apache server.</div><div>Gluster will host about a very large amount of small files summing up to couple of TB.</div><div><br></div><div>In this scenario almost 90% of each IO is of type &quot;getattr&quot; in charge of checking static file date ( apache last modified ) and I&#39;m expecting a lot of IOPS ( getattr).</div><div><br></div><div>I&#39;ve already planned to run Gluster server on several nodes to split load and on performant disks to handle this load. Choose filesystem is XFS .</div><div><br></div><div>Here are my questions:</div><div> 1. How does GlusterFS handles getattr requests? reading from disks or served by server cache?</div><div> 2. Do you suggest to use NFS or Gluster on Client side ?</div><div> 3. To ensure cluster will sustain the load should I increase disk IO or Server resources CPU RAM?</div><div> 4. In case of getattr request on server 1, does gluster server node check its content only or does it query all other replica ?</div><div><br></div><div><br></div><div>Many thanks for your answers.</div><div>GPic</div><div><br></div><div><br></div></div>