<div dir="ltr"><div><div>Thanks for this. The information seems sufficient at the moment.<br></div><div>Will get back to you on this if/when I find something.<br></div><br></div>-Krutika<br></div><div class="gmail_extra"><br><div class="gmail_quote">On Mon, Dec 19, 2016 at 1:44 PM, qingwei wei <span dir="ltr">&lt;<a href="mailto:tchengwee@gmail.com" target="_blank">tchengwee@gmail.com</a>&gt;</span> wrote:<br><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">Hi Krutika,<br>

<br>

Sorry for the delay as i am busy with other works. Attached is the<br>

tar.gz file with client and server log, the gfid information on the<br>

shard folder (please look at test.0.0 file as the log is captured when<br>

i run fio on this file.) and also the print statement i put inside the<br>

code. Fyi, i did 2 runs this time and only the second run give me<br>

problem. Hope this information helps.<br>

<br>

Regards,<br>

<br>

Cw<br>

<div class="HOEnZb"><div class="h5"><br>

On Thu, Dec 15, 2016 at 8:02 PM, Krutika Dhananjay &lt;<a href="mailto:kdhananj@redhat.com">kdhananj@redhat.com</a>&gt; wrote:<br>

&gt; Good that you asked. I&#39;ll try but be warned this will involve me coming back<br>

&gt; to you with lot more questions. :)<br>

&gt;<br>

&gt; I&#39;ve been trying this for the past two days (not to mention the fio run<br>

&gt; takes<br>

&gt; really long) and so far there has been no crash/assert failure.<br>

&gt;<br>

&gt; If you already have the core:<br>

&gt; in frame 1,<br>

&gt; 0. print block_num<br>

&gt; 1. get lru_inode_ctx-&gt;stat.ia_gfid<br>

&gt; 2. convert it to hex<br>

&gt; 3. find the gfid in your backend that corresponds to this gfid and share its<br>

&gt; path in your response<br>

&gt; 4. print priv-&gt;inode_count<br>

&gt; 5. and of course lru_inode_ctx-&gt;block_num :)<br>

&gt; 6. Also attach the complete brick and client logs.<br>

&gt;<br>

&gt; -Krutika<br>

&gt;<br>

&gt;<br>

&gt; On Thu, Dec 15, 2016 at 3:18 PM, qingwei wei &lt;<a href="mailto:tchengwee@gmail.com">tchengwee@gmail.com</a>&gt; wrote:<br>

&gt;&gt;<br>

&gt;&gt; Hi Krutika,<br>

&gt;&gt;<br>

&gt;&gt; Do you need anymore information? Do let me know as i can try on my<br>

&gt;&gt; test system. Thanks.<br>

&gt;&gt;<br>

&gt;&gt; Cw<br>

&gt;&gt;<br>

&gt;&gt; On Tue, Dec 13, 2016 at 12:17 AM, qingwei wei &lt;<a href="mailto:tchengwee@gmail.com">tchengwee@gmail.com</a>&gt; wrote:<br>

&gt;&gt; &gt; Hi Krutika,<br>

&gt;&gt; &gt;<br>

&gt;&gt; &gt; You mean FIO command?<br>

&gt;&gt; &gt;<br>

&gt;&gt; &gt; Below is how i do the sequential write. This example i am using 400GB<br>

&gt;&gt; &gt; file, for the SHARD_MAX_INODE=16, i use 300MB file.<br>

&gt;&gt; &gt;<br>

&gt;&gt; &gt; fio -group_reporting -ioengine libaio -directory /mnt/testSF-HDD1<br>

&gt;&gt; &gt; -fallocate none -direct 1 -filesize 400g -nrfiles 1 -openfiles 1 -bs<br>

&gt;&gt; &gt; 256k -numjobs 1 -iodepth 2 -name test -rw write<br>

&gt;&gt; &gt;<br>

&gt;&gt; &gt; And after FIO complete the above workload, i do the random write<br>

&gt;&gt; &gt;<br>

&gt;&gt; &gt; fio -group_reporting -ioengine libaio -directory /mnt/testSF-HDD1<br>

&gt;&gt; &gt; -fallocate none -direct 1 -filesize 400g -nrfiles 1 -openfiles 1 -bs<br>

&gt;&gt; &gt; 8k -numjobs 1 -iodepth 2 -name test -rw randwrite<br>

&gt;&gt; &gt;<br>

&gt;&gt; &gt; The error (Sometimes segmentation fault) only happen during random<br>

&gt;&gt; &gt; write.<br>

&gt;&gt; &gt;<br>

&gt;&gt; &gt; The gluster volume is 3 replica volume with shard enable and 16MB<br>

&gt;&gt; &gt; shard block size.<br>

&gt;&gt; &gt;<br>

&gt;&gt; &gt; Thanks.<br>

&gt;&gt; &gt;<br>

&gt;&gt; &gt; Cw<br>

&gt;&gt; &gt;<br>

&gt;&gt; &gt; On Tue, Dec 13, 2016 at 12:00 AM, Krutika Dhananjay<br>

&gt;&gt; &gt; &lt;<a href="mailto:kdhananj@redhat.com">kdhananj@redhat.com</a>&gt; wrote:<br>

&gt;&gt; &gt;&gt; I tried but couldn&#39;t recreate this issue (even with SHARD_MAX_INODES<br>

&gt;&gt; &gt;&gt; being<br>

&gt;&gt; &gt;&gt; 16).<br>

&gt;&gt; &gt;&gt; Could you share the exact command you used?<br>

&gt;&gt; &gt;&gt;<br>

&gt;&gt; &gt;&gt; -Krutika<br>

&gt;&gt; &gt;&gt;<br>

&gt;&gt; &gt;&gt; On Mon, Dec 12, 2016 at 12:15 PM, qingwei wei &lt;<a href="mailto:tchengwee@gmail.com">tchengwee@gmail.com</a>&gt;<br>

&gt;&gt; &gt;&gt; wrote:<br>

&gt;&gt; &gt;&gt;&gt;<br>

&gt;&gt; &gt;&gt;&gt; Hi Krutika,<br>

&gt;&gt; &gt;&gt;&gt;<br>

&gt;&gt; &gt;&gt;&gt; Thanks. Looking forward to your reply.<br>

&gt;&gt; &gt;&gt;&gt;<br>

&gt;&gt; &gt;&gt;&gt; Cw<br>

&gt;&gt; &gt;&gt;&gt;<br>

&gt;&gt; &gt;&gt;&gt; On Mon, Dec 12, 2016 at 2:27 PM, Krutika Dhananjay<br>

&gt;&gt; &gt;&gt;&gt; &lt;<a href="mailto:kdhananj@redhat.com">kdhananj@redhat.com</a>&gt;<br>

&gt;&gt; &gt;&gt;&gt; wrote:<br>

&gt;&gt; &gt;&gt;&gt; &gt; Hi,<br>

&gt;&gt; &gt;&gt;&gt; &gt;<br>

&gt;&gt; &gt;&gt;&gt; &gt; First of all, apologies for the late reply. Couldn&#39;t find time to<br>

&gt;&gt; &gt;&gt;&gt; &gt; look<br>

&gt;&gt; &gt;&gt;&gt; &gt; into<br>

&gt;&gt; &gt;&gt;&gt; &gt; this<br>

&gt;&gt; &gt;&gt;&gt; &gt; until now.<br>

&gt;&gt; &gt;&gt;&gt; &gt;<br>

&gt;&gt; &gt;&gt;&gt; &gt; Changing SHARD_MAX_INODES value from 12384 to 16 is a cool trick!<br>

&gt;&gt; &gt;&gt;&gt; &gt; Let me try that as well and get back to you in some time.<br>

&gt;&gt; &gt;&gt;&gt; &gt;<br>

&gt;&gt; &gt;&gt;&gt; &gt; -Krutika<br>

&gt;&gt; &gt;&gt;&gt; &gt;<br>

&gt;&gt; &gt;&gt;&gt; &gt; On Thu, Dec 8, 2016 at 11:07 AM, qingwei wei &lt;<a href="mailto:tchengwee@gmail.com">tchengwee@gmail.com</a>&gt;<br>

&gt;&gt; &gt;&gt;&gt; &gt; wrote:<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt;<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt; Hi,<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt;<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt; With the help from my colleague, we did some changes to the code<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt; with<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt; reduce number of SHARD_MAX_INODES (from 16384 to 16) and also<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt; include<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt; the printing of blk_num inside __shard_update_shards_inode_<wbr>list. We<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt; then execute fio to first do sequential write of 300MB file. After<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt; this run completed, we then use fio to generate random write (8k).<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt; And<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt; during this random write run, we found that there is situation<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt; where<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt; the blk_num is negative number and this trigger the following<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt; assertion.<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt;<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt; GF_ASSERT (lru_inode_ctx-&gt;block_num &gt; 0);<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt;<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt; [2016-12-08 03:16:34.217582] E<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt; [shard.c:468:__shard_update_<wbr>shards_inode_list]<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt;<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt;<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt;<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt; (--&gt;/usr/local/lib/glusterfs/<wbr>3.7.17/xlator/features/shard.<wbr>so(shard_common_lookup_shards_<wbr>cbk+0x2d)<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt; [0x7f7300930b6d]<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt;<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt;<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt;<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt; --&gt;/usr/local/lib/glusterfs/3.<wbr>7.17/xlator/features/shard.so(<wbr>shard_link_block_inode+0xce)<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt; [0x7f7300930b1e]<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt;<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt;<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt;<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt; --&gt;/usr/local/lib/glusterfs/3.<wbr>7.17/xlator/features/shard.so(<wbr>__shard_update_shards_inode_<wbr>list+0x36b)<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt; [0x7f730092bf5b] ) 0-: Assertion failed: lru_inode_ctx-&gt;block_num &gt;<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt; 0<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt;<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt; Also, there is segmentation fault shortly after this assertion and<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt; after that fio exit with error.<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt;<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt; frame : type(0) op(0)<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt; patchset: git://<a href="http://git.gluster.com/glusterfs.git" rel="noreferrer" target="_blank">git.gluster.com/<wbr>glusterfs.git</a><br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt; signal received: 11<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt; time of crash:<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt; 2016-12-08 03:16:34<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt; configuration details:<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt; argp 1<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt; backtrace 1<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt; dlfcn 1<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt; libpthread 1<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt; llistxattr 1<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt; setfsid 1<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt; spinlock 1<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt; epoll.h 1<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt; xattr.h 1<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt; st_atim.tv_nsec 1<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt; package-string: glusterfs 3.7.17<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt;<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt;<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt;<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt; /usr/local/lib/libglusterfs.<wbr>so.0(_gf_msg_backtrace_nomem+<wbr>0x92)[0x7f730e900332]<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt;<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt; /usr/local/lib/libglusterfs.<wbr>so.0(gf_print_trace+0x2d5)[<wbr>0x7f730e9250b5]<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt; /lib64/libc.so.6(+0x35670)[<wbr>0x7f730d1f1670]<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt;<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt;<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt;<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt; /usr/local/lib/glusterfs/3.7.<wbr>17/xlator/features/shard.so(__<wbr>shard_update_shards_inode_<wbr>list+0x1d4)[0x7f730092bdc4]<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt;<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt;<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt;<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt; /usr/local/lib/glusterfs/3.7.<wbr>17/xlator/features/shard.so(<wbr>shard_link_block_inode+0xce)[<wbr>0x7f7300930b1e]<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt;<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt;<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt;<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt; /usr/local/lib/glusterfs/3.7.<wbr>17/xlator/features/shard.so(<wbr>shard_common_lookup_shards_<wbr>cbk+0x2d)[0x7f7300930b6d]<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt;<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt;<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt;<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt; /usr/local/lib/glusterfs/3.7.<wbr>17/xlator/cluster/distribute.<wbr>so(dht_lookup_cbk+0x380)[<wbr>0x7f7300b8e240]<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt;<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt;<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt;<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt; /usr/local/lib/glusterfs/3.7.<wbr>17/xlator/protocol/client.so(<wbr>client3_3_lookup_cbk+0x769)[<wbr>0x7f7300df4989]<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt;<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt;<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt; /usr/local/lib/libgfrpc.so.0(<wbr>rpc_clnt_handle_reply+0x90)[<wbr>0x7f730e6ce010]<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt; /usr/local/lib/libgfrpc.so.0(<wbr>rpc_clnt_notify+0x1df)[<wbr>0x7f730e6ce2ef]<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt;<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt; /usr/local/lib/libgfrpc.so.0(<wbr>rpc_transport_notify+0x23)[<wbr>0x7f730e6ca483]<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt;<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt;<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt;<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt; /usr/local/lib/glusterfs/3.7.<wbr>17/rpc-transport/socket.so(+<wbr>0x6344)[0x7f73034dc344]<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt;<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt;<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt;<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt; /usr/local/lib/glusterfs/3.7.<wbr>17/rpc-transport/socket.so(+<wbr>0x8f44)[0x7f73034def44]<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt; /usr/local/lib/libglusterfs.<wbr>so.0(+0x925aa)[0x7f730e96c5aa]<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt; /lib64/libpthread.so.0(+<wbr>0x7dc5)[0x7f730d96ddc5]<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt;<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt; Core dump:<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt;<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt; Using host libthread_db library &quot;/lib64/libthread_db.so.1&quot;.<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt; Core was generated by `/usr/local/sbin/glusterfs<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt; --volfile-server=10.217.242.32 --volfile-id=/testSF1&#39;.<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt; Program terminated with signal 11, Segmentation fault.<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt; #0  list_del_init (old=0x7f72f4003de0) at<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt; ../../../../libglusterfs/src/<wbr>list.h:87<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt; 87        old-&gt;prev-&gt;next = old-&gt;next;<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt;<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt; bt<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt;<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt; #0  list_del_init (old=0x7f72f4003de0) at<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt; ../../../../libglusterfs/src/<wbr>list.h:87<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt; #1  __shard_update_shards_inode_<wbr>list<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt; (linked_inode=linked_inode@<wbr>entry=0x7f72fa7a6e48,<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt; this=this@entry=<wbr>0x7f72fc0090c0, base_inode=0x7f72fa7a5108,<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt;     block_num=block_num@entry=10) at shard.c:469<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt; #2  0x00007f7300930b1e in shard_link_block_inode<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt; (local=local@entry=<wbr>0x7f730ec4ed00, block_num=10, inode=&lt;optimized<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt; out&gt;,<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt;     buf=buf@entry=0x7f730180c990) at shard.c:1559<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt; #3  0x00007f7300930b6d in shard_common_lookup_shards_cbk<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt; (frame=0x7f730c611204, cookie=&lt;optimized out&gt;, this=0x7f72fc0090c0,<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt; op_ret=0,<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt;     op_errno=&lt;optimized out&gt;, inode=&lt;optimized out&gt;,<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt; buf=0x7f730180c990, xdata=0x7f730c029cdc,<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt; postparent=0x7f730180ca00)<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt; at shard.c:1596<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt; #4  0x00007f7300b8e240 in dht_lookup_cbk (frame=0x7f730c61dc40,<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt; cookie=&lt;optimized out&gt;, this=&lt;optimized out&gt;, op_ret=0,<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt; op_errno=22,<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt;     inode=0x7f72fa7a6e48, stbuf=0x7f730180c990,<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt; xattr=0x7f730c029cdc,<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt; postparent=0x7f730180ca00) at dht-common.c:2362<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt; #5  0x00007f7300df4989 in client3_3_lookup_cbk (req=&lt;optimized<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt; out&gt;,<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt; iov=&lt;optimized out&gt;, count=&lt;optimized out&gt;, myframe=0x7f730c616ab4)<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt;     at client-rpc-fops.c:2988<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt; #6  0x00007f730e6ce010 in rpc_clnt_handle_reply<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt; (clnt=clnt@entry=<wbr>0x7f72fc04c040,<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt; pollin=pollin@entry=<wbr>0x7f72fc079560)<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt; at rpc-clnt.c:796<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt; #7  0x00007f730e6ce2ef in rpc_clnt_notify (trans=&lt;optimized out&gt;,<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt; mydata=0x7f72fc04c070, event=&lt;optimized out&gt;, data=0x7f72fc079560)<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt;     at rpc-clnt.c:967<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt; #8  0x00007f730e6ca483 in rpc_transport_notify<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt; (this=this@entry=<wbr>0x7f72fc05bd30,<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt; event=event@entry=RPC_<wbr>TRANSPORT_MSG_RECEIVED,<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt;     data=data@entry=<wbr>0x7f72fc079560) at rpc-transport.c:546<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt; #9  0x00007f73034dc344 in socket_event_poll_in<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt; (this=this@entry=<wbr>0x7f72fc05bd30) at socket.c:2250<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt; #10 0x00007f73034def44 in socket_event_handler (fd=fd@entry=10,<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt; idx=idx@entry=2, data=0x7f72fc05bd30, poll_in=1, poll_out=0,<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt; poll_err=0)<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt;     at socket.c:2363<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt; #11 0x00007f730e96c5aa in event_dispatch_epoll_handler<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt; (event=0x7f730180ced0, event_pool=0xf42ee0) at event-epoll.c:575<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt; #12 event_dispatch_epoll_worker (data=0xf8d650) at<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt; event-epoll.c:678<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt; #13 0x00007f730d96ddc5 in start_thread () from<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt; /lib64/libpthread.so.0<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt; #14 0x00007f730d2b2ced in clone () from /lib64/libc.so.6<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt;<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt; It seems like there is some situation where the structure is not<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt; intialized properly? Appreciate if anyone can advice. Thanks.<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt;<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt; Cw<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt;<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt;<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt;<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt;<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt; On Wed, Dec 7, 2016 at 9:42 AM, qingwei wei &lt;<a href="mailto:tchengwee@gmail.com">tchengwee@gmail.com</a>&gt;<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt; wrote:<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt; &gt; Hi,<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt; &gt;<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt; &gt; I did another test and this time FIO fails with<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt; &gt;<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt; &gt; fio: io_u error on file /mnt/testSF-HDD1/test: Invalid argument:<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt; &gt; write<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt; &gt; offset=114423242752, buflen=8192<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt; &gt; fio: pid=10052, err=22/file:io_u.c:1582, func=io_u error,<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt; &gt; error=Invalid<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt; &gt; argument<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt; &gt;<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt; &gt; test: (groupid=0, jobs=1): err=22 (file:io_u.c:1582, func=io_u<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt; &gt; error,<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt; &gt; error=Invalid argument): pid=10052: Tue Dec  6 15:18:47 2016<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt; &gt;<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt; &gt;<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt; &gt; Below is the client log:<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt; &gt;<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt; &gt; [2016-12-06 05:19:31.261289] I<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt; &gt; [fuse-bridge.c:5171:fuse_<wbr>graph_setup]<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt; &gt; 0-fuse: switched to graph 0<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt; &gt; [2016-12-06 05:19:31.261355] I [MSGID: 114035]<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt; &gt; [client-handshake.c:193:<wbr>client_set_lk_version_cbk]<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt; &gt; 0-testSF-HDD-client-5: Server lk version = 1<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt; &gt; [2016-12-06 05:19:31.261404] I [fuse-bridge.c:4083:fuse_init]<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt; &gt; 0-glusterfs-fuse: FUSE inited with protocol versions: glusterfs<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt; &gt; 7.22<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt; &gt; kernel 7.22<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt; &gt; [2016-12-06 05:19:31.262901] I [MSGID: 108031]<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt; &gt; [afr-common.c:2071:afr_local_<wbr>discovery_cbk]<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt; &gt; 0-testSF-HDD-replicate-0:<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt; &gt; selecting local read_child testSF-HDD-client-1<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt; &gt; [2016-12-06 05:19:31.262930] I [MSGID: 108031]<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt; &gt; [afr-common.c:2071:afr_local_<wbr>discovery_cbk]<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt; &gt; 0-testSF-HDD-replicate-0:<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt; &gt; selecting local read_child testSF-HDD-client-0<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt; &gt; [2016-12-06 05:19:31.262948] I [MSGID: 108031]<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt; &gt; [afr-common.c:2071:afr_local_<wbr>discovery_cbk]<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt; &gt; 0-testSF-HDD-replicate-0:<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt; &gt; selecting local read_child testSF-HDD-client-2<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt; &gt; [2016-12-06 05:19:31.269592] I [MSGID: 108031]<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt; &gt; [afr-common.c:2071:afr_local_<wbr>discovery_cbk]<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt; &gt; 0-testSF-HDD-replicate-1:<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt; &gt; selecting local read_child testSF-HDD-client-3<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt; &gt; [2016-12-06 05:19:31.269795] I [MSGID: 108031]<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt; &gt; [afr-common.c:2071:afr_local_<wbr>discovery_cbk]<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt; &gt; 0-testSF-HDD-replicate-1:<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt; &gt; selecting local read_child testSF-HDD-client-4<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt; &gt; [2016-12-06 05:19:31.277763] I [MSGID: 108031]<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt; &gt; [afr-common.c:2071:afr_local_<wbr>discovery_cbk]<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt; &gt; 0-testSF-HDD-replicate-1:<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt; &gt; selecting local read_child testSF-HDD-client-5<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt; &gt; [2016-12-06 06:58:05.399244] W [MSGID: 101159]<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt; &gt; [inode.c:1219:__inode_unlink] 0-inode:<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt; &gt;<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt; &gt;<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt; &gt;<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt; &gt; be318638-e8a0-4c6d-977d-<wbr>7a937aa84806/864c9ea1-3a7e-<wbr>4d41-899b-f30604a7584e.16284:<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt; &gt; dentry not found in 63af10b7-9dac-4a53-aab1-<wbr>3cc17fff3255<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt; &gt; [2016-12-06 15:17:43.311400] E<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt; &gt; [shard.c:460:__shard_update_<wbr>shards_inode_list]<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt; &gt;<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt; &gt;<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt; &gt;<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt; &gt; (--&gt;/usr/lib64/glusterfs/3.7.<wbr>17/xlator/features/shard.so(<wbr>shard_common_lookup_shards_<wbr>cbk+0x2d)<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt; &gt; [0x7f5575680fdd]<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt; &gt;<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt; &gt;<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt; &gt;<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt; &gt; --&gt;/usr/lib64/glusterfs/3.7.<wbr>17/xlator/features/shard.so(<wbr>shard_link_block_inode+0xdf)<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt; &gt; [0x7f5575680f6f]<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt; &gt;<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt; &gt;<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt; &gt;<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt; &gt; --&gt;/usr/lib64/glusterfs/3.7.<wbr>17/xlator/features/shard.so(__<wbr>shard_update_shards_inode_<wbr>list+0x22e)<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt; &gt; [0x7f557567c1ce] ) 0-: Assertion failed: lru_inode_ctx-&gt;block_num<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt; &gt; &gt; 0<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt; &gt; [2016-12-06 15:17:43.311472] W [inode.c:1232:inode_unlink]<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt; &gt;<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt; &gt;<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt; &gt;<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt; &gt; (--&gt;/usr/lib64/glusterfs/3.7.<wbr>17/xlator/features/shard.so(<wbr>shard_link_block_inode+0xdf)<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt; &gt; [0x7f5575680f6f]<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt; &gt;<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt; &gt;<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt; &gt;<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt; &gt; --&gt;/usr/lib64/glusterfs/3.7.<wbr>17/xlator/features/shard.so(__<wbr>shard_update_shards_inode_<wbr>list+0x14a)<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt; &gt; [0x7f557567c0ea] --&gt;/lib64/libglusterfs.so.0(<wbr>inode_unlink+0x9c)<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt; &gt; [0x7f558386ba0c] ) 0-testSF-HDD-shard: inode not found<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt; &gt; [2016-12-06 15:17:43.333456] W [inode.c:1133:inode_forget]<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt; &gt;<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt; &gt;<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt; &gt;<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt; &gt; (--&gt;/usr/lib64/glusterfs/3.7.<wbr>17/xlator/features/shard.so(<wbr>shard_link_block_inode+0xdf)<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt; &gt; [0x7f5575680f6f]<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt; &gt;<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt; &gt;<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt; &gt;<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt; &gt; --&gt;/usr/lib64/glusterfs/3.7.<wbr>17/xlator/features/shard.so(__<wbr>shard_update_shards_inode_<wbr>list+0x154)<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt; &gt; [0x7f557567c0f4] --&gt;/lib64/libglusterfs.so.0(<wbr>inode_forget+0x90)<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt; &gt; [0x7f558386b800] ) 0-testSF-HDD-shard: inode not found<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt; &gt; [2016-12-06 15:18:47.129794] W<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt; &gt; [fuse-bridge.c:2311:fuse_<wbr>writev_cbk]<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt; &gt; 0-glusterfs-fuse: 12555429: WRITE =&gt; -1<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt; &gt; gfid=864c9ea1-3a7e-4d41-899b-<wbr>f30604a7584e fd=0x7f557016ae6c<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt; &gt; (Invalid<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt; &gt; argument)<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt; &gt;<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt; &gt; Below is the code and it will go to the else block when<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt; &gt; inode_count<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt; &gt; is<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt; &gt; greater than SHARD_MAX_INODES which is 16384. And my dataset of<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt; &gt; 400GB<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt; &gt; with 16MB shard size has enough shard file (400GB/16MB) to<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt; &gt; achieve<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt; &gt; it.<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt; &gt; When i do the test with smaller dataset, there is no such error.<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt; &gt;<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt; &gt; shard.c<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt; &gt;<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt; &gt;                 if (priv-&gt;inode_count + 1 &lt;= SHARD_MAX_INODES) {<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt; &gt;                 /* If this inode was linked here for the first<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt; &gt; time<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt; &gt; (indicated<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt; &gt;                  * by empty list), and if there is still space in<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt; &gt; the<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt; &gt; priv list,<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt; &gt;                  * add this ctx to the tail of the list.<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt; &gt;                  */<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt; &gt;                         gf_uuid_copy (ctx-&gt;base_gfid,<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt; &gt; base_inode-&gt;gfid);<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt; &gt;                         ctx-&gt;block_num = block_num;<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt; &gt;                         list_add_tail (&amp;ctx-&gt;ilist,<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt; &gt; &amp;priv-&gt;ilist_head);<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt; &gt;                         priv-&gt;inode_count++;<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt; &gt;                 } else {<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt; &gt;                 /*If on the other hand there is no available slot<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt; &gt; for<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt; &gt; this inode<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt; &gt;                  * in the list, delete the lru inode from the<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt; &gt; head of<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt; &gt; the list,<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt; &gt;                  * unlink it. And in its place add this new inode<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt; &gt; into<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt; &gt; the list.<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt; &gt;                  */<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt; &gt;                         lru_inode_ctx = list_first_entry<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt; &gt; (&amp;priv-&gt;ilist_head,<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt; &gt;<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt; &gt; shard_inode_ctx_t,<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt; &gt;                                                           ilist);<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt; &gt;                         /* add in message for debug*/<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt; &gt;                         gf_msg (THIS-&gt;name, GF_LOG_WARNING, 0,<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt; &gt; SHARD_MSG_INVALID_FOP,<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt; &gt;                         &quot;block number = %d&quot;,<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt; &gt; lru_inode_ctx-&gt;block_num);<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt; &gt;<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt; &gt;                         GF_ASSERT (lru_inode_ctx-&gt;block_num &gt; 0);<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt; &gt;<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt; &gt; Hopefully can get some advice from you guys on this. Thanks.<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt; &gt;<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt; &gt; Cw<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt; &gt;<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt; &gt; On Tue, Dec 6, 2016 at 9:07 AM, qingwei wei &lt;<a href="mailto:tchengwee@gmail.com">tchengwee@gmail.com</a>&gt;<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt; &gt; wrote:<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt; &gt;&gt; Hi,<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt; &gt;&gt;<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt; &gt;&gt; This is the repost of my email in the gluster-user mailing list.<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt; &gt;&gt; Appreciate if anyone has any idea on the issue i have now.<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt; &gt;&gt; Thanks.<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt; &gt;&gt;<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt; &gt;&gt; I encountered this when i do the FIO random write on the fuse<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt; &gt;&gt; mount<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt; &gt;&gt; gluster volume. After this assertion happen, the client log is<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt; &gt;&gt; filled<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt; &gt;&gt; with pending frames messages and FIO just show zero IO in the<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt; &gt;&gt; progress<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt; &gt;&gt; status. As i leave this test to run overnight, the client log<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt; &gt;&gt; file<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt; &gt;&gt; fill up with those pending frame messages and hit 28GB for<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt; &gt;&gt; around 12<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt; &gt;&gt; hours.<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt; &gt;&gt;<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt; &gt;&gt; The client log:<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt; &gt;&gt;<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt; &gt;&gt; [2016-12-04 15:48:35.274208] W [MSGID: 109072]<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt; &gt;&gt; [dht-linkfile.c:50:dht_<wbr>linkfile_lookup_cbk] 0-testSF-dht: got<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt; &gt;&gt; non-linkfile<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt; &gt;&gt;<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt; &gt;&gt;<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt; &gt;&gt; testSF-replicate-0:/.shard/<wbr>21da7b64-45e5-4c6a-9244-<wbr>53d0284bf7ed.7038,<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt; &gt;&gt; gfid = 00000000-0000-0000-0000-<wbr>000000000000<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt; &gt;&gt; [2016-12-04 15:48:35.277208] W [MSGID: 109072]<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt; &gt;&gt; [dht-linkfile.c:50:dht_<wbr>linkfile_lookup_cbk] 0-testSF-dht: got<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt; &gt;&gt; non-linkfile<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt; &gt;&gt;<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt; &gt;&gt;<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt; &gt;&gt; testSF-replicate-0:/.shard/<wbr>21da7b64-45e5-4c6a-9244-<wbr>53d0284bf7ed.8957,<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt; &gt;&gt; gfid = 00000000-0000-0000-0000-<wbr>000000000000<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt; &gt;&gt; [2016-12-04 15:48:35.277588] W [MSGID: 109072]<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt; &gt;&gt; [dht-linkfile.c:50:dht_<wbr>linkfile_lookup_cbk] 0-testSF-dht: got<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt; &gt;&gt; non-linkfile<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt; &gt;&gt;<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt; &gt;&gt;<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt; &gt;&gt; testSF-replicate-0:/.shard/<wbr>21da7b64-45e5-4c6a-9244-<wbr>53d0284bf7ed.11912,<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt; &gt;&gt; gfid = 00000000-0000-0000-0000-<wbr>000000000000<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt; &gt;&gt; [2016-12-04 15:48:35.312751] E<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt; &gt;&gt; [shard.c:460:__shard_update_<wbr>shards_inode_list]<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt; &gt;&gt;<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt; &gt;&gt;<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt; &gt;&gt;<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt; &gt;&gt; (--&gt;/usr/lib64/glusterfs/3.7.<wbr>17/xlator/features/shard.so(<wbr>shard_common_lookup_shards_<wbr>cbk+0x2d)<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt; &gt;&gt; [0x7f86cc42efdd]<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt; &gt;&gt;<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt; &gt;&gt;<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt; &gt;&gt;<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt; &gt;&gt; --&gt;/usr/lib64/glusterfs/3.7.<wbr>17/xlator/features/shard.so(<wbr>shard_link_block_inode+0xdf)<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt; &gt;&gt; [0x7f86cc42ef6f]<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt; &gt;&gt;<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt; &gt;&gt;<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt; &gt;&gt;<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt; &gt;&gt; --&gt;/usr/lib64/glusterfs/3.7.<wbr>17/xlator/features/shard.so(__<wbr>shard_update_shards_inode_<wbr>list+0x22e)<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt; &gt;&gt; [0x7f86cc42a1ce] ) 0-: Assertion failed:<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt; &gt;&gt; lru_inode_ctx-&gt;block_num &gt;<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt; &gt;&gt; 0<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt; &gt;&gt; pending frames:<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt; &gt;&gt; frame : type(0) op(0)<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt; &gt;&gt; frame : type(0) op(0)<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt; &gt;&gt; frame : type(0) op(0)<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt; &gt;&gt; frame : type(0) op(0)<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt; &gt;&gt; frame : type(0) op(0)<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt; &gt;&gt; frame : type(0) op(0)<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt; &gt;&gt;<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt; &gt;&gt; Gluster info (i am testing this on one server with each disk<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt; &gt;&gt; representing one brick, this gluster volume is then mounted<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt; &gt;&gt; locally<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt; &gt;&gt; via fuse)<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt; &gt;&gt;<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt; &gt;&gt; Volume Name: testSF<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt; &gt;&gt; Type: Distributed-Replicate<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt; &gt;&gt; Volume ID: 3f205363-5029-40d7-b1b5-<wbr>216f9639b454<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt; &gt;&gt; Status: Started<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt; &gt;&gt; Number of Bricks: 2 x 3 = 6<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt; &gt;&gt; Transport-type: tcp<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt; &gt;&gt; Bricks:<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt; &gt;&gt; Brick1: 192.168.123.4:/mnt/sdb_mssd/<wbr>testSF<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt; &gt;&gt; Brick2: 192.168.123.4:/mnt/sdc_mssd/<wbr>testSF<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt; &gt;&gt; Brick3: 192.168.123.4:/mnt/sdd_mssd/<wbr>testSF<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt; &gt;&gt; Brick4: 192.168.123.4:/mnt/sde_mssd/<wbr>testSF<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt; &gt;&gt; Brick5: 192.168.123.4:/mnt/sdf_mssd/<wbr>testSF<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt; &gt;&gt; Brick6: 192.168.123.4:/mnt/sdg_mssd/<wbr>testSF<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt; &gt;&gt; Options Reconfigured:<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt; &gt;&gt; features.shard-block-size: 16MB<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt; &gt;&gt; features.shard: on<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt; &gt;&gt; performance.readdir-ahead: on<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt; &gt;&gt;<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt; &gt;&gt; Gluster version: 3.7.17<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt; &gt;&gt;<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt; &gt;&gt; The actual disk usage (Is about 91% full):<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt; &gt;&gt;<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt; &gt;&gt; /dev/sdb1                235G  202G   22G  91% /mnt/sdb_mssd<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt; &gt;&gt; /dev/sdc1                235G  202G   22G  91% /mnt/sdc_mssd<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt; &gt;&gt; /dev/sdd1                235G  202G   22G  91% /mnt/sdd_mssd<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt; &gt;&gt; /dev/sde1                235G  200G   23G  90% /mnt/sde_mssd<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt; &gt;&gt; /dev/sdf1                235G  200G   23G  90% /mnt/sdf_mssd<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt; &gt;&gt; /dev/sdg1                235G  200G   23G  90% /mnt/sdg_mssd<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt; &gt;&gt;<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt; &gt;&gt; Anyone encounter this issue before?<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt; &gt;&gt;<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt; &gt;&gt; Cw<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt; ______________________________<wbr>_________________<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt; Gluster-devel mailing list<br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt; <a href="mailto:Gluster-devel@gluster.org">Gluster-devel@gluster.org</a><br>

&gt;&gt; &gt;&gt;&gt; &gt;&gt; <a href="http://www.gluster.org/mailman/listinfo/gluster-devel" rel="noreferrer" target="_blank">http://www.gluster.org/<wbr>mailman/listinfo/gluster-devel</a><br>

&gt;&gt; &gt;&gt;&gt; &gt;<br>

&gt;&gt; &gt;&gt;&gt; &gt;<br>

&gt;&gt; &gt;&gt;<br>

&gt;&gt; &gt;&gt;<br>

&gt;<br>

&gt;<br>

</div></div></blockquote></div><br></div>