<div dir="ltr">Hello,<div><br></div><div><div>I've found a method, which is called a lot of times and occupies roughly 20% CPU time according to YourKit when importing a 3,8 Gb JSON file if the storage of DeweyIDs is enabled (which is the default currently):</div><div><br></div><div><a href="https://github.com/sirixdb/sirix/blob/05fcb0ea4f989bcc90028213d7b1ef66e3bb9f20/bundles/sirix-core/src/main/java/org/sirix/node/SirixDeweyID.java#L507" target="_blank">https://github.com/sirixdb/sirix/blob/05fcb0ea4f989bcc90028213d7b1ef66e3bb9f20/bundles/sirix-core/src/main/java/org/sirix/node/SirixDeweyID.java#L507</a><br></div><div><br></div><div>And in there</div><div><a href="https://github.com/sirixdb/sirix/blob/05fcb0ea4f989bcc90028213d7b1ef66e3bb9f20/bundles/sirix-core/src/main/java/org/sirix/node/SirixDeweyID.java#L455" target="_blank">https://github.com/sirixdb/sirix/blob/05fcb0ea4f989bcc90028213d7b1ef66e3bb9f20/bundles/sirix-core/src/main/java/org/sirix/node/SirixDeweyID.java#L455</a><br></div><div><br></div><div>Mainly</div></div><div><div class="gmail-gs" style="margin:0px;padding:0px 0px 20px;width:2950px;font-family:"Google Sans",Roboto,RobotoDraft,Helvetica,Arial,sans-serif;font-size:medium"><div class="gmail-"><div id="gmail-:4lx" class="gmail-ii gmail-gt" style="direction:ltr;margin:8px 0px 0px;padding:0px;font-size:0.875rem"><div id="gmail-:38i" class="gmail-a3s gmail-aiL" style="font-variant-numeric:normal;font-variant-east-asian:normal;font-stretch:normal;font-size:small;line-height:1.5;font-family:Arial,Helvetica,sans-serif;overflow:hidden"><div dir="ltr"><div><pre style="white-space:pre-wrap;background-color:rgb(43,43,43);color:rgb(169,183,198);font-family:"JetBrains Mono",monospace;font-size:9.8pt"><span style="color:rgb(128,128,128)">// calculate the rest of the bits<br></span><span style="color:rgb(204,120,50)">int </span>rest = divisionSize - prefix.<span style="color:rgb(152,118,170)">length</span><span style="color:rgb(204,120,50)">;<br></span><span style="color:rgb(204,120,50)">for </span>(<span style="color:rgb(204,120,50)">int </span>i = <span style="color:rgb(104,151,187)">1</span><span style="color:rgb(204,120,50)">; </span>i <= rest<span style="color:rgb(204,120,50)">; </span>i++) {<br>  <span style="color:rgb(204,120,50)">int </span>k = <span style="color:rgb(104,151,187)">1</span><span style="color:rgb(204,120,50)">;<br></span><span style="color:rgb(204,120,50)">  </span>k = k << rest - i<span style="color:rgb(204,120,50)">;<br></span><span style="color:rgb(204,120,50)">  if </span>(suffix >= k) {<br>    suffix -= k<span style="color:rgb(204,120,50)">;<br></span><span style="color:rgb(204,120,50)">    </span>byteArray[bitIndex / <span style="color:rgb(104,151,187)">8</span>] |= (<span style="color:rgb(204,120,50)">int</span>) Math.<span style="font-style:italic">pow</span>(<span style="color:rgb(104,151,187)">2</span><span style="color:rgb(204,120,50)">, </span><span style="color:rgb(104,151,187)">7 </span>- (bitIndex % <span style="color:rgb(104,151,187)">8</span>))<span style="color:rgb(204,120,50)">;<br></span><span style="color:rgb(204,120,50)">  </span>}<br>  bitIndex++<span style="color:rgb(204,120,50)">;<br></span>}<br><span style="color:rgb(204,120,50)">return </span>bitIndex<span style="color:rgb(204,120,50)">;</span></pre></div></div><div class="gmail-yj6qo"></div><div class="gmail-adL"></div></div></div><div class="gmail-hi" style="border-bottom-left-radius:1px;border-bottom-right-radius:1px;padding:0px;width:auto;background:rgb(242,242,242);margin:0px"></div></div></div>I do not fully understand the code (as it's from BrackitDB), that's my main problem in the first place. However, I wondered if it might be possible to speed up the toBytes() method with the Vector-API maybe (or even other tricks?). I'm storing the node labels optionally for each node in a JSON tree: <a href="http://wwwlgis.informatik.uni-kl.de/cms/fileadmin/users/mathis/documents/HHM_SBBD.pdf" target="_blank">http://wwwlgis.informatik.uni-kl.de/cms/fileadmin/users/mathis/documents/HHM_SBBD.pdf</a> </div><div><br></div><div>These are labels of the form 1, 1.17, 1.17.1.32 ... and they also encode all ancestors. Furthermore, you can check if one node is in preorder before another node, what's the common ancestor and stuff like that (so immensely useful in some situations).</div><div><br></div><div>Kind regards</div><div>Johannes</div><div><br></div><div><br></div></div>