<div dir="ltr">Would'n't it be faster to just do card(o.x) = Dirty without the clean check?<div>Usually single store is faster than load & store on the same cache line.</div><div>I don't think card(o.x) is preloaded in cache to make if check cheap.</div><div>Anyway this is a good step forward and I think it is a good tradeoff.</div><div>However, pre & post is still heavier than the CMS wb, and we need to see the actual experimental numbers how close it can be.</div><div><br></div></div><div class="gmail_extra"><br><div class="gmail_quote">On Wed, Nov 9, 2016 at 7:54 AM, Thomas Schatzl <span dir="ltr"><<a href="mailto:thomas.schatzl@oracle.com" target="_blank">thomas.schatzl@oracle.com</a>></span> wrote:<br><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">Hi all,<br>
<br>
  just one comment:<br>
<br>
On Wed, 2016-11-09 at 16:11 +0100, Erik Helin wrote:<br>
> Hi all,<br>
><br>
> [...]<br>
<span class="">><br>
> The responsibility of the post-write barrier is to queue up pointers <br>
> between regions so that the concurrent refinements threads can update<br>
> the remembered sets concurrently.  If you were to give up this, an <br>
> alternative post-write barrier could look like:<br>
><br>
> if (y != NULL) {<br>
>    if (card(o.x) == Clean) {<br>
>        card(o.x) = Dirty;<br>
>    }<br>
> }<br>
><br>
<br>
</span>Actually, one can simply reuse all the existing post-write barrier code<br>
generation and optimizations from any of the other collectors in the<br>
simplest case.<br>
<br>
I do not think parallel GC performs the NULL check :)<br>
<br>
Thanks,<br>
  Thomas<br>
<br>
</blockquote></div><br><br clear="all"><div><br></div>-- <br><div class="gmail_signature" data-smartmail="gmail_signature"><div dir="ltr"><div><span style="font-size:12.8000001907349px">Jungwoo Ha | Java Platform Team | <a href="mailto:jwha@google.com" target="_blank">jwha@google.com</a></span><br></div><div><br></div></div></div>
</div>