<div dir="ltr"><br><div class="gmail_extra"><br><div class="gmail_quote">On Thu, Jun 25, 2015 at 2:08 PM, Tony Printezis <span dir="ltr"><<a href="mailto:tprintezis@twitter.com" target="_blank">tprintezis@twitter.com</a>></span> wrote:<br><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex"><div style="word-wrap:break-word"><div style="font-family:Helvetica,Arial;font-size:13px;color:rgba(0,0,0,1.0);margin:0px;line-height:auto">Hi Kirk,</div><div style="font-family:Helvetica,Arial;font-size:13px;color:rgba(0,0,0,1.0);margin:0px;line-height:auto"><br></div><div style="font-family:Helvetica,Arial;font-size:13px;color:rgba(0,0,0,1.0);margin:0px;line-height:auto">(long time!) See inline.</div><span class=""> <br><p style="color:#000">On June 25, 2015 at 2:54:04 AM, Kirk Pepperdine (<a href="mailto:kirk.pepperdine@gmail.com" target="_blank">kirk.pepperdine@gmail.com</a>) wrote:</p> <div><blockquote type="cite" style="color:rgb(0,0,0);font-family:Helvetica,Arial;font-size:13px;font-style:normal;font-variant:normal;font-weight:normal;letter-spacing:normal;line-height:normal;text-align:start;text-indent:0px;text-transform:none;white-space:normal;word-spacing:0px"><span><div style="word-wrap:break-word"><div><div><blockquote type="cite"><div style="font-family:Helvetica,Arial;font-size:13px;font-style:normal;font-variant:normal;font-weight:normal;letter-spacing:normal;line-height:normal;text-align:start;text-indent:0px;text-transform:none;white-space:normal;word-spacing:0px;word-wrap:break-word"><div><div><div><div><div><div><p><br>But, seriously, why didn’t you like my proposal? It can do anything your scheme can with fewer and simpler code changes. The only thing that it cannot do is to sample based on object count (i.e., every 100 objects) instead of based on object size (i.e., every 1MB of allocations). But I think doing sampling based on size is the right approach here (IMHO).</p><div><br></div></div></div></div></div></div></div></div></blockquote><div><br></div>I would think that the size based sampling would create a size based bias in your sampling.<span> </span></div></div></div></span></blockquote></div><p><br></p></span><p>That’s actually true. And this could be good (if you’re interested in what’s filling up your eden, the larger objects might be of more interest) or bad (if you want to get a general idea of what’s being allocated, the size bias might make you miss some types of objects / allocation sites).</p></div></blockquote><div><br></div><div>Note that it catches both large objects and objects that are frequently allocated in the same way.  Both of those are useful pieces of information.</div><div> </div><div>Particularly, if we find, say, 200 of the same stack trace, and we know they aren't in the live set, then we know we have a place in the code that generates a lot of garbage.  That can be a useful piece of information for tuning.</div><div><br></div><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex"><div style="word-wrap:break-word"><div><span class=""><div><blockquote type="cite" style="color:rgb(0,0,0);font-family:Helvetica,Arial;font-size:13px;font-style:normal;font-variant:normal;font-weight:normal;letter-spacing:normal;line-height:normal;text-align:start;text-indent:0px;text-transform:none;white-space:normal;word-spacing:0px"><span><div style="word-wrap:break-word"><div><div>Since IME, it’s allocation frequency is more damaging to performance, I’d prefer to see time boxed sampling</div></div></div></span></blockquote></div><p><br></p></span><p>Do you mean “sample every X ms, say”?</p></div></div></blockquote><div><br></div><div>This is not impossible, but a little weird.  The only obvious way I can think to do it without enormous overhead is having a thread that wakes up once every X ms and sets a shared location to 1.  Then you check that shared location on every allocation.  If it is 1, you go into a slow path where you try to CAS it to 0.  If the CAS succeeds, take the sample.</div><div><br></div><div>You could imagine some sampling problems caused by, say, thread priority issues.</div><div><br></div><div>Jeremy</div></div><br></div></div>