在使用Disruptor
设计新的性能测试模型的过程中,在使用过程中,偶然发现会有一些异常,然后 QPS 就会不断下降,直到最后 QPS 能力降为零。经过查询相关资料后发现了一个小坑:com.lmax.disruptor.ExceptionHandler
。
这个接口实现类是处理消费消息的过程中发生的异常,具体的源码位置在com.lmax.disruptor.WorkProcessor#run
,有兴趣的可以看看。下面分享一下部分代码:
catch (final Throwable ex)
{
// handle, mark as processed, unless the exception handler threw an exception
exceptionHandler.handleEventException(ex, nextSequence, event);
processedSequence = true;
}
如果大家在使用Disruptor
使用默认的方法的话,会使用默认的ExceptionHandler
的实现类com.lmax.disruptor.FatalExceptionHandler
,它的com.lmax.disruptor.FatalExceptionHandler#handleEventException
方法如下:
@Override
public void handleEventException(final Throwable ex, final long sequence, final Object event)
{
logger.log(Level.SEVERE, "Exception processing: " + sequence + " " + event, ex);
throw new RuntimeException(ex);
}
最后还是会抛出一个异常,然后造成com.lmax.disruptor.WorkProcessor
执行失败,如果消费消息异常比较多的话,基本上消费线程会很快被干掉,最终导致没有消费线程。
回到实际场景,使用消费线程进行并发请求,在之前的实现中都是直接抛出异常,导致 BUG 的出现。修复的方法也很简单,要不使用Disruptor
提供的几种com.lmax.disruptor.IgnoreExceptionHandler
或者org.apache.logging.log4j.core.async.AsyncLoggerDefaultExceptionHandler
之类的,基本都是日志打印。不过还是喜欢自己实现,这样方便一些,所以下面是我的解决方案。
try{
dosomething()
catth(e){
}
因为随着 QPS 上升,报错的概率还是挺大的,毕竟是日志流量回放,由于流量文件中部分请求直接回放是会失败的。如果打印日志,即使每秒万分之一的概率,每秒错误 QPS 就得 10+ 的 QPS。不如直接使用专用的日志平台去统计这部分的异常日志。