谈表达式树的缓存(7):五种缓存方式的总体分析及改进方案
2009-05-31 22:47 by 老赵, 23053 visits终于到了这个系列的最后一篇文章了,这个系列的文章本是许多话题的基础,却拖了那么长时间还没有完结。这篇文章主要讨论五种缓存方式各自的优劣,以及他们的性能关键在什么地方,如果要进行改进又有什么可选方案。在这个问题上,老赵的思考可能会有遗漏,如果您有任何补充,也请不吝指出。
SimpleKeyCache
SimpleKeyCache是最直接的缓存方案:将表达式树进行完整编码,将其转化为一个独一无二的字符串,然后作为Key存放到字典中。
从上一篇文章的实验来看,无论从耗时还是对GC造成的压力上来说,SimpleKeyCache都是五种缓存方案中最差的。这一点倒很容易理解。因为在.NET中拼接字符串是一种相对来说消耗巨大的操作。而将一个表达式树进行完整编码,势必要将它的各种信息都存放到字符串中。此时您就会发现,例如表达式树的每个节点中的Type或MemberInfo信息会占用较大的空间,同时一颗表达式树内部的节点数量也可能比较可观。两者相辅相成,使得构造一个字符串的代价就非常显著了。
不过,SimpleKeyCache的优点是什么呢?它的优点就在于,它是五种缓存方案中唯一“能够任意重现”的方案。也就是说,无论是在哪台机器上,无论是哪一次启动,相同表达式树的编码结果是不变的。这也是实现“分布式存储”的必要条件。之前文章中所提到的各种缓存方案都是在单个进程内实现的,因此只要在程序启动之后某些必要信息不会改变(例如某个对象的GetHashCode调用结果)即可。但是在分布是存储环境中,会出现多个进程多台机器,如果它们产生的“键”无法保持不变,就无法使用相同表达式树进行可持续的通信了。
如果您真的在“分布式存储”环境,或是其他需要“稳定”特性的场景下(例如把一个表达式树存入数据库)使用表达式树作为标识符,那么您可以选择的做法可能是优化编码方案了。例如,您可以把最终的字符串进行分段,在header中写入Type对象的信息并为它指定一个简短的表识符,这样在字符串的body里就可以省去对大量数据的重复了。
不过,复杂的编码也可能带来额外的运算开销,对于性能不一定会带来好处。因此,在得出确定的结论之前,一定要对实现进行性能评测,不用感觉,而是用数据说话。
PrefixTreeCache
PrefixTreeCache使用了前缀树作为存储数据结构。它将表达式树转化为一个单一序列,并使用Hashtable来作为前缀树的单个节点,形成了一个粗略的表达式树。
与SimpleKeyCache相比,PrefixTreeCache省去了大量的字符串拼接操作,节省了客观的内存占用,因此在GC上与前者相比有了非常明显的改善。但是从结果上看,其性能并不如理论上来的高。老赵认为这是因为我们的实现过于粗糙导致的。.NET类库中的Hashtable性能应该很难进一步提到(因为从代码上看并没有发现明显需要优化的地方——老赵是指只读环境中),因此我们只能设法优化自己的实现。
我们在表达式树的每一层进行查询时会根据当前节点的信息构造一个匿名对象,并作为Key去Hashtable中进行查询。大量的匿名对象造成了GC压力在五种缓存中仅仅落后SimpleKeyCache,而遥遥领先于其余三种方案。从编译器自动生成的类型上看,其GetHashCode方法和Equals方法的实现并没有明显的性能方面问题。因此我们优化的着眼点,似乎只有在对Hashtable的查询次数上了。
我们的实现中对于Hashtable的查询次数的确太多。为了编程方便,每一个节点至少会对有两次查询,因此一个拥有20个节点的表达式(这个数量并不多)就会进行40次以上的查询。对于PrefixTreeCache,我们需要设法减少Hashtable的查询次数。例如,我们其实完全可以把每一个节点的查询次数简化到1次。更进一步,我们可以设法把两个节点并作一个进行查询,就好比传统前缀树实现中的优化方式一样。只是这样做的话编程就变得非常复杂了。
PrefixTreeCache的实现似乎并没有太大优化的余地,而它的性能也不是太好。因此,老赵目前还想不到什么情况下适合使用这种存储方案。
SortedListCache
SortedListCache使用排序列表进行存储,这样每次查询需要O(log(n))次比较,每次比较需要O(m)次操作,因此它也是五种存储中时间复杂度唯一不是理论最优值O(log(n) * m)的方案。
我们为SortedListCache实现了ExpressionComparer,可以比较两个表达式树的“大小”。ExpressionComparer的实现非常高效,没有出现任何装箱拆箱操作,因此它可以说没有对GC造成任何压力,这也是为什么它没有造成任何回收操作的原因。虽然它在理论上的时间复杂度较高,为O(log(n) * m),但是由于存储中的表达式树的数量不会不太多,其log(n)之后就变得非常小。因此从实际看来它的性能反而较SimpleKeyCache和PrefixTreeCache为好。性能较好的另一个原因在于ExpressionComparer不会形成一个完整遍历,一旦它发现两个表达式树的任意节点有所不同,那么就会立即返回。
在上一篇文章的结尾,老赵提出了一个问题:“能否设计一种用例,让SortedListCache的耗时超过PrefixTreeCache或SimpleKeyCache”。这个问题其实可以转化为“能够设计一种用例,让ExpressionComparer耗时尽可能长”,也就是说,我们其实是要设计一种方案,设法让ExpressionComparer可以遍历到尽可能后的位置,例如每次都遍历到底。当然,表达式树长度的增加,也会导致SimpleKeyCache和PrefixTreeCache的耗时增加,是否确定能够满足要求,事实上老赵也并不确定。
那么,我们又如何可以让ExpressionComparer比较次数尽可能少呢?这就要视情况而定了。例如,ExpressionComparer现在其实使用深度优先的方式进行比较,那么如果换成广度优先的方式是否能更快发现两个表达式树的差别呢?
HashedListCache
HashedListCache是性能最好的,它的关键便是在于使用了散列值将不同的表达式首先分布到不同的SortedList对象中,然后再使用类似SortedListCache的方式,使用O(log(k) * m)的时间复杂度进行查询。
散列值的计算是HashedListCache性能的关键。计算散列值要求快,而且离散。“快”保证了可以在短时间内计算出一个表达式树。而“离散”保证了经过分布之后,每个SortedList对象中的表达式树数量k非常少。我们实现的ExpressionHasher基本上满足了这个条件。首先在计算散列值时只消耗了O(m)的时间复杂度,并且由于使用了和ExpressionComparer相同的遍历顺序,使得“前缀相同”的两颗表达式树的“散列值”很有可能不同。这样每个SortedList中,“前缀相同”的可能性就被降低了。自然ExpressionHasher便可更快地比较出两颗表达式树的区别来,节省了实现。
此外,ExpressionHasher的设计也消除了任何装箱/拆箱,节省了时间消耗和GC压力。如果要进行优化的话,可能就需要设计一个更好的散列值计算方式。例如,我们可以对表达式树进行“采样”散列,而不是一个完整散列。但是“采样”散列很可能会降低离散程度,因此任何的改进还是要以性能评测为依据。
DictionaryCache
DictionaryCache为标准的字典存储方式。我们构造了一个CacheKey对象封装了表达式树,并且实现了Dictionary所需要的GetHashCode和Equals方法。
由于每次查询需要构造一个CacheKey对象,因此对于GC会有“些许”影响,但是这个影响其实可以忽略不计。DictionaryCache也是继续散列值的存储方式,它与HashedListCache的区别在于由散列值获得某个“分区”之后,从分区中进行查找的时间复杂度是O(k * m)而不是HashedListCache的O(log(k) * m)。因此,DictionaryCache比HashedListCache更加依赖一个优秀的散列算法。如果一个散列算法的计算结果足够分布,那么HashedListCache和DictionaryCache的性能可谓不分伯仲。这也是为什么在上一篇文章试验中,DictionaryCache和HashedListCache的性能几乎相同。
DictionaryCache的优势并非在于它的实现有什么精妙之处,反而在于“平实”。由于DictionaryCache的实现使用了.NET中标准的键/值存储方式,因此这种方法可以与其他组件轻易集成。例如我们的几种“缓存方式”其实都有点“名不副实”,因为缺少了“过期”及“自动清除”的机制。如果您要实现一个真正的“缓存”机制,可能就要借助现有的成熟的缓存容器了(实现一个成熟的,高效的,线程安全的缓存容器其实是一件非常困难的事情)。而有了DictionaryCache作为蓝本之后,我们就可以轻松地使用CacheKey对象封装表达式树,并作为Key放入缓存容器了。
这就是“标准”的优势之一。
总结
五种缓存策略评价完了,您是否还有种意犹未尽的感觉?您现在是否可以根据不同场景选择不同方案了呢?您是否对老赵的分析还有所补充?
请留下您的看法,老赵在此先谢过了。
完整代码下载:http://code.msdn.microsoft.com/ExpressionCache
相关文章:
谢谢老赵~受益匪浅~