列存储的主要特征

分列数据格式：每次对一个列的数据进行分组和存储。　SQL　Server　查询处理可以利用新的数据布局，并显著改进查询执行时间。加快查询结果：列存储索引由于以下原因而可更快地生成结果：　　（1）只须读取需要的列。因此，从磁盘读到内存中、然后从内存移到处理器缓存中的数据量减少了。　　（2）列经过了高度压缩。这将减少必须读取和移动的字节数。　　（3）大多数查询并不会涉及表中的所有列。　因此，许多列从不会进入内存。　这一点与出色的压缩方法相结合，可改善缓冲池使用率，从而减少总　I/O。　　（4）高级查询执行技术以简化的方法处理列块（称为“批处理”），从而减少　CPU　使用率。　　列存储索引的局限性　　（1）包含的列数不能超过　1024。　　（2）无法聚集。　只有非聚集列存储索引才可用。　　（3）不能是唯一索引。　　（4）不能基于视图或索引视图创建。　　（5）不能包含稀疏列。　　（6）不能作为主键或外键。　　（7）不能使用　ALTER　INDEX　语句更改。　而应在删除后重新创建列存储索引。　　（8）不能使用　INCLUDE　关键字创建。　　（9）不能包括用来对索引排序的　ASC　或　DESC　关键字。　根据压缩算法对列存储索引排序。　不允许在索引中进行排序。　可能按照搜索算法对从列存储索引中选择的值进行排序，但是必须使用　ORDER　BY　子句来确保对结果集进行排序。　　（10）不以传统索引的方式使用或保留统计信息。　　（11）无法更新具有列存储索引的表。　　内存受限的影响：列存储处理针对内存中处理进行了优化。　SQL　Server　实现了若干机制，使得数据或大多数数据结构可以在可用内存不足时溢出到磁盘。　如果存在严重的内存限制，则处理过程将使用行存储。　在某些实例中，可能会选择列存储索引作为访问方法，但内存不足以生成所需数据结构。　通过先以列存储操作开始，然后默认为一个较慢的代码路径，在查询遇到严重内存限制时，可能会导致性能出现一定程度的降低。　任何查询的有效内存要求取决于特定的查询。生成列存储索引要求的内存量大约为：8　MB×索引中的列数×DOP（并行度）。通常，内存要求随着作为字符串的列的比例提高而增加。　因此，降低　DOP　可以减少生成列存储索引所需的内存。　　一些表达式的计算将比其他表达式更快：当使用列存储索引时，应使用批处理模计算某些常见表达式，而不以一次一行的模式进行计算。　除了使用列存储索引所带来的优势之外，批处理模式还将提供其他查询加速效果。　并不为批处理模式处理启用每个查询执行运算符。　　列存储索引不支持　SEEK：如果查询应返回行的一小部分，则优化器不大可能选择列存储索引（例如：needle-in-the-haystack　类型查询）。如果使用表提示　FORCESEEK，则优化器将不考虑列存储索引。　　列存储索引不能与以下功能结合使用：页和行压缩以及　vardecimal　存储格式（列存储索引已采用不同格式压缩），复制，更改跟踪，变更数据捕获，文件流。

您可能感兴趣问答

Collapsible

热门标签

热点问答