Greenplum Database 管理员指南 6.2.1编写:陈淼 - 119 - 精力的,例如全表查询,VACUUM,gprecoverseg,gpexpand等操作,都是需要一 个一个的叶子分区去操作。另外,如果是全表扫描,分区不仅无法带来性能的提升,反 而会更慢。因此,如果不太会用到分区消除的查询场景,应尽量避免分区,当然,有时 为了数据周期管理,需要进行分区,此时应考虑更粗粒度的分区。尤其应该杜绝使用多 级分区,多级分区一般并不会比只有一级分区的表带来更显著的性能提升,同时会带来 作NULL值。仅当一个字段的字符串和NULL关键字指定的字符串相同时(不能有任何多 余的字符),该字段将会被作为NULL来识别。 在GP数据库导入外部数据时,缺省情况下,TEXT格式的NULL字符串为\N(反斜杠 +N),CSV格式的NULL字符串是没有双引号的空字符串,就是两个逗号之间什么都没有。 例如,当定义NULL是'0'这个字符串时,将会得到下面的效果: CREATE EXTERNAL WEB 对于GP数据库导入导出数据来说,有两类字符是特殊字符,分别是行分隔符和字 段分隔符。如果数据本身包含这两类字符,则需要对字段本身进行转义,否则会造成歧 义。缺省情况下,TEXT格式的转义符是反斜杠(\),CSV格式的转义符是双引号(")。 编者想说的是,转义符是解决歧义的最根本的方法,包含转义的数据格式,可以从根本 上确保绝对不会有歧义,除此之外,不管是CSV,XML,JSON,还是多字节分隔符,只0 码力 | 416 页 | 6.08 MB | 1 年前3
共 1 条
- 1













