ClickHouse是一个面向列的数据库,也是一个原生的向量化执行引擎。它没有沿用大数据领域的Hadoop生态,而是使用Localattachedstorage作为存储,这样整个IO可能没有Hadoop的局限性。其系统在生产环境中可以应用到比较大的规模,因为其线性扩展能力和可靠性保证可以原生支持shard+replication的方案。它还提供了一些SQL直接接口,并且有一个比较丰富的nativeclient。ClickHouse数据库的特点:FastClickHouse性能超过市面上大部分的列式存储数据库。与传统数据ClickHouse相比,快了100-1000倍,ClickHouse还是有非常大的优势。1亿数据集:ClickHouse比Vertica快5倍左右,比Hive快279倍,比MySQL快801倍。10亿数据集:ClickHouse比Vertica快5倍左右,MySQL和Hive已经无法完成任务。多种功能1.支持类SQL查询;2、支持各种库函数(如IP转换、URL解析等,预测计算/HyperLoglog等);3.支持数组(Array)和嵌套数据结构(NestedDataStructure);4.支持数据库异地复制部署。需要注意的是,由于ClickHouse的快速查询仍然是基于系统资源的,所以在使用时需要注意各个节点上的存储量和节点机系统资源是否充足。因为查询使用内存进行聚合,所以并发查询的数量不能太大,否则会造成资源崩溃。环境配置初始化环境(所有节点)#修改本机的hostnamevi/etc/hostname#Configurehostsvi/etc/hosts192.168.143.20node1192.168.143.21node2192.168.143.22node3修改后执行hostnamenode1...3不用重启机器使其生效下载安装ClickHouse(所有节点)主要下载四个文件:Clickhouse-clientClickhouse-common-staticClickhouse-serverclickhouse-server-commonrpm-ivh*.rpminstallzookeeper(任意节点)#我这里选择node1dockerrun-d--nethost--namezookeeperzookeeper配置集群(所有节点)修改/etc/clickhouse-server/config.xml
