如何使用PolyBase在SQL Server中查询Azure Blob存储中的CSV文件
PolyBase是SQL Server 2016中引入的一项新功能,它可以用T-SQL语言直接从SQL Server、Oracle、Teradata、MongoDB、Hadoop集群、Cosmos DB和S3兼容对象存储等外部数据源查询数据,而无需单独安装客户端连接软件。PolyBase还可以将数据导入或导出到/从Hadoop。
在本文中,我们将展示如何使用PolyBase从SQL Server 2016查询存储在Azure Blob存储中的CSV文件。
步骤一:安装PolyBase
要使用PolyBase,首先需要在SQL Server安装程序中选择PolyBase Query Service for External Data这个功能组件,并确保安装了Oracle JRE 7 Update 51或更高版本。安装完成后,需要启动以下两个服务:
步骤二:创建外部数据源
要访问Azure Blob存储中的数据,需要创建一个外部数据源,并指定存储账户名称和访问密钥。例如:
其中,
其中,