当前位置: 首页 > 数据应用 > SqlServer

如何使用PolyBase在SQL Server中查询Azure Blob存储中的CSV文件

时间:2023-06-28 16:40:57 SqlServer

如何使用PolyBase在SQL Server中查询Azure Blob存储中的CSV文件

PolyBase是SQL Server 2016中引入的一项新功能,它可以用T-SQL语言直接从SQL Server、Oracle、Teradata、MongoDB、Hadoop集群、Cosmos DB和S3兼容对象存储等外部数据源查询数据,而无需单独安装客户端连接软件。PolyBase还可以将数据导入或导出到/从Hadoop。

在本文中,我们将展示如何使用PolyBase从SQL Server 2016查询存储在Azure Blob存储中的CSV文件。

步骤一:安装PolyBase

要使用PolyBase,首先需要在SQL Server安装程序中选择PolyBase Query Service for External Data这个功能组件,并确保安装了Oracle JRE 7 Update 51或更高版本。安装完成后,需要启动以下两个服务:

步骤二:创建外部数据源

要访问Azure Blob存储中的数据,需要创建一个外部数据源,并指定存储账户名称和访问密钥。例如:

其中,是Azure Blob存储中的容器名称,是存储账户名称,是一个已经创建好的凭证对象,用来存储访问密钥。创建凭证对象的语句如下:

其中,是一个由Azure Blob存储生成的字符串,用来授权访问存储账户。可以在Azure门户中获取这个字符串。