データのアンロード機能の概要¶
このトピックでは、 COPY INTO <場所> コマンドを使用してSnowflakeテーブルからフラットファイルにデータをアンロードするためにサポートされている機能のクイックリファレンスを提供します。
サポートされている機能の一部、特に圧縮と暗号化は、Snowflakeの内部の場所または外部の場所(つまり、Amazon S3、Google Cloud Storage、またはMicrosoft Azure)のどちらにアンロードするかによって決まります。
このトピックの内容:
出力データファイルの詳細¶
次のテーブルは、データをアンロードするときにSnowflakeによって生成される出力ファイルの一般的な詳細を示しています。
機能 | サポート対象 | 注意 |
|---|---|---|
ファイルの場所 | ローカルファイル | ファイルはまずSnowflakeの内部の場所にアンロードされます。その後、 GET を使用してローカルにダウンロードできます。 |
Amazon S3のファイル | ファイルは、S3のユーザー提供のバケットに直接アンロードできます。その後、 AWS ユーティリティを使用してローカルにダウンロードできます。 | |
Google Cloud Storageのファイル | ファイルは、Cloud Storageのユーザー提供のコンテナーに直接アンロードでき、Cloud Storageユーティリティを使用してローカルにダウンロードできます。 | |
Microsoft Azureのファイル | ファイルは、Azureのユーザー提供のコンテナーに直接アンロードでき、Azureユーティリティを使用してローカルにダウンロードできます。 | |
ファイル形式 | 区切りファイル(CSV、 TSVなど) | 有効な区切り文字がサポートされています。デフォルトはカンマ(つまり、 CSV)です。 |
JSON | ||
Parquet | ||
ファイルエンコーディング | UTF-8 | 出力ファイルは、ファイル形式に関係なく、常に UTF-8を使用してエンコードされます。他の文字セットはサポートされていません。 |
注釈
メモリ不足のマシンでアンロードを実行すると、ファイルのサイズが小さくなる場合があります。
出力データファイルの圧縮¶
次のテーブルは、SnowflakeがデータをアンロードするときにSnowflakeによって生成された出力ファイルの圧縮をどのように処理するかを説明しています。
ファイルの場所 | サポート対象 | 注意 |
|---|---|---|
内部または外部の場所 | gzip | デフォルトでは、圧縮が明示的に無効にされているか、サポートされている他の圧縮方法のいずれかが明示的に指定されていない限り、アンロードされたデータファイルはすべてgzipを使用して圧縮されます |
bzip2 | ||
Brotli | ||
Zstandard |
注釈
現在、 compression=gzip の場合にAzureおよびGoogle Cloud Platformで CONTENT-ENCODING の設定をサポートしていないことは既知の問題です。
出力データファイルの暗号化¶
次のテーブルは、Snowflakeがデータのアンロード時にSnowflakeによって生成された出力ファイルの暗号化を処理する方法を説明しています。オプションは、ファイルがアンロードされる場所が内部(つまり、Snowflakeステージ)または外部(Amazon S3、Google Cloud Storage、またはMicrosoft Azure)であるかに応じて異なります。
ファイルの場所 | サポート対象 | 注意 |
|---|---|---|
内部の場所 | 128ビットまたは256ビットキー | Snowflakeの内部の場所にアンロードされるすべてのデータファイルは、128ビットキーを使用して自動的に暗号化されます。ファイルは、ローカルディレクトリにダウンロードされるときに暗号化されません。 256ビットキーを有効にすることができます(より強力な暗号化のため)。ただし、追加の構成が必要です。 |
外部の場所 | ユーザー提供のキー | セキュリティキー(ファイルの暗号化用)がSnowflakeに提供されている場合、クラウドストレージにアンロードされたデータファイルを暗号化できます。 |