Amazon Redshift поддерживает запросы только для чтения с использованием ANSI SQL для табличных форматов, таких как Apache Iceberg, Apache Hudi и Delta Lake, а также для открытых форматов данных, включая Apache Parquet, ORC, Avro, JSON и CSV, напрямую из Amazon S3. Apache Iceberg – это формат таблиц с открытым исходным кодом, обеспечивающий согласованность транзакций и улучшенную организацию озер данных благодаря своей табличной структуре. С помощью Amazon Redshift Spectrum можно выполнять чтение таблиц и данных в открытых форматах, таких как Parquet, из озера данных, сохраняя большие объемы структурированных, полуструктурированных и неструктурированных данных в Amazon S3. Для экспорта данных в озеро данных доступна команда Amazon Redshift UNLOAD, поддерживающая экспорт в форматы, такие как Parquet. Экспорт данных из Amazon Redshift обратно в озеро данных позволяет дополнительно проводить их анализ с помощью таких сервисов AWS, как Amazon Athena, Amazon EMR и SageMaker.