AWS推出Graviton驱动的Redshift RG实例,以降低数据分析成本

IT168网站
05-14 11:27 来自广东

AWS发布了由Graviton驱动的新RG实例,用于其Amazon Redshift数据仓库服务,旨在帮助企业应对不断攀升的分析成本以及现代数据湖架构带来的运营复杂性。

新实例的核心是一个集成的数据湖查询引擎。AWS表示,该引擎能够在Redshift仓库数据和Amazon S3数据湖之间运行SQL分析,提供更快的查询性能并降低分析成本。

Pareekh Consulting首席分析师Pareekh Jain指出:“此前,Amazon Redshift RA3系统由两个独立的引擎组成:Redshift处理仓库数据,Spectrum处理S3数据湖查询。当一个查询需要同时访问两者时,AWS不得不在两个系统之间进行协调,这增加了复杂性、拖慢了性能,并使得Spectrum的扫描成本变得难以预测。”

“新的RG实例将这两个世界融合成一个直接运行在Redshift内部的集成引擎。这意味着Iceberg、Parquet和S3湖数据现在可以与仓库数据一起原生查询,减少了数据移动、降低了开销,并优化了性能,同时消除了每次扫描产生的单独Spectrum费用,”Jain补充道。

分析师进一步指出,随着AI工作负载驱动更高的查询量、更多的机器生成分析以及更大的数据处理需求,企业越来越难以承受单独的Spectrum费用。许多客户并不喜欢Spectrum基于扫描量的单独定价模式,因为这可能导致账单突然激增。

Jain认为,新实例可能是AWS对企业在AI规模分析平台方面日益增长需求的回应,这些平台需要避免增加额外的架构复杂性。包括Databricks、Snowflake、Google Cloud的BigQuery以及通过Microsoft Fabric提供的微软服务在内的一些竞争对手,正在推动统一的Lakehouse平台以减少运营扩展。

“RG实例确实增强了Amazon Redshift的竞争力,但这主要是一种防御性措施,而非突破性的颠覆,”Jain表示。

Jain补充道,当Databricks依赖AI和数据科学能力、Snowflake依赖多云环境的简化、Google Cloud通过BigLake实现原生AI分析、微软注重Fabric、Power BI和Microsoft Copilot之间的紧密集成时,AWS则押注于Amazon S3的规模以及更紧密的Redshift优化,以确保企业分析工作负载留在其云平台上。

根据Greyhound Research首席分析师Sanchit Vir Gogia的说法,这种战略差异是CIO和企业团队在评估新实例时需要留意的。

“最合适的应用选择,不一定要看单个工作负载的能力。令企业痛苦的点,是所有痛点重叠在一起的压力山大。这种重叠存在于Redshift、S3、开放格式、BI、定期分析、成本压力以及AI辅助查询的交汇点。这正是RG可以实质性地减少摩擦的地方,”Gogia表示。

“CIO们应该列出外部模式,识别高扫描量和高频率的湖查询,在实际并发条件下对Iceberg和Parquet工作负载进行基准测试,测试月末报告压力,建模AI代理查询模式,并在综合考虑计算、S3、Glue、KMS、监控和运营开销后,衡量是否真的节省了成本,”Gogia补充道。

Jain表示,新RG实例最大的受益者将是那些已经在S3中存储了大量数据的企业,特别是使用Iceberg和Parquet格式的银行、电信、零售、制造、媒体、广告和物联网等行业。“这些公司通常处理庞大的数据集,面临湖与仓库之间昂贵的数据重复、不可预测的账单以及难以管理的多个系统等问题,”Jain说。

AWS也提醒企业,不要假定所有工作负载都能获得一致的节省,建议客户使用AWS定价计算器并结合自身的工作负载模式来评估潜在的成本降低。新的RG实例目前已在以下区域提供:美国东部、美国西部、加拿大、圣保罗、法兰克福、爱尔兰、米兰、伦敦、巴黎、西班牙、斯德哥尔摩、孟买、海得拉巴、新加坡、悉尼、首尔、东京和香港。

热点新闻