當前位置:首頁 > 廠商動態(tài) > 亞馬遜云科技
[導讀]Amazon S3 Tables為分析工作負載提供了快達3倍的查詢性能,高達10倍的每秒事務處理量;Amazon S3 Metadata提供可查詢的對象元數據,實現近乎實時的搜索、管理和增強數據,加速數據發(fā)現。

北京——2024年12月17日 亞馬遜云科技在2024 re:Invent全球大會上,宣布推出Amazon Simple Storage Service(Amazon S3)新功能,使Amazon S3成為首個完全托管的支持Apache Iceberg云上對象存儲,進一步提升了數據分析速度,并提供存儲和管理任何規(guī)模表格數據的極簡單方式。新功能還包括自動生成可查詢的元數據,簡化數據發(fā)現與理解,助力客戶充分挖掘Amazon S3中的數據價值。

· Amazon S3 Tables是首個內置Apache Iceberg表支持的云上對象存儲,推出了一種新型存儲桶,以Iceberg表的形式優(yōu)化存儲和表數據查詢,查詢速度最高可提升3倍,每秒事務處理量(TPS)可提高10倍,并自動化分析工作負載的表格維護。

· Amazon S3 Metadata通過自動捕獲可查詢的對象元數據以及使用對象標簽的自定義元數據,將其存儲于Amazon S3 Tables中來加速數據湖分析,可實現近乎實時的數據發(fā)現。

亞馬遜云科技存儲部門副總裁兼杰出工程師Andy Warfield表示:“Amazon S3作為領先的對象存儲,存儲了超過400萬億個對象,成為數百萬客戶的選擇。我們致力于不斷創(chuàng)新,以前所未有的規(guī)模消除處理數據的復雜性。隨著表格數據的快速增長,眾多客戶希望實現跨表查詢并提升查詢性能,更好地理解和組織大量數據,以便輕松找到他們所需要的信息。Amazon S3 Tables和Amazon S3 Metadata消除了在對象上組織和操作表格及元數據存儲的復雜性,使客戶能夠專注于數據構建?!?

Amazon S3 Tables和Amazon S3 Metadata現已與Apache Iceberg表兼容,客戶可以使用亞馬遜云科技分析服務以及開源工具,包括Amazon Athena、Amazon QuickSight和Apache Spark,輕松查詢他們的數據。

Amazon S3 Table:以簡便快捷的方式執(zhí)行Amazon S3中的Apache Iceberg表分析

如今,許多客戶都以表格數據來組織他們用于分析的數據,這些數據通常存儲在Apache Parquet 中,這是一種針對數據查詢進行優(yōu)化的文件格式。Parquet已成為Amazon S3中增速最快的數據類型之一??蛻粼絹碓蕉嗟叵M軌虿樵冞@些不斷增長的表格數據集,他們通常會使用開放表格式(open table formats,OTF),這是一種以表格存儲數據的開源標準,有助于更有效地管理、更新和跟蹤大量數據的變化。Iceberg管理Parquet文件,已成為最流行的OTF。客戶使用Iceberg處理包含PB乃至EB級數據的數十億文件。但隨著客戶規(guī)模的擴大,客戶管理Iceberg極具挑戰(zhàn),往往需要專業(yè)的團隊來構建和維護系統(tǒng),進行表維護、數據壓縮以及管理訪問控制。這些外部系統(tǒng)不僅成本高昂和復雜,同時還需要專業(yè)的團隊來維護,占用了企業(yè)諸多寶貴資源。

Amazon S3 Tables專為管理數據湖中的Apache Iceberg表構建。Amazon S3 Tables專門針對分析工作負載進行優(yōu)化,與通用Amazon S3存儲桶相比,提供了高達3倍的查詢性能和10倍的每秒事務處理量(TPS)。Amazon S3 Tables能夠自動管理表維護任務,包括為更好的查詢性能而進行的壓縮,以及快照管理,隨著客戶數據湖的不斷擴展和演進,實現對查詢性能和存儲成本進行的持續(xù)優(yōu)化??蛻魞H需創(chuàng)建一個表存儲桶,即可使用S3 Tables優(yōu)化存儲和查詢完全托管的Iceberg表中的數據。借助Amazon S3 Tables,客戶可受益于Iceberg的諸多功能,如行級事務處理、通過時間旅行功能查詢快照以及模式演進等。此外,Amazon S3 Tables還提供了表級訪問控制,讓客戶精準能夠定義數據訪問權限。

Genesys是全球領先的AI驅動體驗編排服務商,正計劃使用Amazon S3構建數據湖。借助Amazon S3 Tables對托管Iceberg的支持,Genesys希望為其多元化的數據分析需求構建一個材料化視圖層。Amazon S3 Tables內置對Iceberg表的支持將極大簡化復雜的數據工作流程,通過自動執(zhí)行關鍵維護任務,如表壓縮、快照管理以及未引用文件的清理等。Genesys期待能從兼容Iceberg的分析工具中獲得性能提升和廣泛支持,這些工具可直接從Amazon S3中讀寫Iceberg表。Amazon S3 Tables將成為Genesys未來數據戰(zhàn)略的基石,幫助Genesys提供更快、更靈活、更可靠的數據洞察,以支持其AI驅動的客戶和員工體驗解決方案。

Amazon S3元數據:更輕松、快捷地探索和理解Amazon S3中的數據

隨著越來越多的客戶將Amazon S3作為其中央數據存儲庫,數據量與數據種類呈指數級增長。元數據作為理解和組織海量數據的一種方式變得越來越重要,以便客戶能夠找到他們所需的確切對象。為有效應對這一挑戰(zhàn),許多客戶不得不構建并維護復雜的元數據獲取與存儲系統(tǒng),來深化他們對數據的認知。但這些元數據系統(tǒng)不但成本高昂、耗時,而且資源密集,通常需要數據工程師在元數據流經處理管道時,手動跟蹤和更新元數據;同時,還要求數據分析師手動遍歷海量的對象存儲,以找到用于分析和AI/ML數據處理工作流所需的特定數據。

Amazon S3 Metadata能夠近乎實時地自動生成可查詢的對象元數據,從而加速數據發(fā)現并提升數據理解能力,幫助客戶消除構建和維護復雜元數據系統(tǒng)的負擔。借助Amazon S3 Metadata,客戶可以查詢、發(fā)現并使用數據,以支持業(yè)務分析、實時推理應用等。Amazon S3 Metadata能夠自動生成對象元數據,包括系統(tǒng)定義的詳情,如對象的大小和來源,并可通過新的Amazon S3 Tables進行查詢。隨著對象的增加或刪除,Amazon S3 Metadata會實時更新 Amazon S3 Tables中的對象元數據,確保客戶獲得最新的數據視圖??蛻暨€可以使用對象標簽添加自定義元數據,為對象注釋特定的業(yè)務信息,如產品SKU、交易ID、內容評級或客戶詳細信息。客戶還可以通過簡單的SQL查詢輕松檢索元數據,快速查找和準備數據,以支持業(yè)務分析、實時推理應用、基礎模型微調、檢索增強生成(RAG)、數據倉庫與分析工作流集成,以及執(zhí)行有針對性的存儲優(yōu)化任務等。

各種規(guī)模的企業(yè)都將受益于Amazon S3 Metadata的數據發(fā)現和理解。領先的生物技術公司羅氏(Roche),計劃借助Amazon S3 Metadata加速其未來生成式AI計劃。隨著羅氏對先進大型語言模型(LLM)應用的開發(fā),如復雜的內部聊天機器人,羅氏預計其用于檢索增強生成(RAG)的非結構化數據量將面臨成倍增長。Amazon S3 Metadata將簡化可擴展元數據系統(tǒng)的構建,自動為新數據的攝入生成并更新元數據。Roche期望通過定制的Lambda函數提取復雜的、特定于業(yè)務的元數據,并將其與Amazon S3 Metadata無縫集成到綜合Amazon Glue目錄中。這將讓企業(yè)更有效率,并快速識別可為前沿AI應用提供支持的相關數據集,讓羅氏聚焦于個性化醫(yī)療領域的突破性創(chuàng)新。

Cambridge Mobile Telematics (CMT)是全球最大的遠程信息處理服務提供商。該公司從設備收集傳感器數據,并使用上下文數據對其進行增強,從而創(chuàng)建車輛與駕駛員行為統(tǒng)一的視圖,供汽車保險公司、汽車制造商、商業(yè)移動公司以及公共部門用于支持風險評估、安全、理賠和駕駛員改進計劃。CMT存儲并分析來自全球數百萬物聯(lián)網設備的多PB級數據。隨著公司規(guī)模的擴大,為提出新見解和開發(fā)新模型而定位特定數據變得越來越有挑戰(zhàn)性。借助 Amazon S3 Metadata(包括系統(tǒng)元數據和自定義元數據),CMT能夠查詢PB級元數據,使查找相關數據變得簡單且經濟高效。

Amazon S3 Tables現已正式可用,Amazon S3 Metadata現推出預覽版。Amazon S3 Tables與Amazon Glue Data Catalog集成現已預覽可用,客戶可使用亞馬遜云科技的分析服務(如 Amazon Athena、Amazon Redshift、Amazon EMR 和 Amazon QuickSight)對包括Amazon S3 Metadata Tables在內的數據進行查詢和可視化操作。

本站聲明: 本文章由作者或相關機構授權發(fā)布,目的在于傳遞更多信息,并不代表本站贊同其觀點,本站亦不保證或承諾內容真實性等。需要轉載請聯(lián)系該專欄作者,如若文章內容侵犯您的權益,請及時聯(lián)系本站刪除。
換一批
延伸閱讀

9月2日消息,不造車的華為或將催生出更大的獨角獸公司,隨著阿維塔和賽力斯的入局,華為引望愈發(fā)顯得引人矚目。

關鍵字: 阿維塔 塞力斯 華為

加利福尼亞州圣克拉拉縣2024年8月30日 /美通社/ -- 數字化轉型技術解決方案公司Trianz今天宣布,該公司與Amazon Web Services (AWS)簽訂了...

關鍵字: AWS AN BSP 數字化

倫敦2024年8月29日 /美通社/ -- 英國汽車技術公司SODA.Auto推出其旗艦產品SODA V,這是全球首款涵蓋汽車工程師從創(chuàng)意到認證的所有需求的工具,可用于創(chuàng)建軟件定義汽車。 SODA V工具的開發(fā)耗時1.5...

關鍵字: 汽車 人工智能 智能驅動 BSP

北京2024年8月28日 /美通社/ -- 越來越多用戶希望企業(yè)業(yè)務能7×24不間斷運行,同時企業(yè)卻面臨越來越多業(yè)務中斷的風險,如企業(yè)系統(tǒng)復雜性的增加,頻繁的功能更新和發(fā)布等。如何確保業(yè)務連續(xù)性,提升韌性,成...

關鍵字: 亞馬遜 解密 控制平面 BSP

8月30日消息,據媒體報道,騰訊和網易近期正在縮減他們對日本游戲市場的投資。

關鍵字: 騰訊 編碼器 CPU

8月28日消息,今天上午,2024中國國際大數據產業(yè)博覽會開幕式在貴陽舉行,華為董事、質量流程IT總裁陶景文發(fā)表了演講。

關鍵字: 華為 12nm EDA 半導體

8月28日消息,在2024中國國際大數據產業(yè)博覽會上,華為常務董事、華為云CEO張平安發(fā)表演講稱,數字世界的話語權最終是由生態(tài)的繁榮決定的。

關鍵字: 華為 12nm 手機 衛(wèi)星通信

要點: 有效應對環(huán)境變化,經營業(yè)績穩(wěn)中有升 落實提質增效舉措,毛利潤率延續(xù)升勢 戰(zhàn)略布局成效顯著,戰(zhàn)新業(yè)務引領增長 以科技創(chuàng)新為引領,提升企業(yè)核心競爭力 堅持高質量發(fā)展策略,塑強核心競爭優(yōu)勢...

關鍵字: 通信 BSP 電信運營商 數字經濟

北京2024年8月27日 /美通社/ -- 8月21日,由中央廣播電視總臺與中國電影電視技術學會聯(lián)合牽頭組建的NVI技術創(chuàng)新聯(lián)盟在BIRTV2024超高清全產業(yè)鏈發(fā)展研討會上宣布正式成立。 活動現場 NVI技術創(chuàng)新聯(lián)...

關鍵字: VI 傳輸協(xié)議 音頻 BSP

北京2024年8月27日 /美通社/ -- 在8月23日舉辦的2024年長三角生態(tài)綠色一體化發(fā)展示范區(qū)聯(lián)合招商會上,軟通動力信息技術(集團)股份有限公司(以下簡稱"軟通動力")與長三角投資(上海)有限...

關鍵字: BSP 信息技術
關閉