您的位置:
首頁
>>
管理中心
>>
行業資訊
>>修改新聞資訊信息
資訊類型:
行業要聞
企業動態
新品速遞
解決方案
交流培訓
嘉賓訪談
產業縱橫
人物聚焦
展會動態
會展報告
本站動態
標 題:
*
頁面廣告:
不顯示
顯示
副 標 題:
關 鍵 字:
多個關鍵字請用“
/
”分隔,如:西門子/重大新聞
內容描述:
新聞來源:
鏈 接:
責任編輯:
標題圖片:
無
當編輯區有插入圖片時,將自動填充此下拉框
*
所屬類別:
(不超過20項)
電源產品分類
:
UPS電源
穩壓電源
EPS電源
變頻電源
凈化電源
特種電源
發電機組
開關電源(AC/DC)
逆變電源(DC/AC)
模塊電源(DC/DC)
電源應用分類
:
通信電源
電力電源
車載電源
軍工電源
航空航天電源
工控電源
PC電源
LED電源
電鍍電源
焊接電源
加熱電源
醫療電源
家電電源
便攜式電源
充電機(器)
勵磁電源
電源配套分類
:
功率器件
防雷浪涌
測試儀器
電磁兼容
電源IC
電池/蓄電池
電池檢測
變壓器
傳感器
軸流風機
電子元件
連接器及端子
散熱器
電解電容
PCB/輔助材料
新能源分類
:
太陽能(光伏發電)
風能發電
潮汐發電
水利發電
燃料電池
其他類
:
其他
靜態頁面:
生成靜態頁面
*
內 容:
<P align=center> Cloudera首席技術官Ram Venkatesh</P> <P align=center> Cloudera產品管理副總裁Priyank Patel</P> <P> Cloudera客戶運行著地球上最大的一些數據湖。這些湖為關鍵任務大規模數據分析、商業智能(BI)和機器學習用例,包括企業數據倉庫,提供動力。近年來,創造了“數據湖倉”一詞來描述這種對數據湖中的數據進行表分析的架構模式。在匆匆奔向這個術語的過程中,許多廠商忽略了這樣一個事實,即數據架構的開放性是其持久性和長盛不衰的保證。</P> <P> 關于數據倉庫和數據湖</P> <P> 數據湖和數據倉庫將海量的各種類型數據統一到一個中心位置。但是有著截然不同的架構世界觀。數倉是為SQL分析垂直集成的,而數據湖優先考慮SQL之外的分析方法的靈活性。</P> <P> 為了能兼得魚與熊掌——數據湖中分析的靈活性和數倉中簡單快速的SQL,企業經常部署數據湖來補充他們的數倉,在數據提取、轉換、加載(ETL)或ELT管道的最后一步讓數據湖為數倉系統提供數據。在這樣做的過程中,他們等于接受了數據在倉庫中的鎖定。</P> <P> 但可以有一個更好的方法:用Hive元存儲,這是過去十年數據平臺一個出人意料的好產品。隨著用例的成熟,我們看到高效的交互式BI分析和事務語義來修改數據的需求。</P> <P> 數據湖倉的迭代</P> <P> 第一代Hive元存儲試圖解決在數據湖上高效運行SQL的性能考慮。它提供了數據庫、模式和表的概念,用于描述數據湖的結構,讓BI工具可以有效地充分使用數據。它添加了描述數據邏輯和物理布局的元數據,支持基于成本的優化器、動態分區裁剪以及針對SQL分析的一些關鍵性能改進。</P> <P> 第二代Hive元存儲添加了對使用Hive ACID的事務更新的支持。數據湖倉雖然尚未正式命名,但已開始熱鬧。事務性啟用了持續攝取和插入/更新/刪除(或合并)的用例,從而打開了數倉樣式的查詢、功能以及從其他數倉系統到數據湖的遷移。這對我們的許多客戶來說非常有價值。</P> <P> Delta Lake項目采用不同的方法來解決這個問題。Delta Lake為數據湖中的數據添加了事務支持。可以進行數據策管,為數據湖帶來了運行數倉式分析的可能性。</P> <P> 漸漸的在某個時刻,“數據湖倉”這個詞因為這種架構模式而被造出來了。我們相信湖倉是簡潔地定義這種模式的好方法,并很快在客戶和行業中獲得了共識。</P> <P> 開放數據湖倉滿足互操作性需求</P> <P> 在過去幾年中,隨著新數據類型的誕生和新的數據處理引擎的出現,為了簡化分析,企業所期望的兩全其美真的需要分析引擎的靈活性。如果企業海量有價值的數據需要被管理,那么企業必須能夠開放的選擇不同的分析引擎,甚至是供應商。</P> <P> 湖倉模式在實施過程中存在一個嚴重的矛盾:雖然數據湖是開放的,但湖倉卻不是。</P> <P> 在能夠添加Impala、Spark等引擎之前,Hive元存儲一直遵循Hive為先的演進。Delta lake是Spark為主的演進;如果客戶想要自由選擇不同的引擎而不只是表格式,他們的選擇極為有限。</P> <P> 客戶從一開始就要求更多。更多格式、更多引擎、更多互操作性。今天,Hive元存儲被多個引擎和多個存儲選項使用。除了Hive和Spark,還有Presto、Impala等等。Hive元存儲是有機地演進支持這些用例,因此集成通常很復雜且容易出錯。</P> <P> 為滿足互操作性需求而設計的開放數據湖倉從根本上解決了這一架構問題。它會讓那些全押在一個平臺上的人感到不安,但社區驅動的創新能幫助解決現實世界的問題,以務實的方式幫助使用同類最佳工具,并克服供應商的鎖定。</P> <P> 開放湖倉Apache Iceberg的誕生</P> <P> Apache Iceberg從一開始構建時,其目標就是在多個分析引擎在云原生規模上輕松實現互操作。這項創新的誕生之地Netflix需要將100 PB規模的S3數據湖構建到數倉中,這可能是最佳示例了。云原生表格式由其創建者開源到Apache Iceberg中。</P> <P> Apache Iceberg真正的超級力量是它的社區。在過去三年中,Apache Iceberg社區有機地蓬勃發展,增加了一系列令人贊嘆的優異集成:</P> <P> 數據處理和SQL引擎Hive、Impala、Spark、PrestoDB、Trino、Flink</P> <P> 多種文件格式:Parquet、AVRO、ORC</P> <P> 社區中的大型采用者:Apple、LinkedIn、Adobe、Netflix、Expedia等</P> <P> AWS Athena、Cloudera、EMR、Snowflake、騰訊、阿里巴巴、Dremio、Starburst的托管服務</P> <P> 使這個多樣化的社區蓬勃發展的原因是數千家公司的集體需求,以確保數據湖可以演變為包含數據倉庫,同時保持跨引擎的分析靈活性和開放性。這使得開放式湖倉成為可能:為未來提供無限的分析靈活性。</P> <P> Cloudera擁抱Iceberg模式</P> <P> 在Cloudera,我們為我們的開源根基感到自豪,并致力于社區貢獻。自2021年以來,我們為日益壯大的Iceberg社區在Impala、Hive、Spark和Iceberg上做出了數百項貢獻。我們擴展了Hive元存儲將集成添加到我們的許多開源引擎中以充分利用Iceberg表。2022年初,我們在Cloudera Data Platform(CDP)中提供了Apache Iceberg的技術預覽,使Cloudera客戶能夠在我們的數據倉庫、數據工程和機器學習服務中實現Iceberg的模式和時間旅行能力。</P> <P> 我們的客戶一直告訴我們,無論是現代BI、AI/ML、數據科學還是更多,分析需求都在迅速發展。選擇由Apache Iceberg提供支持的開放數據湖倉讓企業可以自由選擇分析。</P>
主站蜘蛛池模板:
香蕉蕉亚亚洲aav综合
|
综合欧美亚洲日本
|
国产精品日韩欧美久久综合
|
天天综合久久久网
|
国产欧美日韩综合精品一区二区
|
亚洲综合久久久
|
91精品一区二区综合在线
|
亚洲狠狠爱综合影院婷婷
|
国产精品九九久久精品女同亚洲欧美日韩综合区
|
综合欧美亚洲日本
|
国产精品天干天干在线综合
|
亚洲一区综合在线播放
|
青青热久久综合网伊人
|
狠狠色丁香婷婷综合激情
|
狠狠狠色丁香婷婷综合久久五月
|
天天干天天色综合
|
激情综合丁香五月
|
久久综合久久综合亚洲
|
2021精品国产综合久久
|
精品久久人人做人人爽综合
|
狠狠久久综合伊人不卡
|
一本一本久久a久久精品综合麻豆
|
亚洲国产aⅴ综合网
|
色欲综合久久中文字幕网
|
久久91精品综合国产首页
|
伊人久久综合精品无码AV专区
|
乱欧美综合
|
精品国产综合区久久久久久
|
狠狠色婷婷七月色综合
|
亚洲综合伊人久久综合
|
天天综合久久一二三区
|
天天av天天翘天天综合网
|
久久九色综合九色99伊人
|
国产成人综合精品一区
|
国产色综合天天综合网
|
精品福利一区二区三区精品国产第一国产综合精品
|
中文字幕乱码人妻综合二区三区
|
亚洲图片综合区
|
伊伊人成亚洲综合人网7777
|
狠狠狠色丁香婷婷综合久久五月
|
色综合网天天综合色中文男男
|