眾所周知,LakeHouse 架構(gòu)是當(dāng)前大數(shù)據(jù)領(lǐng)域領(lǐng)先的技術(shù)架構(gòu)之一。LakeHouse 由海外知名大數(shù)據(jù)公司 Databricks 提出,旨在融合數(shù)據(jù)湖的靈活性及成本效益與傳統(tǒng)數(shù)據(jù)倉庫的強(qiáng)大事務(wù)支持、高性能分析能力于一體,并且能夠無縫集成機(jī)器學(xué)習(xí)等多種應(yīng)用場景,為企業(yè)提供了更加全面的數(shù)據(jù)管理和分析平臺(tái)。
Apache Spark 作為近十幾年來大數(shù)據(jù)領(lǐng)域最優(yōu)秀的開源項(xiàng)目之一,提供了強(qiáng)大統(tǒng)一的大數(shù)據(jù)處理和分析能力,涵蓋了實(shí)時(shí)離線數(shù)據(jù)處理、SQL、圖計(jì)算、機(jī)器學(xué)習(xí)及深度學(xué)習(xí)等多個(gè)維度,作為 LakeHouse 的核心組件,Spark 在大數(shù)據(jù)和AI方向持續(xù)發(fā)力。
Apache Paimon 作為新興的數(shù)據(jù)湖存儲(chǔ)技術(shù),最初在Flink社區(qū)中以 Flink Table Store項(xiàng)目孵化。2023 年,Paimon獨(dú)立出來成為一個(gè) Apache Incubator項(xiàng)目,2024 年 4 月完成孵化成為了一個(gè)Apache頂級(jí)項(xiàng)目。Apache Paimon 采用開放的數(shù)據(jù)格式和技術(shù)理念,提供高吞吐、低延遲的數(shù)據(jù)攝入、更新及查詢能力,且與諸多業(yè)界主流計(jì)算對(duì)接,是 LakeHouse 架構(gòu)中不可或缺的一部分。
為了助力 LakeHouse 架構(gòu)在企業(yè)中的實(shí)踐與落地,阿里云 EMR 技術(shù)團(tuán)隊(duì)聯(lián)合 Apache Paimon 社區(qū),聯(lián)合舉辦“ Apache Spark & Paimon, 助力 LakeHouse 架構(gòu)生產(chǎn)落地”線下 meetup,邀請阿里云、VIVO、美團(tuán)等眾多業(yè)內(nèi)大咖分享 LakeHouse 架構(gòu)的核心技術(shù)和最佳實(shí)踐經(jīng)驗(yàn),為大數(shù)據(jù)從業(yè)者提供一個(gè)開放的分享與交流平臺(tái)。
活動(dòng)詳情
● 活動(dòng)時(shí)間:2024年11月15日 13:30-17:30(周五)
● 活動(dòng)地點(diǎn):北京市朝陽區(qū)阿里中心-望京A座-05F
● 報(bào)名方式:掃描下方二維碼或點(diǎn)擊鏈接進(jìn)行報(bào)名
https://hd.aliyun.com/form/5276
活動(dòng)亮點(diǎn)
1. 業(yè)內(nèi)大咖云集
本次 Meetup 特邀阿里云、VIVO、美團(tuán)等知名企業(yè)的技術(shù)專家現(xiàn)場分享,將為大家?guī)碜钋把氐募夹g(shù)洞察和實(shí)踐經(jīng)驗(yàn),分享他們在 LakeHouse 架構(gòu)實(shí)施過程中遇到的挑戰(zhàn)與解決方案。
2. 深入探討 LakeHouse 架構(gòu)
LakeHouse 架構(gòu)作為一種新興的大數(shù)據(jù)存儲(chǔ)與處理架構(gòu),融合了數(shù)據(jù)湖和數(shù)據(jù)倉庫的優(yōu)勢。本次活動(dòng)將深入探討LakeHouse 架構(gòu)的核心技術(shù),包括數(shù)據(jù)采集、數(shù)據(jù)存儲(chǔ)、數(shù)據(jù)分析、數(shù)據(jù)管理等多個(gè)方面,幫助企業(yè)更好地理解和應(yīng)用這一創(chuàng)新架構(gòu)。
3. Apache Spark 與 Paimon 的深度整合
Apache Spark 作為大數(shù)據(jù)處理的利器,與 Paimon 的深度整合將帶來更加強(qiáng)大的數(shù)據(jù)處理能力。本次 Meetup 將詳細(xì)介紹 Spark 與 Paimon 的集成實(shí)踐,分享在具體項(xiàng)目中的應(yīng)用案例,展示其在提升數(shù)據(jù)處理效率方面的卓越表現(xiàn)。
4. 最佳實(shí)踐與成功案例分享
除了技術(shù)的探討,本次 Meetup 還將分享多個(gè)企業(yè)在 LakeHouse 架構(gòu)實(shí)踐中的成功案例。通過這些最佳實(shí)踐,您將了解到不同企業(yè)在不同場景下的應(yīng)用經(jīng)驗(yàn),找到適合自己企業(yè)的解決方案,從而推動(dòng)業(yè)務(wù)的創(chuàng)新與發(fā)展。
期待您的參與
無論您是大數(shù)據(jù)技術(shù)愛好者,還是企業(yè)技術(shù)決策者,都能通過本次活動(dòng)找到有價(jià)值的信息與靈感。我們期待與您在活動(dòng)現(xiàn)場相見,共同開啟 LakeHouse 架構(gòu)的探索之旅!
EMR Serverless Spark 版是開源大數(shù)據(jù)平臺(tái) E-MapReduce 基于 Spark 提供的一款全托管、一站式的數(shù)據(jù)計(jì)算平臺(tái),它為用戶提供任務(wù)開發(fā)、調(diào)試、發(fā)布、調(diào)度和運(yùn)維等全方位的產(chǎn)品化服務(wù)。EMR Serverless Spark 完全兼容 Paimon,通過內(nèi)置的 DLF 的元數(shù)據(jù)實(shí)現(xiàn)了和其余阿里云產(chǎn)品如實(shí)時(shí)計(jì)算 Flink 版的元數(shù)據(jù)互通,形成了完整的流批一體的解決方案。同時(shí)支持靈活的作業(yè)運(yùn)行方式和參數(shù)配置,能夠滿足實(shí)時(shí)分析、生產(chǎn)調(diào)度等多項(xiàng)需求。阿里云 EMR Serverless Spark 版已于2024年9月14日正式商業(yè)化售賣,歡迎體驗(yàn)!