欧美中文字幕第一页-欧美中文字幕一区-欧美中文字幕一区二区三区-欧美中文字幕在线-欧美中文字幕在线播放-欧美中文字幕在线视频

對話云器科技喻思成:AI助增云湖倉需求

我是創始人李巖:很抱歉!給自己產品做個廣告,點擊進來看看。  

對話云器科技喻思成:AI助增云湖倉需求

上個月,Databricks 宣布 Meta 已成為其投資者之一,參與了最近一輪總額達到 100 億美元的融資,據悉,這是風投史上規模最大的一次投資之一。至此,Databricks 估值已達 640 億美元。

融資熱度持續上漲的 Databricks 背后所代表的技術風向,是其于 2020 年提出的“湖倉一體”。這一概念在數倉領域激起千層浪,成立于 2021 年的云器科技,便是該理念的踐行者之一。云器在成立之初就專注于云湖倉,并于去年開始落地商業化。今年 1 月,云器 Lakehouse 向全球用戶開放注冊,目前單日 SQL transaction 已經接近千萬。

“任何一個技術不成為產品是沒有作用的,任何一個產品如果不能商業化也是沒有意義的”,云器科技 CEO 喻思成向雷峰網說道。創立云器科技前,喻思成曾任 Oracle 全球副總裁,后來成為阿里巴巴集團副總裁、阿里云國際業務負責人,將阿里云海外業務從零開始建立起來。

與同期許多技術驅動的初創公司不同,云器在成立之初便確立了“技術+產品+商業”三駕馬車齊頭并進的團隊架構,團隊成員主要自國內外頂尖云計算與大數據企業。早期仍在產品研發階段時,云器團隊便定下目標:與 100 家潛在客戶深度溝通,確保產品方向與市場需求對齊。

與雷峰網回顧商業化進程時,喻思成認為公司成立至今大方向始終沒有改變,一方面是對“湖倉一體”趨勢的預判與確信,AI 出現促進了人們對“湖倉一體”的需求;另一方面,也得益于及時跟進市場需求的團隊配合。

云器成立之初,目標就是全球的市場。他們的目標客戶是數據型企業中的遠見者——需要數據基礎設施,并實現數據的價值”。

但喻思成也感慨,云器接下來面對的挑戰,就是如何發展得更快一些。這是他的焦慮與野心:不希望云器做一家成長緩慢的公司,希望借下一代數據技術爆發時,云器能實現彎道超車。

以下是雷峰網在不改變談話原意的基礎上進行的對話整理。

對話云器科技喻思成:AI助增云湖倉需求 云器科技 CEO 喻思成


一個產品打中一千個人的痛點

雷峰網:您當時離開阿里開始創業,是什么契機讓您有這樣的決定?

喻思成:2020 至 2021 年期間,技術、商業模式和融資環境都經歷了重要變革。在技術領域,Snowflake 的成功上市以及 Databricks 等公司的快速發展,有力地證明了“一體化湖倉”是大數據架構的未來趨勢。此外,云計算市場格局也基本穩定,呈現出美國三大云廠商和中國四大云廠商的競爭態勢。在此背景下,云上湖倉作為下一代大數據處理技術方向,已得到確認。

此前,大數據技術經歷了多個演進階段,從 Teradata 到 Hadoop,再到各大云平臺自研的大數據平臺,比如阿里云 Maxcompute 。發展至今,涌現出 Databricks 、云器 Lakehouse 等跨云、多云中立的數據平臺產品。正如我之前在阿里云體會到的,如果多云一體化云湖倉是未來方向,那么在單一云平臺內部實現真正的多云架構,將面臨諸多挑戰——因此,才有了離開阿里創業的契機。

雷峰網:云器在 2021 年成立之初就已經錨定了要做云湖倉嗎?當時商業化策略是什么樣的?

喻思成:對,最初計劃在兩年內研發產品,然后開始商業化。預期是先聚焦中國市場、再拓展亞洲市場,將來考慮歐美,大方向從未改變。截止到 2024 年底,云器經歷了一年多的商業化,我們對市場環境的整體體感是,雖然國內商業環境不如 2021 年的預期,但海外市場并沒有太大回退,云器依然收獲不少客戶,整體運行在快速發展的軌道上。

雷峰網:去年這一年在做商業化,是指已經走完 PMF(Product Market Fit,產品和市場達到最佳的契合點)階段了嗎?

喻思成:目前云器已經落地幾十個付費客戶,營收增長比較快,在阿里、騰訊、AWS、GCP 等平臺上都已經有生產的客戶。在這些平臺上單日 SQL transaction 已經接近千萬。但我認為 PMF 是一個持續的過程,到今天都不覺得我們 PMF 走完了。

比如云器的核心優勢是獨創的增量計算技術,對比傳統 數據 Infra 架構,效率提升極大。但初期切入時要更換客戶現有架構中的哪一塊組件?是需要不斷迭代的認知問題。不同客戶的業務、數據量、使用的技術架構都不同,因此痛點也不一樣??蛻艨赡苁褂枚鄠€組件組合的功能,比如用 Spark 做 ETL、用 Clickhouse 做 OLAP等。目前,我們在很多客戶實踐中逐漸摸索出來,替換 Spark 是最有效的方案。

雷峰網:現在云器出海進度如何?

喻思成:我們已經在東南亞實現商業化,也有幫助國內客戶在東南亞落地,但還未進入美國市場。出海方式既有“直客”模式,直接去服務客戶,也有跟合作伙伴合作,主要的合作伙伴是七朵云(云廠商),目前云器 Lakehouse 已經適配所有主流云平臺。

雷峰網:云器在今年 1 月 15 日宣布 Lakehouse 免費向全球開放注冊,為什么考慮這樣的舉措?

喻思成:云器 Lakehouse 產品正式發布是在 2023 年 7 月份,經過了 18 個月,我們得到了很多 Key accounts 驗證,PMF 走到一定階段后,我們有信心能承接大部分客戶的通用需求,因此在 2025 年初正式開放注冊。

雷峰網:免費意味著什么?

喻思成:數據普惠不是空談,用戶可以零成本啟動。

現在注冊的用戶飆升很快,客戶數量也超出預期。很多客戶是公司里的 Data infra 團隊,做企業大數據的基礎設施;當然也有使用這些基礎設施的人,做 Business Analytics、做 BI 的、做數據分析或數據開發的。

云器的 Compiler optimizer 都是完全自研,服務一個客戶和服務一千個客戶難度完全不一樣,系統壓力非常大,不只是峰值的問題,還包括設計一個產品要打中一千個人的痛點。

雷峰網 (公眾號:雷峰網) :云器有考慮跟 AI 的融合嗎?

喻思成:AI 方面一直在做,最近也有發布 AI 產品 Data GPT,通過 AI 大模型技術,讓不懂 SQL 的業務人員也可以直接用自然語言交互,內置的指標體系大模型可以把業務語言轉換成 SQL 查詢業務結果,并展示為報表或圖像。這是在云器 Lakehouse 基礎上的 AI 能力。

雷峰網:那未來會考慮做信創嗎?

喻思成:打造信創體系確實在規劃之中,我們目前正在跟相關部門積極溝通,推進國產化軟硬件的適配工作。當然,這也要視客戶的需求而定。云器早期的客戶主要集中在線上互聯網領域,如 SaaS、游戲、電商行業,但隨著產品能力逐漸被大部分企業認可,業務拓展到線下企業,例如車企,以及未來的銀行金融客戶,對信創的需求將會日益凸顯。因此,我們將根據市場需求,加大在相關領域的投入。


商業閉環從第一天開始培育

雷峰網:在開拓客戶過程中會面臨困難嗎?2021 年前后很多數據庫公司創業出來,當時云器創立后在商業化開拓客戶過程中,會存在數據庫市場被之前的公司占領、需要跟他們搶客戶的情況嗎?

喻思成:有,但這種情況往往不太多。目前在中國,我們跟存量的云廠商、大數據商業化平臺一起去服務和轉換的客戶,大部分是開源的使用者?,F在市面上 95% 的大數據平臺,都是使用者用開源軟件自己搭建的。但并非所有公司都適合用開源軟件去搭建一個大數據平臺,因為非常耗費人力和資源。自建數據平臺往往適合規模較大且技術較強的公司,對中小型公司、尤其小型公司來說,整體成本難以承受。比如,搭建一個大數據平臺需要至少 20 個組件工具,Spark、Clickhouse 等,Data infra 團隊少則兩三人、多則五六人,而且要百臺以上服務器,每年幾百萬固定的消耗。

從這個角度上說,云器提供了更高效、更經濟的解決方案去滿足不同企業需求。我們更多是轉換 95% 的藍海市場,而不是在已轉化好的 5% 市場里爭搶。

雷峰網:云器的客戶領域行業上分布也是以金融領域為重嗎,還是會更分散?

喻思成:實際上金融領域并不是我們最初的重點,我們更多關注線上垂直互聯網,或者叫 Digital native 企業。因為云器 Lakehouse 就是基于云誕生的,對客戶的云環境是最基本的要求。目前來看,Digital native 企業上云比例遠高于傳統企業。

雷峰網:云器的第一個商業化客戶是誰?

喻思成:一家為跨境電商建站的 SaaS 企業。

雷峰網:所以在云上打磨好之后,之后會去跟金融之類比較傳統的行業接觸嗎?

喻思成:是的,我們現在已經開始逐漸向線下拓展。雖然還不能在本地 IDC 機房里部署,但支持在私有云環境下安裝。

雷峰網:過去在工作中有印象比較深遇到什么困難嗎?

喻思成:我們在過去的一年中打了很多硬仗,比如拿下幾個旗艦級的客戶,如長安汽車、銷售易以及東南亞最大的電商物流公司 NinjaVan等。

初期,客戶對我們的增量計算技術的通用性、數據引擎技術的效率(數倍甚至十倍于現有架構),以及替代Spark引擎所能帶來的成本降低幅度,初期持懷疑態度。只有在實際測試體驗過我們的產品后,他們才逐漸認可。因此,如何快速贏得客戶信任,是我們目前面臨的主要挑戰。

為此,我們會組建由我(CEO)或 CTO 帶隊的專案組,內部稱之為“小黑屋”, 通常采用方案演示配合POC(概念驗證)的方式,并在客戶上線后,提供全托管的 SaaS 服務,接管其運維工作。這個過程短則一個季度,長的要三個季度。

雷峰網:過程中會有覺得困難想放棄的時候嗎?

喻思成:那倒沒有。困難是很多,但我們的團隊絕大部分來自于幾個頭部云廠商和互聯網廠商的核心團隊,服務過類似阿里這樣數據量、交易量都世界最頭部的客戶后,沒有哪個客戶是服務不了的。雖然創業資源有限,但我們堅持提供與頭部廠商同等甚至更高的服務標準。這要求團隊必須具備極強的戰斗力,而面對大型客戶,大家反而都感到非常興奮。

雷峰網:云器創立之初搭建的就是“商務+技術+產品”這樣一個完整的團隊組合,但同期很多數據庫公司早期可能會更專注于技術人員的配置上,為什么云器在創立之初就有考慮這樣的配置?

喻思成:云器從最初就重視商業化。在我們看來,任何一個技術不成為產品是沒有作用的,任何一個產品不能商業化也是沒有意義的。很多技術聽起來高大上,但不能產品化;或者產品聽起來很好但客戶不買單。我們不希望悶頭做兩年產品后到市場上發現完全不對,再回去從頭開始閉門造車。

雷峰網:所以在前期打磨產品時已經一邊去跟市場接觸、了解用戶需求。

喻思成:對。我們在產品研發時,商業化團隊就定了一個目標:要和 100 個客戶接觸,問他們“我目前準備做這個產品,你會不會買單”。


在新技術來臨前占據好位置

雷峰網:您感覺國內數據庫市場發展到現在,比起云器創立初期來說有什么變化?

喻思成:這是個好問題。我個人覺得,2021 年大家已經感受到整個市場在未來十年內會有大升級,所以很多人出來創業。但到 2024 年市場環境經濟形勢不如人意,包括云器在內的一些公司,選擇出海,國內外同時布局。但全球來看,2021 年看到的未來十年整個代際升級的趨勢依然存在,Databricks 最近的融資也可以看出, AI 浪潮下的 Data Infra 需求呈幾倍甚至指數級增長。

其實很多國內做大數據平臺的友商聚焦點不一樣。有的做最上層的 BI 展現,再往下可能是指標,做數據精細化加工,還有做數據中臺,再往下有專門做 ETL 編排的,都是為了幫助客戶把數據真正用起來,數據已經有了,如何讓數據幫客戶產生更好的價值。云器是做最底下那一層,數倉,離客戶的直接業務還是比較遠,更偏技術性。所以雖然也感受到經濟的起伏,但感受到的并不像其他友商那么多。

雷峰網:感受不像其他友商那么多,是因為技術上的需求不會因為經濟波動有很大的影響?

喻思成:對,因為上層或者越往上靠的廠商,要了解客戶的業務和行業,要回答的問題是怎么幫客戶用數據賺錢。但云器的客戶大部分都是“成熟客戶”,如果客戶上來就說“我手里有數據但我不知道怎么變現”,那這就不是我們的客戶。

雷峰網:現在大家都在做數據普惠化。

喻思成:我們也在做數據普惠化。目前開放注冊后企業可以以零成本啟動,再按需付費。很多客戶希望能以低成本進行數據處理,而不是投入百萬級別的資金來搭建大平臺。云器的最低消費客戶每月只需支付大約 10 元人民幣,這大大降低了使用成本。

雷峰網:所以您講的“成熟客戶”,也是云器在選客戶時著重看的標準是嗎?

喻思成:對。舉個例子,如果數據是原材料,大數據平臺就是廚房,客戶做數據分析的人員就是廚師,其用戶就是外面的食客。我們看一個客戶是不是成熟,就看這個食客比例有多高。如果這個企業里有 30% 以上的人沒有數據就開不了工,說明它真的是數據驅動型企業;但如果整個公司數據只有老板定期看看報表,這就不是一個很成熟的企業。

云器是做廚具的,讓客戶只需要留下廚師,不需要另起爐灶。成熟的客戶就像廚師,他們知道如何做菜,而我們的工具就是幫助他們做得更好。

雷峰網:您也提過中國用戶對數據平臺的選擇很多時候不是簡單常理推論可得,不是一個特別容易拓展的市場,您觀察到大家有些什么樣的選擇特點?

喻思成:中國的客戶大致分為兩類:一種是能獨立做菜的,另一種是不知道怎么做菜的。對于后者,最開始要解決的就是要給他們提供咨詢服務,告訴他們 Data monetization(數據價值實現) 如何做。隨著市場的發展,越來越多企業能自己做菜,但偏向咨詢的業務模式并不適合我們,我們更傾向于做產品型公司。

雷峰網:Databricks 在 2020 年提出湖倉一體,當時還是比較新的概念。現在發展到 2025 年,您對湖倉一體的認知上會有什么變化嗎?

喻思成:沒有變化過。我們很幸運,當時就堅定地做下來。AI 大模型的出現將加速這一趨勢,未來幾乎所有企業都能利用它來實現 AI 應用,將結構化和非結構化數據存儲在一個 Lakehouse 中,滿足不同客戶的需求。

雷峰網:眼下推進湖倉一體會面臨什么難點嗎?

喻思成:沒有太大障礙,大家基本默認數據庫底下要用湖倉一體,這也是為什么 Databricks 這幾年估值漲得非常快;另外我們也看到更多機會,例如在云湖倉上有更高時效性的數據分析的需求。

雷峰網:會有新出現的技術給湖倉一體落地帶來挑戰嗎?

喻思成:目前沒有,湖倉架構本身已經得到業界廣泛認可,主要還是一個標準花落誰家的問題。就像目前數據庫三個標準,Delta Lake、Hudi,之前 Databricks 把 Iceberg 也收購了,就看最后誰來掌控數據湖的標準。而我們思考的是提前布局,構建更加“一體化”融合的數據平臺。因此云器發布的包括一體化引擎 Single-Engine,以及實現的通用“增量計算”技術,正是為了提前布局下一代數據平臺的技術能力,應對未來更深層次的融合需求。

雷峰網:這幾年云器商業化過程中會面臨什么困難嗎?

喻思成:我們到今天為止,最大的困難都還是怎么能發展得更快一些。我們的商業化版圖一直在擴張,但始終對我們來說最大的問題都是怎么能跑得快一些、再快一些。

雷峰網:是覺得有哪里發展得慢了,有些焦慮嗎?

喻思成:我們不希望做一個緩慢成長的公司。

雷峰網:怎么定義“緩慢成長”?

喻思成:很多人說“慢即是快”,它確實有哲學含義,但我覺得還是要能很快在一個商業化環境里迭代驗證自己。2021 年數倉向數據湖發展,2023 年就開始出現生成式AI(GenAI),迭代速度會越來越快。Deepseek 出現后,下一個 Deepseek 很快就會出現。我們希望在下一代技術來臨前,占據一個好的位置、一個領導者的位置。


專題介紹

2020年前后,國產數據庫創業大潮洶涌。然而,隨著AI大模型的出現,人們視線的聚焦與資本的興趣也發生轉變。五年過去,國內的數據庫公司現狀如何?他們在做什么新的嘗試?又遇到什么新的困難?本專題與一系列數據庫創業公司的創始人對話,回顧近年數據庫公司在商業和技術領域的探索。縱然面對數據庫市場的寒冬,從業者們各有招數,懷揣著對數據庫的理想與確信,走出各具特色的商業化之路。我們誠邀對此專題感興趣的從業者共同參與討論,或是作為受訪對象分享您的真知灼見。歡迎添加微信 Ericazhao23。

雷峰網原創文章,未經授權禁止轉載。詳情見 轉載須知 。

隨意打賞

提交建議
微信掃一掃,分享給好友吧。
主站蜘蛛池模板: 美国一级毛片aa | 免费日b视频 | 黄色毛片免费看 | 九九黄色大片 | 日韩成人一级 | 久久天天躁狠狠躁夜夜爽 | 四虎永久在线精品国产免费 | 久草看片 | 精品视频h| 色播99| 91精品视频在线看 | 羞羞网站在线播放 | 久久福利免费视频 | 国产精品素人福利 | 亚洲视频一 | 欧美在线一级毛片观看 | 九九热在线免费 | 特级毛片s级全部免费 | www.亚洲一区二区三区 | 国产色站| 青草香蕉精品视频在线观看 | 狠狠色综合久久婷婷色天使 | 国产精品1区 | 狠狠色狠狠色很很综合很久久 | 亚洲韩国日本一级二级r级 亚洲韩精品欧美一区二区三区 | 午夜欧美精品久久久久久久久 | 久re这里只有精品最新地址 | 97人人在线观看 | 久久综合给合久久狠狠狠色97 | 亚洲欧美在线看 | 天海翼一区二区三区高清视频 | 中国特级黄一级真人毛片 | 最新国产午夜精品视频成人 | 久久精品日日躁夜夜躁欧美 | 97在线视频免费观看费观看 | 在线视频一区二区日韩国产 | 久久爱噜噜噜噜久久久网 | 久久伊人精品 | 久久99国产精品成人 | 亚洲成人在线免费 | 九九九九九热 |