智能體上崗, 數(shù)據(jù)庫(kù) SQL 驚險(xiǎn)事故成過去式?
在大模型狂飆兩年之后,行業(yè)進(jìn)入“應(yīng)用見真章”的階段。在 2025 騰訊全球數(shù)字生態(tài)大會(huì)上,騰訊云發(fā)布數(shù)據(jù)庫(kù)AI服務(wù),其中有多款智能體——SQL 事前風(fēng)險(xiǎn)預(yù)測(cè)、DDL 變更風(fēng)險(xiǎn)評(píng)估、高負(fù)載止損值守等。?
數(shù)據(jù)庫(kù)領(lǐng)域可以開發(fā)智能體的方向也有很多,騰訊云為什么會(huì)選擇從 SQL 風(fēng)險(xiǎn)治理入手?騰訊云數(shù)據(jù)庫(kù)副總經(jīng)理羅云對(duì)雷峰網(wǎng) (公眾號(hào):雷峰網(wǎng)) 表示,主要因?yàn)檫@是最痛點(diǎn)、最難解決的環(huán)節(jié)。“2024 到 2025 年,我們每個(gè)月都觀察到有客戶因?yàn)?SQL 使用不當(dāng),導(dǎo)致數(shù)據(jù)庫(kù)出現(xiàn)風(fēng)險(xiǎn)事件。”
騰訊云講述過一個(gè)案例:在一次交易數(shù)據(jù)清理過程中,由于一條優(yōu)化不當(dāng)?shù)?SQL 語(yǔ)句遺漏了關(guān)鍵索引,導(dǎo)致核心交易表被全表掃描。問題發(fā)生在交易時(shí)段,瞬間引發(fā)大量指令受阻,訂單提交接連超時(shí),部分跨境交易也因此受到影響。最終,依靠風(fēng)控系統(tǒng)的緊急處理才避免了更大范圍的系統(tǒng)癱瘓。
為何 SQL 使用不到風(fēng)險(xiǎn)如此之高呢?其中根因源于,數(shù)據(jù)庫(kù)的開發(fā)者與 DBA 之間,長(zhǎng)期存在一道難以逾越的“認(rèn)知鴻溝”。
開發(fā)團(tuán)隊(duì)熟悉業(yè)務(wù)邏輯和代碼,常通過 ORM 框架生成 SQL,卻對(duì)底層數(shù)據(jù)庫(kù)運(yùn)行機(jī)制了解有限;DBA 則精通數(shù)據(jù)庫(kù)內(nèi)核和 SQL 優(yōu)化,但難以在開發(fā)環(huán)節(jié)進(jìn)行前置干預(yù)。結(jié)果是,一旦風(fēng)險(xiǎn) SQL 引發(fā)故障,DBA 往往只能被動(dòng)“救火”,而根源難以追溯。
今年 2、3 月開始,騰訊云數(shù)據(jù)庫(kù)團(tuán)隊(duì)開啟了智能體的開發(fā),就是試圖解決的是開發(fā)者與數(shù)據(jù)庫(kù)管理員(DBA)之間長(zhǎng)期存在的“鴻溝”,羅云談到。
SQL 事前風(fēng)險(xiǎn)預(yù)測(cè)智能體,就像提交前的“安全檢查員”,提前發(fā)現(xiàn)可能讓數(shù)據(jù)庫(kù)變慢或出問題的 SQL,提醒開發(fā)者修改。DDL 變更風(fēng)險(xiǎn)評(píng)估智能體,像改動(dòng)前的“模擬演練教練”,先測(cè)試數(shù)據(jù)庫(kù)結(jié)構(gòu)變更是否會(huì)影響系統(tǒng)穩(wěn)定,讓風(fēng)險(xiǎn)在上線前被發(fā)現(xiàn)。高負(fù)載止損值守智能體,像數(shù)據(jù)庫(kù)的“安全衛(wèi)士”,實(shí)時(shí)監(jiān)控,當(dāng)系統(tǒng)壓力過大時(shí)自動(dòng)采取保護(hù)措施,避免業(yè)務(wù)崩潰。
據(jù)羅云對(duì)雷峰網(wǎng)透露,智能體的開發(fā),底下依托的是垂直數(shù)據(jù)庫(kù)大模型,并結(jié)合全域上下文和工具集三大基座。?
騰訊云的垂直數(shù)據(jù)庫(kù)大模型的自研最早可以追溯到2023 、2024年,一開始他們通過有監(jiān)督微調(diào)(SFT)補(bǔ)課專業(yè)能力,靠人工標(biāo)注數(shù)據(jù)搭起基礎(chǔ),2025 年 DeepSeek 出現(xiàn)后,全面轉(zhuǎn)向強(qiáng)化學(xué)習(xí),用更復(fù)雜的獎(jiǎng)勵(lì)機(jī)制逼迫模型自我優(yōu)化。
當(dāng)然,這過程中也遇到過不少的難點(diǎn),比如做 SFT(有監(jiān)督微調(diào))的難點(diǎn)是語(yǔ)料和數(shù)據(jù)集,團(tuán)隊(duì)需要大量人工投入,對(duì)每一個(gè)案例進(jìn)行標(biāo)注:哪些 SQL 或代碼生成是正確的,哪些是不符合要求的。這個(gè)數(shù)據(jù)標(biāo)注過程非常耗時(shí),但決定了模型在專業(yè)任務(wù)上的基礎(chǔ)能力。
強(qiáng)化學(xué)習(xí)(Reinforcement Learning) ?重點(diǎn)在于獎(jiǎng)勵(lì)模型的設(shè)計(jì)。在強(qiáng)化學(xué)習(xí)中,模型每一次輸出都需要評(píng)估:是“做得更好”還是“退步了”?團(tuán)隊(duì)花了很多時(shí)間設(shè)計(jì)算法和評(píng)分機(jī)制,去判斷每一次生成的 Token 的質(zhì)量,從而讓模型在實(shí)際使用中不斷優(yōu)化。
目前這這些智能體已經(jīng)在騰訊內(nèi)部多部門使用,對(duì)外客戶目前也在同步進(jìn)行交流中,預(yù)計(jì)明年會(huì)對(duì)外服務(wù)。
對(duì)于智能體的商業(yè)化問題,羅云認(rèn)為,不要從短期市場(chǎng)規(guī)模出發(fā),而是押注長(zhǎng)期戰(zhàn)略價(jià)值。羅云判斷,數(shù)據(jù)庫(kù)智能體未來(lái)真正的商業(yè)回報(bào)不在“風(fēng)險(xiǎn)防控”本身,而在兩個(gè)方向:第一是,Data Insight:幫企業(yè)“淘金”,挖掘數(shù)據(jù)價(jià)值,付費(fèi)意愿遠(yuǎn)高于守住底線;第二是智能體支持套件:當(dāng)甲方通過智能體賺錢后,配套工具的變現(xiàn)空間巨大。
在數(shù)據(jù)庫(kù)產(chǎn)品線宣布推出Agent 之前,幾乎所有產(chǎn)品都在探索AI,一方面將 AI 的功能加入到原有的產(chǎn)品中,比如在騰訊會(huì)議中加入了實(shí)時(shí) AI 紀(jì)要功能,另一方面正在開發(fā)更多的 AI 原生應(yīng)用,比如說(shuō)CodeBuddy ima等已經(jīng)對(duì)外推出,分別應(yīng)用于企業(yè)開發(fā)、知識(shí)庫(kù)管理。
那么,為什么騰訊會(huì)選擇在今年加速布局智能體??
羅云認(rèn)為,這與時(shí)機(jī)密切相關(guān)。早一年做可能還不合適,因?yàn)楫?dāng)時(shí)底層大模型還在快速迭代,應(yīng)用層開發(fā)容易因模型變化被推倒重來(lái)。而如今大模型迭代速度趨于平緩,應(yīng)用開發(fā)更穩(wěn)定可控。
在這樣的技術(shù)判斷下,上半年騰訊內(nèi)部掀起了一場(chǎng)智能體開發(fā)熱潮:各條產(chǎn)品線結(jié)合自身場(chǎng)景和行業(yè)特點(diǎn),積極探索 Agent 應(yīng)用。而眼下,數(shù)據(jù)庫(kù)團(tuán)隊(duì)推出的智能體,也正是這種內(nèi)外部因素共同作用的產(chǎn)物。
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見 轉(zhuǎn)載須知 。