明敏 發(fā)自 凹非寺
量子位 | 公眾號 QbitAI
超級智能體,央企出手了!
中國電信天翼AI發(fā)布星辰超級智能體,拿到DBC德本咨詢2025企業(yè)級AI Agent榜單央企第一。
它依托中國電信自研“星辰大模型”技術(shù)底座,為產(chǎn)業(yè)智能升級而來。
最近智能體實在是太火了。
國務(wù)院關(guān)于深入實施“人工智能+”行動的意見中首次將智能體作為重點發(fā)展方向。DeepSeek也被曝在該領(lǐng)域布局,引發(fā)又一波市場熱度。
不過新興領(lǐng)域,熱度常有、深度認(rèn)知不常有。
尤其是智能體領(lǐng)域,它真的好用嗎?產(chǎn)業(yè)落地真的靠譜嗎?現(xiàn)在發(fā)展到底如何了?能力天花板在哪里?這些疑問一直存在于行業(yè)之中。
于是趁著這次“國家隊”出手,我們找到領(lǐng)域內(nèi)專家,認(rèn)真聊了聊智能體的底層技術(shù)、行業(yè)落地以及發(fā)展趨勢。
本文亮點
本次訪談嘉賓分別是:
中國電信人工智能研究院副院長?李永翔
中電信人工智能科技(北京)有限公司?首席架構(gòu)師?畢然
核心觀點如下:
企業(yè)更希望得到的是一個應(yīng)用,而不是大模型本身,智能體平臺可以直接產(chǎn)出應(yīng)用。
超級智能體框架的理論上限非常高,性能提升主要看底模能力提升和工具的齊備。
目前超級智能體已經(jīng)有70分水平,它確定能給人類提供有效幫助。
智能體落地中,嵌入企業(yè)的主業(yè)系統(tǒng)很重要,這決定智能體是否可以大展拳腳。
客服、營銷、辦公軟件、IT建設(shè)完備的業(yè)務(wù)場景更能優(yōu)先落地智能體。
中國電信持續(xù)迭代星辰大模型,這能更端到端優(yōu)化超級智能體。
智能體就是大模型落地產(chǎn)業(yè)的主流模式,也是最好的模式。
自主規(guī)劃可完成各類任務(wù)的超級智能體
量子位:可否先簡要介紹下最新發(fā)布的星辰超級智能體,它的最大特點是什么?
李永翔:星辰超級智能體是基于中國電信自研的“星辰大模型”技術(shù)底座。它的特點包括:
全模態(tài)、全尺寸、全國產(chǎn)
復(fù)雜推理能力+記憶能力增強
安全能力
首先它支持全模態(tài),包括語音、視覺、文本等模態(tài)理解,支持文生圖、文生視頻等。這意味著它可以調(diào)用的能力非常豐富。
同時它是完全國產(chǎn)化的。不僅底層模型是中國電信自研,也基于國產(chǎn)算力、國產(chǎn)框架訓(xùn)練,實現(xiàn)全棧自主可控。
第二,星辰超級智能體定向增強了2方面能力:復(fù)雜推理和記憶。
不同于通用復(fù)雜推理側(cè)重于解數(shù)學(xué)物理題,星辰超級智能體更針對日常辦公、客服網(wǎng)絡(luò)運維、金融、工業(yè)等現(xiàn)實場景增強推理能力,使得它能在各個領(lǐng)域中都能完成復(fù)雜任務(wù)推理規(guī)劃的工作。
同時我們還加強了它的記憶能力,記憶能力不夠好,會導(dǎo)致智能體只能做短時任務(wù),限制能力。星辰超級智能體上下文可擴展到百萬字級別,此外也使用RAG進一步保持它的長短期記憶。
第三,星辰超級智能體也強調(diào)了安全保障。我們使用數(shù)據(jù)加密、容器化隔離等方式來保證ToC和企業(yè)級用戶的安全使用。
實際上這幾個方面也是智能體演進過程中最重要的幾個發(fā)展方向。
量子位:和市面上其它智能體相比,星辰超級智能體的核心差異是什么?
畢然:現(xiàn)在市面上出現(xiàn)的大多數(shù)智能體更強調(diào)C端消費級場景,星辰超級智能體的定位是深入業(yè)務(wù)架構(gòu)的數(shù)字化生產(chǎn)力單元,它提供深度定制的能力。
相對而言,我們不那么強調(diào)低門檻易上手,用戶量不是我們最關(guān)注的,我們更希望它能真正提升企業(yè)生產(chǎn)力。
可定制包括兩個層面,第一提供更多可定制的能力支撐企業(yè)接入各種內(nèi)部系統(tǒng)和工具,以及對超級智能體中的大模型做更細(xì)致的打磨,第二是基于行業(yè)的共性場景推出一些產(chǎn)業(yè)超級智能體,這兩個是我們持續(xù)在努力的方向。
量子位:今年確實是Agent之年,星辰超級智能體如何而來?可否介紹一下研發(fā)背景?
畢然:在這一波人工智能大趨勢中,最開始大家都在搞模型,但是我們知道模型不能直接為用戶解決問題,哪怕是模型訓(xùn)推平臺產(chǎn)出的、根據(jù)具體場景打磨過的模型,它也還不是用戶最終所需要的,用戶更需要的是應(yīng)用。
智能體平臺正是能直接產(chǎn)出應(yīng)用的。
如果畫一張圖表示它們之間的關(guān)系,最底層是大模型、中間是智能體平臺、最上層就是應(yīng)用?,F(xiàn)在各行業(yè)不缺底層的技術(shù),更缺少上層的能力。
這個底層邏輯驅(qū)動我們在2024年初就開始布局智能體平臺和相關(guān)技術(shù)。在新興趨勢里,只有提前布局才能更快做到行業(yè)領(lǐng)先。
現(xiàn)在行業(yè)內(nèi)整體智能體的發(fā)展可以分為3種路線:
自主規(guī)劃智能體:全自動+簡單任務(wù)
工作流智能體:半自動+復(fù)雜任務(wù)
超級智能體:全自動+復(fù)雜任務(wù)
第一種自主規(guī)劃智能體是大模型出現(xiàn)之初被提出的。該智能體在大模型基礎(chǔ)上可以訪問知識庫,能夠根據(jù)提示詞使用工具完成工作。但它只能解決一些簡單任務(wù),一旦任務(wù)過于復(fù)雜,它就會崩潰、出錯,落地穩(wěn)定性很差。目前應(yīng)用最多的是在一些知識問答和客服的場景。
第二種智能體是為了解決自主規(guī)劃智能體無法穩(wěn)定完成復(fù)雜任務(wù)的問題。它通過人工編排任務(wù)流程來提升執(zhí)行穩(wěn)定性,可以解決一些復(fù)雜任務(wù)。目前這種智能體技術(shù)是產(chǎn)業(yè)落地的主流,比如客戶投訴處理、合同審核等業(yè)務(wù)流程,均可使用這類智能體解決。它的問題是半自動化,還是需要人類花很多精力去規(guī)劃編排,甚至做一定的代碼編寫。
第三種是新興的技術(shù)路線,自動化解決復(fù)雜問題。通過提供一個虛擬機環(huán)境,智能體能夠以類人的方式在虛擬機內(nèi)使用各種資源和工具去執(zhí)行任務(wù)。它在過程中不可避免會犯一些錯誤,但是能夠不斷修正自己,直到最終任務(wù)完成。它無需人類編排任務(wù),畢竟世界上的工作場景那么多,靠人工編排一個個工作流的工作量是巨大的,而且也不夠靈活。
我們最新推出的就是第三類智能體。
比如面對密密麻麻的電商營銷數(shù)據(jù)表,超級智能體可以一鍵分析化繁為簡。它首先會分析問題規(guī)劃清晰的步驟,然后會開始執(zhí)行任務(wù)、編寫Python代碼來處理數(shù)據(jù)。
遇到出錯的情況,比如常見的代碼因為字段不匹配而執(zhí)行失敗,超級智能體可以識別任務(wù)、自主反思,它發(fā)現(xiàn)代碼中的列名和原始表格一致,接著可以自動修正代碼,再次執(zhí)行后,任務(wù)就一次成功了。
量子位:目前底層技術(shù)已經(jīng)足以支撐這種全自動智能體完成復(fù)雜任務(wù)嗎?
畢然:這種智能體基于的框架,它的理論上限非常高。它和人類執(zhí)行任務(wù)的過程非常像。核心分為四大模塊:
感知與理解模塊:接收并解析多模態(tài)輸入,將其轉(zhuǎn)化為信息可以理解和處理的結(jié)構(gòu)化信息;
認(rèn)知與決策模塊:智能體的“大腦”,基于感知信息、內(nèi)部記憶和外部知識進行推理、規(guī)劃、反思和最終決策;
記憶與知識模塊:為智能體提供長期、短期和世界知識存儲,使其具備連續(xù)性和個性化能力;
行動與執(zhí)行模塊:將決策轉(zhuǎn)化為具體行動,與世界進行交互并產(chǎn)生影響。
這套架構(gòu)使得智能體可以像人一樣接收外界信息,然后判斷該使用什么工具、調(diào)取哪些記憶和知識、使用什么技能。比如任務(wù)是寫報告,就調(diào)用一個寫作大師智能體;任務(wù)是編程,那就調(diào)用編程專家智能體。它還會有一個深度思考模型,用來反思執(zhí)行過程中的一些進展和問題,比如編程專家智能體寫的代碼是否有問題,如果存在問題運行不了,那要再反饋給規(guī)劃模塊,去重新嘗試新的策略來完成任務(wù)。
這意味著智能體內(nèi)部是動態(tài)調(diào)整的,整個不斷循環(huán)流轉(zhuǎn),因此執(zhí)行一個任務(wù)的時間也可能比較長,幾分鐘甚至十幾分鐘不等。
量子位:超級智能體怎么判斷自己需要反思到什么程度?需要人類去給它規(guī)定一個標(biāo)準(zhǔn)嗎?
畢然:很大程度還是超級智能體自己做判斷,它會根據(jù)人類一開始的指令做判斷,自己是否完成對應(yīng)要求。
不過坦白說,超級智能體做如此多種類的任務(wù),它的成功率不是一件“非一即零”的事情??赡墁F(xiàn)階段要求超級智能體寫一個調(diào)研報告,人類還是會覺得它不能直接使用,但是它一定為人類提供了有價值的參考。
我覺得超級智能體的水平已經(jīng)達到70分,至少在提供一定參考價值的角度,它已經(jīng)沒問題。
量子位:所以這套超級智能體框架,在短期內(nèi)也不會有比較大的變化,只需在這個范式內(nèi)不斷疊加能力?
畢然:這套框架本身符合人力思考與工作的原理,它的能力上限是很高的,有時候執(zhí)行效果不好,背后原因有兩種:
第一,底層大模型能力不夠強。如果大模型自己都犯錯了,以它為核心的智能體表現(xiàn)也不會很好。這導(dǎo)致一些對結(jié)果有一定容錯性的任務(wù),用戶接受度更好,比如說寫調(diào)研與分析報告。
第二,落地過程中很多時候超級智能體還沒有完全嵌入到生產(chǎn)流程和系統(tǒng)中,類似于一個很強大的員工,但是站在企業(yè)的外部,它能夠完成的事情是很有限的。它得先入職進入到企業(yè)的內(nèi)網(wǎng),掌握各種企業(yè)內(nèi)部的平臺權(quán)限。
不過現(xiàn)在可以看到,底層模型能力正在不斷升級,企業(yè)對于智能體落地的熱情也很高,有很多人正在圍繞智能體去改造現(xiàn)有的業(yè)務(wù)軟件。
做好系統(tǒng)嵌入,智能體才能發(fā)揮效用
量子位:您剛剛提到智能體的落地效果和它能否很好嵌入到企業(yè)內(nèi)部系統(tǒng)有非常大關(guān)系,為啥這么說?
畢然:這個可以參考中國電信江蘇公司的落地案例。他們很好地完成了各種各樣的系統(tǒng)嵌入。
比如他們基于星辰智能體平臺打造了智享客服,實現(xiàn)客服投訴工單的預(yù)處理,接收到投訴工單后,智能體根據(jù)用戶的投訴內(nèi)容結(jié)合客服提供的處理規(guī)范調(diào)用各類工具核查相關(guān)信息,最終給出轉(zhuǎn)派對象和預(yù)處理意見,同步至投訴工單系統(tǒng),完成自動轉(zhuǎn)派及預(yù)處理工作。
你可以看到,智能體想要處理這么多工作,必須要和已有業(yè)務(wù)系統(tǒng)打通,才能取得較好的效果。
現(xiàn)在很多企業(yè)其實都完成了數(shù)字化改造,他們的IT系統(tǒng)里有完善的流程和數(shù)據(jù)。
量子位:所以智能體嵌入系統(tǒng)的難度不是很大。
畢然:是的,從單點的工程難度來說并不大,但問題是這樣的業(yè)務(wù)系統(tǒng)太多了,做適配和接入會有非常大的工作量。
量子位:不過現(xiàn)在對于AI取代人力會有一定爭議,您作為推動智能體落地的一方,怎么看待這個問題?
李永翔:我們強調(diào)的是增效而不一定是減少人力。比如我們內(nèi)部落地的一些例子,在客服網(wǎng)絡(luò)運維領(lǐng)域,智能體能夠讓每個員工處理工單的效率提升30%以上。
要知道在實際產(chǎn)業(yè)里,不管是中國電信還是其他行業(yè)客服,面臨的問題還是工單接不過來、或者老百姓提出的一些復(fù)雜需求客服系統(tǒng)難以處理。所以落地智能體應(yīng)用不一定代表要取代人類,而是讓人更省事。
應(yīng)用不一定代表要取代人類,而是讓人更省事。
量子位:作為從業(yè)者,您感覺目前產(chǎn)業(yè)界對于智能體持一種怎樣的看法?市場需求旺盛嗎?
畢然:我認(rèn)為市場需求是很強烈的,國外的資本市場和科技企業(yè)均已在大幅投入,我們國家也在推動AI+的產(chǎn)業(yè)落地,最重要的抓手就是智能體。
不過盡管很多行業(yè)都做出了很好的落地標(biāo)桿項目,但很多人對智能體概念和技術(shù)還是陌生,畢竟大模型和智能體技術(shù)發(fā)展太快,跨行業(yè)理解也需要一定門檻。
量子位:對于這種“陌生”的企業(yè)客戶,怎么去幫助他們落地智能體?
畢然:我認(rèn)為找到企業(yè)的適合智能體落地的核心場景非常關(guān)鍵,這個核心場景一定是它的主營業(yè)務(wù)場景。例如一家金融企業(yè),我們更多需要去幫他們解決信貸審核、投資顧問等核心業(yè)務(wù)的增效問題。
不過這種核心場景往往需要挖掘,我們現(xiàn)在有兩種方法。第一是在企業(yè)內(nèi)去做應(yīng)用創(chuàng)意挑戰(zhàn)賽,發(fā)動業(yè)務(wù)人員在星辰智能體平臺上開發(fā)應(yīng)用,在海量內(nèi)部應(yīng)用中找到更有價值的場景。第二是方案實現(xiàn)賽,去判斷智能體在哪些場景落地效果好,可以快速“摘桃子”,實現(xiàn)難度較大的場景暫時往后放。
此外這還涉及到人才培養(yǎng)、業(yè)務(wù)系統(tǒng)重構(gòu)等一系列問題。
量子位:怎么理解智能體領(lǐng)域的人才培養(yǎng)?
畢然:在星辰超級智能體平臺上主要有兩類用戶:使用智能體的人和開發(fā)智能體的工程師。
我們現(xiàn)在正在通過培訓(xùn),讓開發(fā)智能體的工程師變得更專業(yè)。 這個群體越來越壯大、應(yīng)用才會越來越豐富。
就像微軟CEO納德拉說的,未來所有軟件都是智能體軟件。所以如果當(dāng)下還在開發(fā)傳統(tǒng)軟件,那可能也要被淘汰了,現(xiàn)在轉(zhuǎn)行做智能體開發(fā)這個趨勢非?;?。以及我個人覺得,智能體應(yīng)用還是需要各個系統(tǒng)環(huán)節(jié)業(yè)務(wù)都串起來,才能獲得更好的使用體驗,這背后則涉及很多開發(fā)和改造工作,需要既懂業(yè)務(wù)場景,又懂智能體開發(fā)的專業(yè)人才。
中國電信獲得了工信部授權(quán)運營的“智能體開發(fā)工程師”職業(yè)認(rèn)證培訓(xùn),從我們這培訓(xùn)結(jié)業(yè)的工程師能得到國家認(rèn)可的職業(yè)證書。
量子位:這種實際落地中,哪些場景是能優(yōu)先推進的?
畢然:我覺得客服、營銷、辦公軟件或者是IT化程度高的行業(yè)都能夠優(yōu)先落地。
客服場景是因為大模型天生和對話場景更適配,再加上知識庫訪問、工具調(diào)用等配套,通常能較好地完成問答任務(wù)。另外,各種業(yè)務(wù)流程清晰的場景也能很快落地,比如輿情監(jiān)控的場景,它的流程可以分為信息收集、輿情篩選、問題通報、效果分析等步驟,只是不同企業(yè)監(jiān)控輿情的側(cè)重點不同,這種有一定業(yè)務(wù)流程框架同時又需要一定靈活性執(zhí)行的場景,正是工作流智能體可發(fā)揮價值的地方。
內(nèi)部海量場景+全國本地化團隊+豐富產(chǎn)業(yè)化經(jīng)驗
量子位:現(xiàn)在市場中不同類型的玩家競爭也很激烈,您怎么看不同的競爭策略?
畢然:我覺得現(xiàn)在的市場主要分為四類玩家:大模型廠商、科技大廠、創(chuàng)業(yè)公司、央國企。
大模型廠商的重點是模型能力的提升,尤其是模型支持智能體的幾方面能力,如深度思考、工具使用、數(shù)理計算、代碼編寫;科技大廠非常注重建設(shè)智能體生態(tài),比如進行模型和平臺的開源來培養(yǎng)開發(fā)者生態(tài),而且普遍重視將智能體技術(shù)應(yīng)用到已有的C端產(chǎn)品中。創(chuàng)業(yè)公司更多在垂直場景發(fā)力,當(dāng)然它們也會做開源來提升知名度。央國企則更注重產(chǎn)業(yè)場景的規(guī)?;涞兀Y(jié)合國家的AI+行動在大幅投入。這也是中國電信的星辰智能體平臺的最大優(yōu)勢,源于產(chǎn)業(yè)實踐,有大規(guī)模產(chǎn)業(yè)落地應(yīng)用。
央國企/運營商則更加注重產(chǎn)業(yè)的規(guī)?;涞?。為啥呢?
因為央國企內(nèi)部本身就有海量可落地場景,比如客服、IT運維等;同時,類似于中國電信這樣的央國企在全國各省有非常完善的本地化服務(wù)團隊。這是其他類型企業(yè)所不具備的,也是中國電信的獨特優(yōu)勢。我們可以向客戶提供可持續(xù)的智能體開發(fā)與應(yīng)用的服務(wù)能力,而不用通過跨地域出差駐場的方式。
為了讓中國電信更好的服務(wù)廣泛行業(yè)與地域的客戶,星辰智能體平臺在中國電信內(nèi)部實施了產(chǎn)品開源的模式,集團內(nèi)的省專公司可基于星辰智能體平臺的開源版來二次開發(fā),使得平臺可以適應(yīng)各種場景的需要。
量子位:這種內(nèi)部先落地的模式有什么好處嗎?
畢然:這個好處非常大,當(dāng)前企業(yè)都很務(wù)實,更看重實際效果。如果我去和客戶直接說智能體如何好,能怎么賦能,很多客戶會先反問我,你先說說智能體怎么給中國電信提效?
這時候我去展示中國電信集團內(nèi)部的落地案例與提效數(shù)據(jù),他們會更感興趣,會自然地聯(lián)想到自己是不是有類似的場景去落地。
李永翔:另外,中國電信也有非常豐富的產(chǎn)業(yè)落地經(jīng)驗,2024年中國電信實現(xiàn)營收入5236億元,其中產(chǎn)業(yè)數(shù)字化收入達1466億元,落地的行業(yè)包括文旅、農(nóng)業(yè)等。
我們和中車、中物流、國能這些國企有非常深入的合作,幫助中車基于平臺打造中車集團大模型服務(wù)系統(tǒng),滿足中車集團從研發(fā)到應(yīng)用全流程AI管理需求,推動AI技術(shù)在軌道交通領(lǐng)域的廣泛應(yīng)用。另外也和深圳東莞市政等方面有密切合作,他們的政務(wù)客服系統(tǒng)更加復(fù)雜,基于這些經(jīng)驗也拓展了我們智能體平臺的能力。
量子位:對于智能體落地,除了經(jīng)驗和服務(wù),底層模型的能力是不是也很重要?
畢然:是的。比如最近谷歌的Nano-Banana很火,本質(zhì)上就是因為它的模型和產(chǎn)品場景聯(lián)動打磨得非常好。
超級智能體需要聯(lián)動底層模型和框架進行端到端優(yōu)化,但因為資金人力等方面壓力,現(xiàn)在國內(nèi)還堅持做基礎(chǔ)大模型的企業(yè)已經(jīng)不多了。
中國電信現(xiàn)在還在持續(xù)迭代星辰大模型,我們會根據(jù)智能體實際應(yīng)用中的需要,來提升模型能力;同時也能做端到端的優(yōu)化,這意味著我們能根據(jù)場景做深度定制。
李永翔:在中國電信人工智能研究院這塊,專職投入在大模型算法研發(fā)的團隊就有300人左右,同時我們還和國內(nèi)頂尖的高校和科研機構(gòu)一起合作,圍繞大模型、Agent等下一代技術(shù)進行攻關(guān)。
畢然:我還要補充一點,安全也是智能體落地中非常被關(guān)注的一方面。
作為央企,中國電信本身對安全就有著非常嚴(yán)苛的要求,這使得我們也能吸引一批對安全方面有更高要求的客戶。
One More Thing
最后,值得一提的是,對于智能體這個趨勢李永翔副院長最初是持懷疑的態(tài)度:
回想一下,最早OpenAI提出GPTs這個概念的時候,大家都很興奮,說一夜之間能做出來很多個應(yīng)用了,它就是把AI對話掛載了一些文件知識庫,把長對話過程固化成了APP的形式。
后面就是智能體趨勢,它其實就是把傳統(tǒng)的工作流復(fù)活了,10年前做SaaS時一些常見的形式,感覺就是大模型時代給它起了個新名字。我一開始會擔(dān)心這不是說一種包裝、炒作。
但是后面隨著趨勢發(fā)展以及和客戶的實際接觸,他意識到智能體趨勢是值得相信的。
Why?
因為目前基模的天花板能力擺在這,要解決實際問題,只能通過多個模型組合的方式。
目前即便是最好的編程模型,它也需要加入到編排的工作流里才能去解決實際問題。
所以我現(xiàn)在覺得,智能體就是當(dāng)下最好的一種方式,不管是ToC還是企業(yè)級應(yīng)用。當(dāng)然除了模型能力不斷進步外,接下來我們也需要融入更多的行業(yè)Know-how。
感興趣的童鞋,可點擊“閱讀原文”或下方鏈接訪問星辰超級智能體官網(wǎng),了解更多內(nèi)容:https://www.teleai.com.cn/product/super-agent
一鍵三連「點贊」「轉(zhuǎn)發(fā)」「小心心」
歡迎在評論區(qū)留下你的想法!
—?完?—
點亮星標(biāo)
科技前沿進展每日見