夜婷婷五月天导航,裸体美女视频网站国产

當(dāng)人們還在驚嘆大模型能寫代碼、能自動(dòng)化辦公時(shí)，它們正在悄然踏入一個(gè)更敏感、更危險(xiǎn)的領(lǐng)域 ——?網(wǎng)絡(luò)安全。

想象一下，如果 AI 不只是寫代碼的助手，而是能夠像「白帽黑客」一樣，在不破壞系統(tǒng)的前提下模擬攻擊、發(fā)現(xiàn)漏洞、提出修復(fù)建議，會(huì)帶來怎樣的改變？

這個(gè)問題，最近由 Amazon AWS AI 的 Q Developer 團(tuán)隊(duì)給出了答案。他們在 arXiv 上同時(shí)發(fā)布了兩篇論文，提出了訓(xùn)練網(wǎng)絡(luò)安全大模型的全新方法：Cyber-Zero?和?CTF-Dojo。這兩項(xiàng)研究不僅是學(xué)術(shù)探索，更像是一次「實(shí)戰(zhàn)演練」的預(yù)告，預(yù)示著大模型智能體正在從通用任務(wù)走向網(wǎng)絡(luò)安全的前線。

論文 1: Cyber-Zero: Training Cybersecurity Agents without Runtime

鏈接: https://arxiv.org/abs/2508.00910

論文 2: Training Language Model Agents to Find Vulnerabilities with CTF-Dojo

鏈接：https://arxiv.org/abs/2508.18370

網(wǎng)絡(luò)安全

大模型落地的一座特殊堡壘

在通用任務(wù)上，大模型的訓(xùn)練已經(jīng)形成了相對(duì)成熟的范式：海量數(shù)據(jù)、長時(shí)間預(yù)訓(xùn)練、再經(jīng)過對(duì)齊與微調(diào)。但網(wǎng)絡(luò)安全場景不同，其核心難點(diǎn)在于訓(xùn)練環(huán)境與數(shù)據(jù)的高度敏感性。

事實(shí)上，閉源大模型已經(jīng)在安全攻防方向展現(xiàn)出一定潛力。Google 的?Project Zero?團(tuán)隊(duì)就曾使用 Gemini 系列模型探索漏洞發(fā)現(xiàn)，一些初創(chuàng)公司甚至嘗試構(gòu)建基于閉源模型的「AI 紅隊(duì)」，用來模擬攻擊并進(jìn)行防御驗(yàn)證。實(shí)際案例表明，這些強(qiáng)大的閉源模型確實(shí)具備了發(fā)現(xiàn)漏洞、自動(dòng)化執(zhí)行攻擊步驟的潛力。

然而問題在于，這些模型的訓(xùn)練范式和數(shù)據(jù)集完全不透明。我們無法得知它們是如何習(xí)得攻防知識(shí)的，也無法驗(yàn)證模型的安全性與可靠性。更重要的是，閉源模型無法被研究者和企業(yè)安全團(tuán)隊(duì)自主改造或控制，這本身在安全領(lǐng)域是一種潛在風(fēng)險(xiǎn)。

另一方面，如果要讓模型從零開始學(xué)會(huì)攻防，傳統(tǒng)思路需要搭建真實(shí)運(yùn)行環(huán)境，以生成交互軌跡。但這種方式成本高、風(fēng)險(xiǎn)大，甚至可能在實(shí)驗(yàn)中觸發(fā)不可控的攻擊。而高質(zhì)量的安全攻防數(shù)據(jù)本就極度稀缺。漏洞利用和修復(fù)往往涉及復(fù)雜的環(huán)境狀態(tài)、系統(tǒng)調(diào)用和長時(shí)間推理，很難像自然語言文本那樣容易轉(zhuǎn)化為標(biāo)準(zhǔn)語料。

這意味著，如果繼續(xù)沿用傳統(tǒng)方式，「AI 白帽黑客」可能永遠(yuǎn)只能停留在實(shí)驗(yàn)階段。Amazon 團(tuán)隊(duì)正是瞄準(zhǔn)了這個(gè)瓶頸，提出了兩個(gè)互補(bǔ)的解決方案：Cyber-Zero 致力于「如何生成安全而高效的訓(xùn)練數(shù)據(jù)」，而 CTF-Dojo 則專注于「如何在實(shí)戰(zhàn)中訓(xùn)練模型發(fā)現(xiàn)漏洞」。

Cyber-Zero

無需真實(shí)環(huán)境的模擬訓(xùn)練場

Cyber-Zero 的核心思想是「runtime-free training」，即完全不依賴真實(shí)運(yùn)行環(huán)境，而是通過已有知識(shí)和語言建模生成訓(xùn)練所需的高質(zhì)量行為軌跡 (trajectories)。

團(tuán)隊(duì)注意到，公開的 CTF（Capture The Flag）競賽 writeups 是極其寶貴的資源。它們記錄了參賽者如何分析題目、嘗試攻擊、定位漏洞以及最終解題的過程。Cyber-Zero 正是基于這些 writeups，構(gòu)建出高質(zhì)量的訓(xùn)練軌跡。

具體來說，系統(tǒng)首先從 writeups 中提取關(guān)鍵步驟和思路，然后通過設(shè)定不同的人格（persona），讓大模型在純文本環(huán)境中模擬攻防雙方的對(duì)話與操作。例如，攻擊者 persona 會(huì)生成可能的利用路徑，防御者 persona 會(huì)進(jìn)行應(yīng)對(duì)。這一過程中生成的長序列交互被視作行為軌跡，用于訓(xùn)練網(wǎng)絡(luò)安全智能體。

實(shí)驗(yàn)表明，這種免運(yùn)行時(shí)的軌跡生成不僅規(guī)?？捎^，而且多樣性豐富，覆蓋了常見的攻防模式。與真實(shí)環(huán)境生成的軌跡相比，Cyber-Zero 的數(shù)據(jù)在漏洞定位、攻擊路徑推理等任務(wù)上的訓(xùn)練效果毫不遜色，甚至在部分指標(biāo)上表現(xiàn)更優(yōu)。這意味著，AI 白帽黑客可以在一個(gè)完全安全的虛擬訓(xùn)練營中反復(fù)優(yōu)化，而不必?fù)?dān)心成本和風(fēng)險(xiǎn)。

團(tuán)隊(duì)還得出幾項(xiàng)關(guān)鍵發(fā)現(xiàn)：

通用的軟件工程智能體（SWE Agents）無法直接遷移至網(wǎng)絡(luò)安全任務(wù)。寫代碼 ≠ 找漏洞，兩類技能之間存在明顯鴻溝。

模型規(guī)模與性能密切相關(guān)：參數(shù)更大的模型更擅長維持長程推理鏈，跨多步組合命令，并在多輪交互中保持狀態(tài)連貫，這對(duì)復(fù)雜攻防至關(guān)重要。

經(jīng)過 Cyber-Zero 軌跡微調(diào)的 32B 智能體，性能已接近閉源模型 Claude-3.7-Sonnet，而推理成本僅為其 1%。

這些結(jié)果一方面凸顯了 Cyber-Zero 的實(shí)用價(jià)值：它不僅能安全、低成本地生成訓(xùn)練數(shù)據(jù)，還能讓模型通過微調(diào)在安全任務(wù)上具備實(shí)用能力；另一方面也指出了研究方向：如果不針對(duì)安全任務(wù)進(jìn)行專門優(yōu)化，即便是大規(guī)模的通用 SWE 智能體也難以承擔(dān)白帽黑客的角色。

CTF-Dojo

讓 AI 在實(shí)戰(zhàn)中學(xué)會(huì)發(fā)現(xiàn)漏洞

如果說?Cyber-Zero?提供的是一個(gè)「虛構(gòu)的訓(xùn)練場」，它通過解析 CTF writeups 與 persona 模擬，在純文本空間中生成攻防軌跡，讓模型在完全無風(fēng)險(xiǎn)的虛擬環(huán)境中學(xué)習(xí)；那么?CTF-Dojo?就是一個(gè)「真實(shí)的戰(zhàn)場」。它直接構(gòu)建可運(yùn)行的 CTF 攻防環(huán)境，讓智能體能夠真正執(zhí)行命令、與系統(tǒng)交互、發(fā)現(xiàn)并利用漏洞。前者強(qiáng)調(diào)規(guī)?；?、安全、高效的數(shù)據(jù)生成，后者強(qiáng)調(diào)貼近實(shí)戰(zhàn)的攻防演練，兩者一虛一實(shí)，形成互補(bǔ)。

CTF-Dojo 的核心難點(diǎn)在于：如何在大規(guī)模下為 LLM 智能體提供穩(wěn)定的運(yùn)行環(huán)境。傳統(tǒng) SWE（軟件工程）代理通常需要專家手動(dòng)配置環(huán)境才能運(yùn)行，而每個(gè)任務(wù)的準(zhǔn)備工作往往耗時(shí)數(shù)周，極大限制了研究規(guī)模。為此，Amazon 團(tuán)隊(duì)提出了?CTF-Forge，一種能夠在幾分鐘內(nèi)自動(dòng)搭建運(yùn)行時(shí)的容器化工具，可以快速部署數(shù)百個(gè)挑戰(zhàn)實(shí)例，顯著降低了人力成本。

研究團(tuán)隊(duì)選擇了全球最具代表性的?pwn.college CTF Archive?作為種子數(shù)據(jù)。該數(shù)據(jù)集收錄了數(shù)百個(gè)來自頂級(jí)賽事的高質(zhì)量題目，涵蓋六大類別，從 Web 漏洞、二進(jìn)制利用到密碼學(xué)挑戰(zhàn)一應(yīng)俱全。通過精心篩選，并排除測試數(shù)據(jù)中已包含的題目，最終形成了?658 個(gè)獨(dú)立任務(wù)實(shí)例，為智能體訓(xùn)練提供了堅(jiān)實(shí)的基礎(chǔ)。

然而，最初實(shí)驗(yàn)表明，開源模型在這些復(fù)雜任務(wù)上的成功率極低。大部分 OSS 模型只能完成少數(shù)挑戰(zhàn)，生成的軌跡也質(zhì)量參差不齊。為了提高可用樣本的產(chǎn)出率，團(tuán)隊(duì)引入了三項(xiàng)推理階段增強(qiáng)技術(shù)：

將公開的賽題筆記（writeups）作為提示，幫助模型更快鎖定解題方向；

運(yùn)行時(shí)增強(qiáng)：通過在執(zhí)行過程中動(dòng)態(tài)修改環(huán)境配置或任務(wù)約束，把過于復(fù)雜的挑戰(zhàn)「降維」，從而提升模型完成任務(wù)的成功率；

教師模型多樣化：不僅依賴單一模型生成解題軌跡，而是同時(shí)調(diào)用多種不同類型的大模型（包括開源和閉源），讓它們各自貢獻(xiàn)成功案例，以此獲得更豐富、更具多樣性的訓(xùn)練樣本。

最終，團(tuán)隊(duì)主要依賴?Qwen3-Code-480B?和?DeepSeek-V3-0324?兩個(gè)強(qiáng)大的開源模型，收集到來自?274 個(gè)挑戰(zhàn)的 1000+ 成功軌跡。在去除冗余、限制每個(gè)任務(wù)實(shí)例的最大樣本數(shù)后，最終得到了?486 條高質(zhì)量、經(jīng)過運(yùn)行驗(yàn)證的軌跡。

基于這些數(shù)據(jù)，研究團(tuán)隊(duì)對(duì) Qwen3 系列模型（8B、14B 和 32B 參數(shù)規(guī)模）進(jìn)行了訓(xùn)練，并在多個(gè)網(wǎng)絡(luò)安全基準(zhǔn)任務(wù)上評(píng)估了效果。結(jié)果顯示，經(jīng)過 CTF-Dojo 訓(xùn)練的模型，在?EnIGMA+ 基準(zhǔn)（源自前作 Cyber-Zero）上取得了最高 11.6% 的絕對(duì)提升，不僅超過了開源基線模型，還表現(xiàn)出與閉源模型接近的水平。更重要的是，隨著訓(xùn)練樣本數(shù)量的增加，性能呈現(xiàn)出清晰的可擴(kuò)展性，證明了在真實(shí)環(huán)境軌跡驅(qū)動(dòng)下，大模型在網(wǎng)絡(luò)安全任務(wù)上的潛力可以被系統(tǒng)性激發(fā)。

這些結(jié)果意味著，CTF-Dojo 不僅解決了過去「環(huán)境難以大規(guī)模配置」的工程難題，還驗(yàn)證了一個(gè)核心科學(xué)問題：網(wǎng)絡(luò)安全智能體的性能能夠隨著執(zhí)行數(shù)據(jù)的增加而持續(xù)提升。在已有 SWE 代理無法泛化的情況下，CTF-Dojo 給出了一條清晰的道路：通過規(guī)?；?、自動(dòng)化的運(yùn)行環(huán)境收集軌跡，推動(dòng)模型逐步逼近人類白帽黑客的實(shí)戰(zhàn)水平。

從虛擬到實(shí)戰(zhàn)的組合拳

把 Cyber-Zero 和 CTF-Dojo 放在一起看，就會(huì)發(fā)現(xiàn)它們形成了一個(gè)閉環(huán)。Cyber-Zero 提供的是安全、可擴(kuò)展的訓(xùn)練數(shù)據(jù)來源，相當(dāng)于一個(gè)虛擬訓(xùn)練營；而 CTF-Dojo 則是實(shí)戰(zhàn)武館，讓模型在真實(shí)挑戰(zhàn)中不斷迭代。前者解決了數(shù)據(jù)與成本的問題，后者解決了能力習(xí)得與遷移的問題。兩者結(jié)合，為 AI 白帽黑客的成長提供了完整路徑。

這種設(shè)計(jì)思路的意義在于，它不僅追求理論上的可行性，還強(qiáng)調(diào)在生產(chǎn)環(huán)境中真正可部署。正如論文中展示的實(shí)驗(yàn)結(jié)果，Cyber-Zero 的數(shù)據(jù)生成和 CTF-Dojo 的環(huán)境構(gòu)建都能規(guī)?；\(yùn)行，且能在真實(shí)任務(wù)上帶來可驗(yàn)證的性能提升。這標(biāo)志著 AI 在網(wǎng)絡(luò)安全方向正在逐步進(jìn)入應(yīng)用落地階段。

未來意義與挑戰(zhàn)

AI 白帽黑客蘊(yùn)藏廣闊前景：在企業(yè)安全團(tuán)隊(duì)中，它可以作為虛擬成員，自動(dòng)掃描代碼、發(fā)現(xiàn)潛在漏洞，并提出修復(fù)建議；在紅隊(duì)演練中，它可以充當(dāng)對(duì)手角色，幫助測試防御系統(tǒng)；在教育場景中，它可以成為學(xué)員的「陪練」，提供個(gè)性化的挑戰(zhàn)和反饋。更長遠(yuǎn)來看，隨著成本降低和技術(shù)成熟，中小企業(yè)也有望借助這樣的系統(tǒng)獲得「普惠安全」。

但與此同時(shí)，這項(xiàng)技術(shù)的雙重用途屬性不容忽視。正如研究團(tuán)隊(duì)在論文中強(qiáng)調(diào)的那樣，雖然 Cyber-Zero 和 CTF-Dojo 的初衷是幫助開發(fā)者和研究人員在軟件部署前發(fā)現(xiàn)并修復(fù)漏洞，但同樣的能力也可能被濫用于進(jìn)攻目的，比如自動(dòng)化發(fā)現(xiàn)外部系統(tǒng)的漏洞，甚至開發(fā)惡意工具。特別是 Cyber-Zero 的「免運(yùn)行時(shí)」方法，降低了訓(xùn)練高性能網(wǎng)絡(luò)安全智能體的門檻，使其更容易被更廣泛的群體獲取和使用。這種民主化的趨勢既意味著安全研究的普及，也意味著風(fēng)險(xiǎn)的擴(kuò)散。

實(shí)驗(yàn)結(jié)果已經(jīng)證明，基于虛擬軌跡或執(zhí)行驗(yàn)證數(shù)據(jù)訓(xùn)練的模型，能夠在多個(gè)基準(zhǔn)任務(wù)上達(dá)到接近甚至媲美閉源前沿模型的性能。這表明先進(jìn)網(wǎng)絡(luò)安全能力的民主化不僅在技術(shù)上可行，而且正在快速到來。如何確保這類能力更多地服務(wù)于防御，而不是被濫用于攻擊，將是未來亟需討論的議題。

在未來研究方向上，團(tuán)隊(duì)提出了幾個(gè)值得關(guān)注的思路。一個(gè)是構(gòu)建實(shí)時(shí)更新的 CTF?基準(zhǔn)：通過 CTF-Forge 自動(dòng)重建比賽環(huán)境，把來自活躍 CTF 賽事的挑戰(zhàn)容器化，用于動(dòng)態(tài)評(píng)測和軌跡采集，實(shí)現(xiàn)可擴(kuò)展、實(shí)時(shí)的 benchmark。另一個(gè)方向是強(qiáng)化學(xué)習(xí)，即讓網(wǎng)絡(luò)安全智能體直接與動(dòng)態(tài)環(huán)境交互，并通過結(jié)構(gòu)化獎(jiǎng)勵(lì)獲得反饋。這種范式有望突破單純模仿學(xué)習(xí)的局限，使模型能夠發(fā)展出更普適、更具適應(yīng)性的策略，更好地應(yīng)對(duì)未知的安全問題。

因此，未來的關(guān)鍵在于平衡開放與安全。在推動(dòng)技術(shù)進(jìn)步與普及的同時(shí)，建立有效的安全護(hù)欄，需研究者、開發(fā)者、安全機(jī)構(gòu)與政策制定者協(xié)同努力，確保這類強(qiáng)大工具以負(fù)責(zé)任的方式被開發(fā)和使用。唯有如此，才能真正增強(qiáng)整體網(wǎng)絡(luò)防御能力，迎接一個(gè)更安全的智能時(shí)代。

參考資料：

[1] Zhuo, T. Y., Wang, D., Ding, H., Kumar, V., & Wang, Z. (2025). Cyber-Zero: Training Cybersecurity Agents without Runtime. arXiv preprint arXiv:2508.00910.

[2] ?Zhuo, T. Y., Wang, D., Ding, H., Kumar, V., & Wang, Z. (2025). Training Language Model Agents to Find Vulnerabilities with CTF-Dojo. arXiv preprint arXiv:2508.18370.

[3] https://x.com/terryyuezhuo/status/1962009753472950294

[4] https://github.com/amazon-science/Cyber-Zero

? THE END

轉(zhuǎn)載請聯(lián)系本公眾號(hào)獲得授權(quán)

投稿或?qū)で髨?bào)道：liyazhou@jiqizhixin.com

激情亚洲五月aV|www91com|性导航 日韩无码|夫妻单男一区二区|AV成人日韩极品|国产精品1区2区|激情五月天综合国产色播AV在线|69.com日本|欧洲精品免费观看|伊人中文字幕在线视频

激情亚洲五月aV|www91com|性导航日韩无码|夫妻单男一区二区|AV成人日韩极品|国产精品1区2区|激情五月天综合国产色播AV在线|69.com日本|欧洲精品免费观看|伊人中文字幕在线视频