滿血守護(hù)DeepSeek,360率先推出DS大模型安全方案
當(dāng)前,以DeepSeek為代表的國產(chǎn)大模型發(fā)展勢頭迅猛,正重塑全球人工智能技術(shù)格局。然而,其背后潛藏的系統(tǒng)漏洞、數(shù)據(jù)安全、內(nèi)容風(fēng)險(xiǎn)等隱患也頻頻敲響警鐘,不僅對大模型自身的安全性提出了更高的要求,也對整個行業(yè)的規(guī)范發(fā)展和治理構(gòu)成嚴(yán)峻的考驗(yàn)。安全不再是附加標(biāo)簽,而是大模型引領(lǐng)數(shù)智時代的原生屬性。
基于此,360集團(tuán)正式推出DS大模型安全解決方案,覆蓋模型訓(xùn)練、推理、運(yùn)營等大模型落地應(yīng)用全過程,滿血守護(hù)DeepSeek發(fā)展,促進(jìn)國產(chǎn)大模型企業(yè)向安全、向善、可信、可控的方向發(fā)展,為全球人工智能技術(shù)治理提供了可借鑒的“中國方案”。
DeepSeek發(fā)展面臨五大安全挑戰(zhàn)
DeepSeek以其強(qiáng)大的數(shù)據(jù)處理能力、精準(zhǔn)的算法模型以及深度的用戶洞察,重塑了AI領(lǐng)域的游戲規(guī)則。然而,以DeepSeek為代表的大模型作為新質(zhì)生產(chǎn)力推動者的同時,也面臨傳統(tǒng)網(wǎng)絡(luò)安全與新型安全風(fēng)險(xiǎn)交織的雙重挑戰(zhàn)。具體而言:
系統(tǒng)安全
此前DeepSeek遭遇網(wǎng)絡(luò)攻擊導(dǎo)致新用戶注冊受阻的事件就暴露了大模型系統(tǒng)安全方面的脆弱性。DeepSeek運(yùn)行所依賴的硬件設(shè)施、軟件框架、操作系統(tǒng)等基礎(chǔ)層以及提示工程、緩存、向量庫等訓(xùn)練和推理過程中使用的生態(tài)鏈工具共同構(gòu)成龐大復(fù)雜的系統(tǒng),系統(tǒng)中每個環(huán)節(jié)的缺陷都可能被惡意利用,加之開發(fā)運(yùn)維過程中存在的不當(dāng)使用和濫用等行為,技術(shù)脆弱性與人為風(fēng)險(xiǎn)因素相互疊加,使得大模型面臨嚴(yán)峻的系統(tǒng)安全風(fēng)險(xiǎn)。
數(shù)據(jù)安全
數(shù)據(jù)在大模型各階段流動創(chuàng)造價(jià)值,也帶來數(shù)據(jù)泄漏、篡改、濫用等各類隱私及合規(guī)風(fēng)險(xiǎn)。在數(shù)據(jù)收集訓(xùn)練階段,可能使用未經(jīng)授權(quán)版本數(shù)據(jù)訓(xùn)練,導(dǎo)致侵權(quán);在部署能力及開發(fā)階段,使用不同供應(yīng)商的服務(wù)時,可能存在黑盒以提取大模型記憶隱私數(shù)據(jù);在對外提供服務(wù)時,可能存在API濫用隱患問題;在推理使用階段,用戶交互數(shù)據(jù)可能會泄漏或者濫用,違反隱私合規(guī)風(fēng)險(xiǎn)。
內(nèi)容安全
由于DeepSeek依賴大量公開數(shù)據(jù)進(jìn)行訓(xùn)練,模型可能在無意中學(xué)習(xí)到不當(dāng)?shù)男袨椋敵龅膬?nèi)容可能會存在政治敏感、暴力違禁、色情低俗等不良內(nèi)容,造成信息污染和倫理風(fēng)險(xiǎn)。例如2024年,Google大模型Gemini被指無法正確生成白人歷史圖像,引發(fā)人們對人工智能存在種族歧視問題的擔(dān)憂,google不得不停用該功能。
此外,不法分子通過數(shù)據(jù)投毒、對抗樣本、Prompt注入等手段,直接模型的“認(rèn)知邏輯”予以扭曲,進(jìn)而引發(fā)信息泄露、危害公共安全等嚴(yán)重后果。此前,用戶以偽裝成開發(fā)者的指令,讓ChatGPT生成可被用于網(wǎng)絡(luò)犯罪的電腦病毒等危險(xiǎn)內(nèi)容,便引發(fā)公眾對大模型內(nèi)容安全的擔(dān)憂。
幻覺問題
大模型在運(yùn)行過程中,其自身的幻覺問題往往會導(dǎo)致生成錯誤信息,不僅造成虛假內(nèi)容的傳播,還極大降低了模型的可用性。2023年,美國一位資深律師因在訴訟中引用了ChatGPT提供的6個完全不存在的判例,而被罰款5000美元。除了司法領(lǐng)域,在金融、醫(yī)療、安全等垂直行業(yè)應(yīng)用中,大模型的幻覺問題也可能存在誤導(dǎo)性建議、未經(jīng)驗(yàn)證的治療方法、錯誤的防御策略等特定隱患,進(jìn)而誤導(dǎo)用戶判斷和決策。
行為失控
大模型發(fā)展過程中,Agent自主性不斷增強(qiáng),嵌入到業(yè)務(wù)工作流中,可能帶來新的安全隱患。Agent在復(fù)雜交互中因邏輯缺陷、環(huán)境誤判等原因,可能導(dǎo)致出現(xiàn)指令劫持、任務(wù)偏離、資源濫用等非預(yù)期行為,即執(zhí)行一些未經(jīng)授權(quán)的操作,或者導(dǎo)致系統(tǒng)資源的過度消耗,甚至引發(fā)系統(tǒng)崩潰等嚴(yán)重后果。
對癥下藥
首個DS版大模型安全解決方案上線
作為兼具數(shù)字安全和AI雙重能力的科技企業(yè),360很早開始關(guān)注大模型安全風(fēng)險(xiǎn),提出“以模制?!崩砟?,利用安全大模型來檢測和防范大模型可能出現(xiàn)的安全風(fēng)險(xiǎn)。
針對以DeepSeek為代表的國產(chǎn)大模型廠商面臨的安全挑戰(zhàn),360推出DS大模型安全解決方案,錨定系統(tǒng)安全、數(shù)據(jù)安全、內(nèi)容安全、幻覺問題、行為失控五大挑戰(zhàn),對癥下藥,守護(hù)DeepSeek大模型訓(xùn)練、推理和運(yùn)營全流程,為全球人工智能技術(shù)治理提供“中國方案”。
安全體檢員360智鑒
全天候掃描系統(tǒng)安全
針對大模型系統(tǒng)安全問題,360智鑒以全鏈路、精細(xì)化和動態(tài)進(jìn)化的檢測能力為核心,融合紅藍(lán)對抗思路和大模型自身技術(shù)優(yōu)勢,為企業(yè)提供一套全面、智能、高效的大模型系統(tǒng)安全檢測方案,幫助企業(yè)在大模型上線前進(jìn)行全方位的安全評估,保障大模型系統(tǒng)的可靠性與業(yè)務(wù)穩(wěn)定性。
360智鑒覆蓋了從數(shù)據(jù)清洗、模型訓(xùn)練、模型推理、部署上線的整個生命周期中的系統(tǒng)安全檢測,支持近百個組件的400+公開漏洞檢測,覆蓋RAG、Agent、prompt等場景的安全性分析,同時,能夠快速集成新的安全檢測技術(shù)和方法,適應(yīng)不斷變化的安全威脅形勢。
數(shù)據(jù)倉管員360智數(shù)
守護(hù)模型數(shù)據(jù)使用安全
針對DeepSeek面臨的數(shù)據(jù)安全挑戰(zhàn),360基于智能化數(shù)據(jù)安全管理平臺圍繞大模型資產(chǎn)梳理分級、模型邊界審查、模型數(shù)據(jù)風(fēng)險(xiǎn)監(jiān)測三大維度構(gòu)建閉環(huán)解決方案360智數(shù),全方位護(hù)航大模型數(shù)據(jù)全生命周期,守護(hù)大模型數(shù)據(jù)流動安全,具體而言:
全鏈路數(shù)據(jù)資產(chǎn)梳理,通過AI動態(tài)資產(chǎn)識別技術(shù),構(gòu)建大模型數(shù)據(jù)地圖。對大模型元數(shù)據(jù)分析,實(shí)現(xiàn)訓(xùn)練數(shù)據(jù)合規(guī)追溯、知識庫重要數(shù)據(jù)識別、模型數(shù)據(jù)隱私內(nèi)容檢測三重治理;
動態(tài)數(shù)據(jù)分級分類,對大模型智能體數(shù)據(jù)知識庫、向量庫、開放服務(wù)、記憶等位置進(jìn)行動態(tài)分類分級,定期檢查合規(guī)性和區(qū)域合法性,保證用戶及企業(yè)使用安全;
智能風(fēng)險(xiǎn)監(jiān)測,通過大模型對數(shù)據(jù)開放及調(diào)用行為進(jìn)行監(jiān)測,識別異常調(diào)用、算法漏洞、知識庫偏差,通過趨勢分析及預(yù)測實(shí)現(xiàn)異常發(fā)現(xiàn)-風(fēng)險(xiǎn)研判-流程處置,以模制模,全面防控隱私數(shù)據(jù)、重要數(shù)據(jù)泄漏及模型行為失控風(fēng)險(xiǎn)。
信息凈化器360智盾
全流程審核內(nèi)容安全
為保障大模型內(nèi)容安全,360智盾打造了全流程、多種類、多模態(tài)、場景化的內(nèi)容安全體系,通過精準(zhǔn)的風(fēng)險(xiǎn)檢測、高效的內(nèi)容攔截與替代機(jī)制,幫助企業(yè)確保生成內(nèi)容的合法性、合規(guī)性與倫理可靠性,同時提升用戶體驗(yàn)和模型輸出的可信度。
360智盾支持100多類風(fēng)險(xiǎn)內(nèi)容的識別過濾,涵蓋超200種對抗內(nèi)容防御機(jī)制,支持文本、音頻、圖片、視頻等多種模態(tài)的風(fēng)險(xiǎn)防護(hù),并通過平臺定制化場景風(fēng)控策略,滿足不同場景的風(fēng)控需求,檢測識別正確率超90%。
安全領(lǐng)航員360智搜
把模型拉出幻覺泥潭
為避免大模型陷入幻覺泥潭,360智搜通過精確的知識整合,減少虛假或不準(zhǔn)確信息,提升大模型的可信度與可靠性,有效減少大模型生成幻覺內(nèi)容的可能性。同時,360智搜支持基于企業(yè)私域數(shù)據(jù)的知識提煉與總結(jié),為企業(yè)提供更安全、更高效的業(yè)務(wù)支持。
360智搜整合多領(lǐng)域精品知識庫,實(shí)現(xiàn)全網(wǎng)與私域知識的無縫對接,提升信息獲取效率。實(shí)際應(yīng)用中,在幻覺檢測Agent加持下,大模型通用場景下幻覺比例下降50%以上。
調(diào)度指揮官360智控
Agent流程可控可管
為確保Agent在執(zhí)行任務(wù)時嚴(yán)格遵循既定流程,避免失控行為的發(fā)生,360智控通過原生安全的AI Agent可控框架對大模型場景進(jìn)行統(tǒng)一編排調(diào)用,原生設(shè)置安全措施、監(jiān)督任務(wù)規(guī)劃全程、監(jiān)控工具調(diào)用過程,把大模型能力關(guān)在籠子中,解決大模型不可控的問題。
360 DS大模型安全解決方案支持多種部署及交付方式,滿足以DeepSeek為代表的通用大模型企業(yè)對便捷、成本、安全等多種因素個性化需求。
此外,360大模型安全解決方案已在政務(wù)、稅務(wù)、醫(yī)療等垂直行業(yè)落地應(yīng)用,守護(hù)千行百業(yè)智能化轉(zhuǎn)型。未來,360將繼續(xù)護(hù)航大模型安全,為全球人工智能技術(shù)治理提供了可借鑒的“中國方案”。
如需咨詢相關(guān)服務(wù)
請聯(lián)系電話
400-0309-360