新賽道 | DeepSeek引爆安全剛需,啟明星辰發布MAVAS大模型安全評估系統
發布時間 2025-02-17在人工智能技術迅猛發展的今天,大型語言模型(LLM)已成為推動各行業數字化轉型的核心引擎,國內AI創新的標桿DeepSeek橫空出世再次引爆了國內大模型應用的熱度,即將改變金融、運營商、電力、醫療、教育、制造等千行百業的運作方式。然而,隨著大模型的廣泛應用,對抗攻擊、數據泄露、模型濫用等安全風險,正成為各行業部署大模型應用時不可忽視的挑戰。試想一下,如果您的智能客服系統被惡意操控,生成不當內容;或者您的醫療診斷模型因對抗攻擊而輸出錯誤結果,這些安全風險將給企業和個人帶來怎樣的損失?
啟明星辰憑借多年的技術積累與創新,重磅推出了天鏡MAVAS大模型安全評估系統,該系統已經接入DeepSeek大模型,通過“以大模型對抗大模型”的創新方式,評估各版本大模型在不同應用場景中的輸出結果安全性,有效識別并防御大模型的安全風險,為企業提供全方位的大模型安全評估方案,助力各行用戶在AI時代安全前行。
接入DeepSeek,天鏡MAVAS提供全面的大模型安全評估能力
針對大模型應用存在的安全問題,例如對抗攻擊可能導致模型輸出錯誤,數據泄露風險威脅用戶隱私,模型濫用可能生成不當內容引發倫理和法律問題,提示注入攻擊、敏感話題越界、價值觀偏差等。
啟明星辰推出專為大模型(LLM)安全而設計的全方位評估產品——天鏡MAVAS大模型安全評估系統。該系統已經接入DeepSeek,通過大模型生成各種對抗攻擊樣本用于評估大模型應用在不同應用場景中的輸出結果安全性;通過大模型間的自我對抗來發現大模型應用的各種安全風險和問題,持續提高大模型的安全性;通過大模型提供高質量的安全測評樣本集,針對這些安全隱患提供涵蓋倫理對齊、對抗攻擊防護、魯棒性測試等多個維度的全方位安全評估。近期天鏡MAVAS已經針對DeepSeek發布的各個版本,以及部分用戶采用的各種大模型進行了對比性測評,幫助用戶提前發現并修復潛在風險,確保大模型的安全、可靠與合規應用。
用戶本地化部署,實現對大模型應用的全方位安全評估
通過本地部署天鏡MAVAS大模型安全評估系統,企業可以對大模型應用的倫理和價值觀對齊、對抗攻擊防護能力和魯棒性進行全方位測評,并生成詳細的評估報告。系統提供了面向八種倫理評測安全場景的全面檢測能力,包括侮辱臟話、歧視偏見、違法犯罪、敏感話題、身體傷害、心理健康、財產隱私和道德倫理。同時,還支持六種基于對抗樣本的注入攻擊方法的評估,如目標劫持、帶有不安全觀點詢問、反面誘導、賦予角色后發指令、Prompt泄露和不安全的指令主題。

云端服務模式,提供SaaS服務保障大模型的安全合規應用
通過在云端部署天鏡MAVAS,啟明星辰推出了星辰云大模型安全評估服務,滿足更多客戶對大模型的安全評估需要,以遠程SaaS化服務形式,提供零部署、免維護、即時開通、可單次或定期對客戶側使用的大模型進行安全評估,并形成評估報告,可有效降低評估成本,保障大模型的安全合規應用。
結合脆弱性管理系統,提供全場景安全評估
天鏡MAVAS大模型安全評估系統還可以集成天鏡脆弱性掃描與管理系統的主機和各種Web應用的漏洞檢測能力,天鏡脆弱性掃描與管理系統已經連續七年穩居漏洞與評估管理市場領域第一,多年來一直為企業提供高效的漏洞管理與安全防護服務。無論是IT系統的漏洞脆弱性和安全基線管理,還是大模型應用的安全評估與防護,都可以通過天鏡MAVAS進行雙重評估一站式滿足企業的需求,幫助企業構建全方位的安全防護體系。
結合大模型電子圍欄,提供安全評估+防護的閉環方案
天鏡MAVAS大模型安全評估系統可以集成大模型電子圍欄Guardrail功能,電子圍欄功能基于上下文多輪對話審計、流式輸出安全檢測等關鍵技術,構建了針對不安全輸入、話題越界、敏感話題和不安全輸出的實時防護能力,可以根據用戶需要選擇部署位置,這一功能能夠有效防止大模型被提示注入攻擊或生成不安全內容,確保模型在實際應用中的安全性與合規性。
通過大模型的安全評估與電子圍欄的同時部署,提供覆蓋大模型應用全生命周期的"前置預防-動態評估-主動修正"的閉環治理范式確保人工智能規?;瘧玫陌踩?。
在AI技術快速發展的今天,大模型的安全性已成為企業不可忽視的核心問題。啟明星辰天鏡MAVAS大模型安全評估系統,憑借其全面的功能、領先的技術與高效的部署能力,為企業提供了一站式的大模型安全評估解決方案,讓AI應用更安全、更可靠、更合規,助力企業在AI時代乘風破浪,智贏未來!