近年来，数据安全事件频发，业务数据不可见、不可视，导致业务数据被第三方利用、泄露的风险长期存在且无解。同时，随着监管力度的加大，数据安全处罚事件逐年变多，2023年更是呈现出爆发式增长的趋势。

在这样的背景下，数据安全建设显得尤为重要。但目前市场中诸多数据安全相关的产品与方案同质化严重，依然延续老方法和旧逻辑，如人工打标、手动分类，这无异于拿着“旧药方”治“顽疾”，市场上真正能有效解决数据安全难题的“良方”仍显稀缺。

压住数据安全的“三大顽疾”

在数据安全顶层规划方面，全球及国内顶尖权威机构，诸如Gartner与信通院，已确立了系统的方法论。这些机构一致强调，数据安全本质上是一个流程驱动的领域，它呼唤跨角色、跨部门的紧密协作，并深度融入业务运营之中。

然而，当前的数据安全在落地实施方面却面临三大核心难题：

数据分类分级：数据发现与分类仍然是数据安全工作的基石，但遗憾的是，该领域至今尚未出现高效可行的解决方案来有效落实这一基础环节。
流动数据可视化：流动数据无法识别，难以监控核心数据的分布和使用情况，风险识别与监测更是无从下手。
数据风险监测：数据安全的风险行为与实际业务行为高度相似，不同于网络攻击存在明显的流量异常特征，导致监测工作异常艰巨，难以精准识别。

这三个长期悬而未决的挑战，正是许多组织在初步实施数据安全方案后未能取得预期成效的关键所在。

传统单纯依靠人工的数据分类分级方式不仅效率极低，还容易因个体主观判断有差异，导致实际应用中准确率低，无法长期持续应用；为提质增效，市面上出现了许多针对数据安全的解决方案，如运用NLP小模型对数据进行理解，辅助人工进行分类分级。

但传统NLP小模型需要大量客户侧数据来做训练，且对于业务数据的理解能力很差，尽管能够一定程度上提升效率，最终依然需要大量人工进行校验和判断。

更为关键的是，无论是纯人工还是小模型+人工的解决方案，都仅局限于对数据库中结构化数据的处理，即便完成分类，其应用场景也极为有限，主要支持少数合规需求，如数据脱敏和数据目录报送等。然而，真正的数据风险往往潜藏于数据的实际使用和流动过程中，对流动数据的识别和对数据安全使用风险的监测，是传统方案所无法解决的“顽疾”。

以实例说明：即便通过静态分类，在数据库中已识别出10G的敏感数据，但对于这些数据当前正被哪些应用程序和API调用及使用，传统方法却无能为力，使得这部分信息的可见性和控制力几乎为零。

安全GPT：用大模型“重塑”数据安全建设

面对传统小模型所无法解决的数据理解和识别问题，大模型技术提供了全新的思路。

大模型本身属于自然语言模型，非常擅长对文本数据理解能力，在数据识别以及风险推理上具备天然优势。但大模型的训练和微调需要结合大量的行业数据、数据安全风险案例等，更需要大量的技术研发投入和AI应用能力的沉淀，所以尽管大模型技术在各行业百花齐放，然而应用在数据安全领域的大模型却没有出现。

2023年5月18日，网络安全领域的头部厂商深信服率先推出业界首款安全大模型——安全GPT，在今年9月最新发布的4.0版本中，深信服凭借多年沉淀的行业数据和数据安全风险案例，推出了数据安全大模型，不仅实现动静态数据分类分级，更率先实现了流动数据的识别和数据风险自动研判分析，全面推动了数据安全的新变革，重塑数据安全管理与监测的解决方案。

深信服安全GPT 4.0 数据安全大模型可自动化完成数据库静态数据以及API等流动数据分类分级工作，与传统小模型相比，分类分级的准确率从60%提升到了90%，效率提升了40倍，人工只需设置分类标准，打标过程全部模型自动化完成。

不仅如此，数据大模型还实现了动静态数据的整体分类与流动可视，可以分钟级完成任意数据的使用调查，帮助企业快速定位数据以及掌握数据使用情况，并可针对性预防和调整核心数据的使用，确保核心数据的安全。

除了数据的自动分类分级，深信服安全GPT数据安全大模型还能实现自动监测异常行为和数据风险自动研判分析。安全GPT强大的分析研判能力得益于研发团队收集了内部大量的数据安全风险相关的分析案例，为安全GPT做了大量的训练和微调，从而实现上下文关联，有效区分正常的业务行为和真正的数据安全风险，并输出详细的研判分析过程，极大降低研判分析难度。

在数据泄露、数据滥用、违规数据出境和超范围处理数据四种典型的攻击场景，安全GPT数据安全大模型检出率高达90%，准确率达70%，为有效激活数据潜能和释放数据价值带来坚实保障。

AI赋能，深信服为新质生产力护航

作为最早探索人工智能与安全融合的厂商，深信服早在2016年就投入到机器学习、深度学习在网络安全领域中的应用，随着2022年AI大模型的崛起，深信服也躬身入局，采用“大模型＋数据＋安全和算法专家”的思路，凭借在大模型等AI技术领域的积累、安全领域数据的积累、场景化的落地等综合能力，全力打造安全GPT，并在政府、医卫等多个行业获得广泛应用。

如今，深信服又将大模型应用在数据安全领域，带来安全GPT数据安全大模型，有望彻底重塑企业与组织的数据安全建设，并带来全新的使用体验，真正为发展新质生产力保驾护航。

其一，深信服安全GPT采用新思路、新技术，率先响应了组织与企业在动态数据分类分级、流转可视和风险检测方面的需求，真正帮助组织与企业实现数据在生产域、应用域、流通域的安全保障，完成AI时代数据安全新技术与新需求的完美对接。

其二，深信服安全GPT彻底重塑数据安全产品与方案的使用体验，推动数据安全“人机共智”时代的到来。过去，依靠人工进行数据分类分级、数据与模版匹配、数据使用调查、数据可视，效率不足且准确率低；如今，在安全GPT的加持下，基于大模型强大的自然语言理解和语义分析能力，企业能以数十倍的效率完成动静态数据的分类分级，并且能够高效进行数据调查与可视、风险智能分析研判。

其三，深信服安全GPT让组织与企业真正看到和感受到安全大模型在数据安全领域的核心价值，这对于组织与企业后续全面拥抱人工智能与安全融合的趋势有着重要意义。

截至目前，深信服安全GPT已在超400家企事业单位真实环境测试和应用，覆盖政府、能源、金融等各行业。

综合观察，《“数据要素X”三年行动计划（2024-2026）》已然全面启动，千行百业纷纷AI技术为抓手，以求充分释放数据要素的潜能，而数据安全则成为必不可少的条件。深信服凭借前瞻性的布局、创新的技术、全新的思路打造出安全GPT，并将安全GPT成功应用到数据安全领域，解决数据安全过去依赖人工的困境，为千行百业的用户们实现“安全领先一步”。

铲除数据安全三大“顽疾”，安全GPT如何“开药方”？

压住数据安全的“三大顽疾”

安全GPT：用大模型“重塑”数据安全建设

AI赋能，深信服为新质生产力护航

特别声明：文章版权归原作者所有，文章内容为作者个人观点，不代表大咖秀专栏的立场，转载请联系原作者获取授权。(有任何疑问都请联系wemedia@yesky.com)