当两者  推特员工最近被刑事指控 据称代表沙特政府访问用户数据,它会对员工进行关于数据访问控制(或缺乏)的更大谈话。为什么,许多专家想知道,这些工人是否有这么明显无拘无束的访问权限,完全不需要完成工作 - 明确违反了最不特权的知名安全标准?

虽然在此事件周围的辩论可能持续存在,但它几乎不言而喻,对于许多组织来说,最不合格的特权比现实更有理想。在许多情况下,这是因为大多数公司都不知道如何效力有效 确认 并跟踪他们的客户跨多个系统的敏感数据。

信息爆炸和数据识别

根本没有绕过它:2019年的数据无处不在。

它不仅可以到处都是,它以几乎无法理解的速度增长。几乎每个组织 - 从零售商到体育联盟,到奢侈品时尚房屋,到自然资源公司到政府和军事实体到非政府组织 - 现在就会产生几年前的似乎是一种荒谬的数据。

最近 国际数据公司(IDC)报告 说,世界集体数据将在未来几年的年度剪辑中成长为61%,到2025年达到175个Zettabytes(对于那些不熟悉Zettabyte的人,它相当于一个Sextillion字节。对于那些不熟悉SEXTLILION的人 - 让我们说这是一个很多的问题)。云数据平台的简单可扩展性和灵活性以及数亿个物联网和边缘设备的出现(预测到2022年达到15亿)只推动了那些数字更高的数字。

但由于公司生成,存储和分享越来越多的数据,以及来自多个和不同来源的更多类型的数据,它们也遇到了必须保护所有来自非授权外人和内部糟糕行动者的信息的威胁。

你必须了解你的数据......密切地

古希腊人知道存在是徒劳的 知道你自己,同样的原则是为您的组织不断增长的数据山来了。由于要充分保护您的组织的信息,您首先需要确定需要的需要。而且在不知情级别的情况下,你不能这样做:它是什么,它包含的内容,它的生活在哪里,等等。

为了使事物更具挑战性,您的数据现在可以驻留在更多的系统上,而不是过去 - 云,移动设备,本地机器或公司网络。虽然某些数据可能在合规性或隐私问题方面可能不需要保护,但必须保护其他几种数据类型:

  • 受控未分类信息(CUI)PCI,PHI,PII数据
  • 付款卡信息(PCI)
  • 个人健康信息(PHI)
  • 个人身份信息(PII)

这甚至没有计算公司财务数据,人力资源数据,商业秘密,甚至(为应对政府和军事的人)分类信息。留下这种数据暴露风险监管机构愿意和能够迅速和苛刻的速度  惩罚或者喜欢窃取您的数据的黑客。未能保护任何上述任何可能意味着严重(昂贵)违反欧盟等法规 一般数据保护法规(GDPR)国际武器法规(ITAR), 或者 北约斯坦加格S,取决于暴露的数据 - 惩罚从罚款到监禁时间。

大数据的问题(以及如何用软件解决它)

有很多和大量数据本质上是一件好事。如果您拥有强大的数据治理,集成和管理规则支持精心设计的数据平台,它也可能是一种巨大的竞争优势。但这可以是一个双刃剑:由于前面提到的数据的速度和规模,它现在比以往任何时候都更加努力地使用手动工具和流程。您组织创建的数据越多,这越难。

然而,某些软件工具可以是识别和分类飞行中的数据以及在诸如OnedRive,Google Drive,SharePoint等的各种系统中识别和休息的巨大帮助。这些工具还可以识别和处理冗余或过时的数据,降低存储成本并降低多个前端的风险。

机器学习与深度学习

两个都 机器学习 深深的学习是人工智能的形式,但在复杂性方面完全不同:

机器学习 在喂养从中学习的结构化数据的阵容和阵容之后,可以在没有任何人为干预的情况下进行修改的算法。

深度学习 是一种具有类似算法的机器学习的子集,但它们更多地层彼此层叠,每个都在其馈送的数据上具有略微不同的透视图。这些层的算法被称为 人工神经网络 由于它们部分受到生物神经网络的运作的启发。

巨石' 私密的加速器 使用最新的深度学习技术来准确地预测创建点的文件和电子邮件中的敏感数据的存在。

使用此类软件工具允许组织不仅要识别其数据以及它所在的数据,而是通过元数据主动标记每个电子邮件或文件,以确保在各种系统或由合作伙伴处理时识别和保护。使用深度学习的有效识别和分类工具通常允许组织:

  • 查找和识别 基于各种类别的电子邮件,文档和系统中的敏感数据您可以创建和培训系统以识别,例如财务信息,专有信息或个人信息。
  • 申请 通过电子邮件或文件中嵌入的元数据的正确保护级别,设置自动规则以保护它,甚至在处理这种数据时提醒员工备份疗程。
  • 结合 这种丰富的元数据具有加密技术,数字版权管理(DRM)软件,企业权限管理(ERM)软件,云访问安全经纪商(CASB),以及下一代防火墙进行凝聚力,集成方法,以确保全局运营强大的数据保护。这些第三方解决方案可以配置为自动读取和理解分类元数据并应用适当的控件。

数据识别是正确的

有几种方法可以自动化数据识别过程,这些方法取决于有问题的信息。

一些解决方案旨在检测运动中的敏感数据,就像员工不小心将本季度的内部财务报表附加到外部电子邮件并按“发送”。它帮助人们和系统了解如何通过视觉标记和元数据处理某些类型的敏感数据 - 并在忘记时使用自动控制的自动控制。

其他解决方案专注于识别休息的数据。这是重要的,因为组织和员工通常节省更多的数据和信息,而不是他们需要的数据和信息:根据智能信息管理的关联,每个非托管服务器的平均数据的三分之一 - 以及许多情况下高达70% - 冗余,过时或微不足道(腐烂)。此数据通常无限期地坐在非托管服务器上,并向组织和员工提供经常不受欢迎的隐私风险。

同时,通过使用预打包的深度学习功能来识别创建点的敏感数据(并应用适当的保护)来加快以上数据保护工具。基于深度学习的工具通过加快敏感数据检测,提供更快的时间值,需要最终用户培训,并在飞行中和休息和识别数据时使用数据,只要它存在在它的生命周期。

由于您的组织变得更加数据驱动,以跟上合作伙伴和竞争对手,您的系统将被迫生成和摄取越来越多的结构化和非结构化数据。客户,员工和监管机构的更大要求 - 也将放在您的数据上。这就是为什么有一个 基于软件的数据识别和分类解决方案 在适当的时候很快就成为了一定要意识到这一切 - 同时也有助于(希望)削减国际事件。

推荐资源

有关为数据识别选择合适解决方案的更多信息 法规遵守

需要,我们建议如下:



资源: //titus.com/blog/data-identification/lets-see-some-id-why-data-identification-is-a-crucial-first-step-for-compliance/