亚马逊云科技发布全新数据管理服务Amazon DataZone
- 帮助客户在整个企业内对数据进行编目、发现、共享和治理
- ENGIE*、福克斯和伊塔乌联合银行等客户成功应用**Amazon DataZone*
北京2022年12月1日 /美通社/ -- 亚马逊云科技在2022 re:Invent全球大会上宣布,推出一项全新的数据管理服务Amazon DataZone,它可以让客户更快、更轻松地对存储在亚马逊云科技、客户本地和第三方来源的数据进行编目、发现、共享和治理。借助Amazon DataZone,管理员和数据资产管理者可以使用精细的控制工具管理和治理数据访问权限,确保数据访问发生在正确的权限和正确的情境之下。Amazon DataZone使工程师、数据科学家、产品经理、分析师和业务用户可以轻松访问整个组织的数据,从而发现、使用数据,通过数据进行协作来获得洞察。
当前,企业收集的数据达到PB甚至EB级别,这些数据来自多个部门、多项云服务、众多本地数据库以及第三方数据源(如来自合作伙伴解决方案和公共数据集)。在企业可以释放数据的全部价值之前,管理员和数据管理者作为数据生产者与管理者,需要在保障数据的管控和治理的前提下允许数据访问,确保数据只能由正确的人在正确的情境下访问。另一方面,整个公司的员工(如数据消费者)都希望发现和分析来自数据生产者的信息,以推动决策制定。数据需要被管控以保证安全,产生新的洞察需要允许数据访问,企业必须在二者之间寻求平衡。然而企业内数据多样,部门林立,用例不同,这些都对治理策略的落实提出挑战。一些企业通过建立目录来管理信息,但这些目录系统维护起来相当耗时,需要数据生产者手动标记每个数据集,额外添加来源或描述等情境信息来保证数据可以被检索和发现,同时缺乏内嵌的访问控制来简化数据治理。企业很难保持数据分级分类的一致性,以及各个数据生产者必须保持自己的信息实时更新,这使得在整个企业中搜索数据变得非常困难,并可能导致数据过时。在这种情况下,数据消费者即使找到了所需信息,也无法快速通过目录直接向数据所有者请求访问权限,也就无法加载数据分析服务以及与他人协作。最终,决策者无法及时获得所需信息,或者可能根据不完整或过时的数据做出欠佳的决策。
Amazon DataZone是一种全新的数据管理服务,它助力数据生产者轻松管理和控制数据访问,使数据消费者能够发现和使用数据、开展数据协作以获取业务洞察。数据生产者可以通过Amazon DataZone定义数据分级分类,配置治理策略,连接一系列亚马逊云科技服务(如Amazon S3和Amazon Redshift)、合作伙伴解决方案(如Salesforce和ServiceNow)和本地系统,从而创建自己的业务数据目录。Amazon DataZone使用机器学习为每个数据集收集和建议元数据信息(如数据来源和数据类型),并根据客户的分级分类和偏好进行模型训练,不断优化,从而消除数据目录维护的繁重工作。设置目录后,数据消费者可以使用 Amazon DataZone搜索和发现数据资产,检查元数据使用情境,请求数据集访问权限。当数据消费者开始分析数据,他们会创建一个Amazon DataZone数据项目,即门户系统中的一个共享空间,用户可以在其中提取不同的数据集、与同事共享访问权限、进行分析协作。Amazon DataZone与Amazon Redshift、Amazon Athena和Amazon QuickSight等亚马逊云科技数据分析服务进行了集成,数据消费者能够在其数据项目的情境中访问这些服务,他们的数据在这些服务中自动可用、无需单独的登录凭证。Amazon DataZone还提供应用程序编程接口(API)以与自定义解决方案或与DataBricks、Snowflake和Tableau等合作伙伴进行集成,因此,客户可以轻松发布、搜索和使用其所有的数据资产。
“良好的治理是整个组织都可以访问数据的基础,但我们经常听客户说,在使数据可发现和保持控制之间很难取得适当的平衡。"亚马逊云科技数据库、数据分析和机器学习副总裁**Swami Sivasubramanian表示,“借助 Amazon DataZone,客户可以使用单一服务在强大的治理控制和简化的数据访问之间取得平衡,从而轻松查找、组织数据,使用数据进行协作。Amazon DataZone在整个企业内解放了数据的束缚,每个员工都可以帮助推动获取新的洞察,最大限度地发挥数据价值。”