Lanson

V1

2022/09/06阅读:19主题:兰青

数据治理(十一):数据安全管理Ranger初步认识

数据安全管理Ranger初步认识

在大数据平台中,有海量数据存储,通畅在采集数据过程中敏感数据有意或者无意的进入大数据平台中,数据安全管理非常重要。我们不希望一些敏感数据被他人访问,希望可以按照一种规则给部分人访问权限,以防止数据泄露,针对数据安全管理可以使用Apache Ranger实现。

一、​​​​​​​Ranger介绍

Apache Ranger提供一个集中式安全管理框架, 并解决授权和审计。它可以对Hadoop生态的组件如HDFS、YARN、Hive、HBase等进行细粒度的数据访问控制。通过Ranger统一的管理控制台界面,管理员可以轻松的通过配置策略来控制用户访问权限,并且可以对用户的行为日志进行统一的审计管理。

我们可以通过Ranger提供的UI界面或者Rest API来管理所有与安全性相关的任务,可以使用管理工具来对Hadoop体系中的组件进行授权。Ranger优点如下:

  • 丰富的组件支持(HDFS,HBASE,HIVE,YARN,KAFKA,STORM)。
  • 提供了细粒度级权限控制(hive列级别)。
  • 权限控制插件式,统一方便的策略管理。
  • 支持审计日志,记录各种操作的日志,提供统一的查询接口和界面。
  • 支持和kerberos的集成,提供了Rest接口供二次开发。

Ranger官网:Apache Ranger – Introduction

二、Ranger架构

Ranger架构如下:

  • Ranger-admin:

Ranger实现安全管理的核心就是Ranger-admin,是一个web服务,对外提供Restful风格的http服务,内嵌了jsp界面,用于管理用户、资源、权限等信息。

  • Plugin:

几乎所有的大数据组件都提供了抽象的验证接口,Ranger就是根据这些接口为各个大数据组件实现了对应的Plugin,有了这些Plugin,Ranger可以轻松实现对大数据组件权限控制访问,Plugin的工作主要是从Ranger-Admin处拉取该组件配置的所有策略,然后缓存到本地,当有用户来请求时提供鉴权服务。

分类:

后端

标签:

大数据

作者介绍

Lanson
V1

CSDN大数据领域博客专家