主人
数据湖

数据湖是一个存储库——通常是一个大的库——用于存储多种类型的数据。

数据湖是存储大量数据的系统。通常,它们是为了改进公司决策而建立的。


数据湖比传统的数据仓库更灵活、更快。

它是什么?

所有类型数据的大型存储库。您应该注意,在构建数据湖之前,您有一个从数据湖交付价值的计划。

这对你有什么好处?

数据湖旨在作为存储大量数据的存储库,与传统数据仓库相比,这些数据可以更快地进行分析,并产生更多的实时见解,具有更大的灵活性来进行新类型的分析。

权衡是什么?

许多企业未能从投资中获得回报,因为它们的湖泊中的数据存在质量问题,或者在确定用例之前在创建湖泊方面投入了大量资金。

它是如何被使用的?

数据湖经常用于存储和处理大数据。

它是什么?


数据湖是存储大量原始数据的存储库。这些数据可能来自企业的各个角落,从运行业务的结构化操作和事务数据系统到客户偏好等非结构化外部数据。


它们最初被视为对传统数据仓库的改进,传统数据仓库通常需要在存储之前对数据进行处理,而在传统数据仓库中,尝试进行新类型的分析的速度很慢,因为这需要构建新数据并将其输入仓库。


Data lakes通过强调首先捕获原始状态的数据,然后对其进行分析,解决了这些问题。


不幸的是,数据湖虽然解决了数据仓库的一些问题,但仍然没有解决最关键的问题——从数据中提取价值。


捕获数据并将其存储在湖中并不能真正解决从数据中获取价值的难题。由于数据质量问题,许多组织对其数据湖感到失望:如果没有对进入数据湖的数据进行管理,可能会造成重复和数据质量差等问题。

你怎么了?


数据湖比传统的数据仓库更灵活、更快。做得很好,数据湖提供了一种存储大数据的方法,然后可以对其进行分析,使您能够获得新的见解——可能是对业务绩效的了解,或者识别新的客户趋势。


数据湖还有助于公司将大型公共数据集添加到他们的分析中——可能使用天气数据来查看好天气对他们的零售业务的影响,或者使用地图数据来优化供应链的运输路线。

权衡是什么?


有一条古老的经验法则说:“没有使用的数据会变坏,就像成熟的香蕉一样。”无论您是在构建数据仓库、数据湖还是数据网格,在不确定数据将如何使用的情况下构建它们都是有风险的。如果源数据在被送入数据湖时是一团糟,那么当您尝试使用它时,它仍然是一团糟。


如果处理得当,适当强调数据使用,数据湖可以成为数据计划中有用的技术。


许多组织对他们的数据湖投资感到失望,因为他们没有预先规划如何使用数据湖中的数据。如果您预先构建了一个有价值的用例,您会发现构建数据湖的投资能够更快地产生回报。

它是如何被使用的?


可用于大数据项目,如从物联网部署、用户行为事件或金融交易收集数据。

想了解更多吗?

您想建议一个要解码的主题吗?

只需留下您的电子邮件地址,我们会在准备好后立即与您联系。

Baidu