数据和人工智能之间存在一种共生关系。我们收集数据作为解决问题的基础,然后使用AI来进一步解释和细化数据。这是一个持续的反馈循环,其中一个影响另一个的有效性。要想让机器学习产生影响,数据需要精心管理、高质量且易于获取。成功做到这点并不是非常容易的。
构建能够打破数据孤岛并使信息可操作的IT基础设施,同时确保安全性,这已经是企业面临的主要挑战。再加上人们希望通过机器学习和人工智能功能来运行这些数据,当数据被广泛分散时,事情就变得更具挑战性了,在云时代更是如此。
作为一项企业技术,人工智能承担着决策任务,帮助员工更好地完成工作,组织需要了解如何为AI驱动的业务准备架构和数据。
企业数据面临的挑战
云为企业提供了近乎无限的计算和存储资源,这使得保留海量数量数据成为可能,但这既是福也是祸。虽然它提供了分析数据和深入了解财务预测、客户需求等方面的机会,但庞大的数据量使得管理和利用这些数据变得非常困难。
企业中越来越多地采用云服务,遗留的本地解决方案和混合解决方案也在继续使用,这些都造成了巨大的数据孤岛,通常难以识别,更不用说合并和分析了。这些孤岛甚至可能不为IT团队和其他人所知,并有可能严重限制分析和智能工具。
这就导致了这样一种情况:企业获得了大量的数据,但对数据却知之甚少,包括存储的数据量,甚至是数据所在的位置。许多企业目前拥有复杂的在线和云数据存储网络,有自己的管理、存储、隐私和监管问题。现实情况是,随着数据变得更加分散,企业需要认真考虑集中管理。这是我们处理如此庞大的数据的唯一方法,将其转化为能够对更大的业务产生积极影响的东西。
为什么数据质量很重要
机器学习的目标是执行数据驱动的任务,其技能、精度和速度远远超过人类。就像一个人无法从错误的教科书中学习技能一样,试图理解错误数据集的机器学习过程也无法学到任何有用的东西。相反,不完整的数据集会帮助创建更窄或倾斜的过程。在构建这些数据集时需要平衡。
人工智能是非常有潜力的趋势,但它也不能建立在不完整、错误的数据集上。一般来说,人工智能的目的是实现预测决策、建模和分析,而如果数据不完整或孤立的,这些都是不可能实现的。经过训练的分析特定趋势的算法需要访问尽可能多的正常数据,这些数据可能保存在单独的数据孤岛中。
创建支持人工智能创新的基础设施
企业正在以更快的速度收集更多的数据,获得洞察力,就需要一种基础架构方法,以打破数据孤岛,并确保获得高质量数据。 IT部门需要将重点放在收集和保留之外,强调体系结构、管理和管理。 特别是创建一个数据湖,该数据湖允许一个单一的数据存储库,而不是将关键信息置于遥不可及的孤岛中。
人工智能是21世纪的变革性技术之一,它有望重塑现代企业。 实际上,我们已经在诸如客户体验之类的地方看到了它的影响,它可以帮助为买家创建定制的策划体验。但这不是即插即用的解决方案,它需要高质量的数据和确保数据始终可用的基础结构。没有这个基础,我们将无法实现。
本文转载自:中国ID圈
作者:IT168
原文链接:http://bigdata.idcquan.com/news/170563.shtml