数据迁移是指将数据从一个位置转移到另一个位置,从一种格式转换为另一种格式,或从一个应用程序移动到另一个应用程序的过程。数据迁移通常是为数据引入新系统或位置的结果。业务驱动因素通常是应用程序迁移或整合,在这种迁移或整合中,原有系统会被共享同一数据集的新应用程序所取代或增强。如今,随着企业从内部基础架构和应用程序迁移到基于云的存储和应用程序以优化或转变公司,数据迁移即开始。
简单来说是因为“数据引力”。尽管数据引力的概念已经存在一段时间了,但随着数据向云基础架构的迁移,这一挑战正变得日益严峻。简而言之,数据引力是一个比喻,它描述了:
要将应用程序和数据迁移到更有利的环境, Gartner 建议将“解条”数据和应用程序作为克服数据重力的一种手段。通过在项目之初抽出时间来整理数据和应用程序复杂性,公司可以改善他们的数据管理,支持应用程序的移动性,并促进数据治理。
主要问题在于,每个应用程序都会在数据管理层中引入应用程序逻辑元素,从而使数据管理变得更加复杂,而每个应用程序都不会在意下一个数据使用情形。业务流程会独自使用数据,然后输出自己的格式,而将集成问题留给下一个流程自己解决。因此,应用程序设计、数据架构和业务流程必须相互响应,但往往总有一方无法或不愿意更改。这迫使应用程序管理员绕过理想而简单的工作流,导致设计欠佳。而且,虽然当时可能确实需要采取这种解决方法,但这些技术问题最终必须在数据迁移或集成项目期间得到解决。
鉴于这种复杂性,请考虑将数据升级到“战略武器”状态,使其获得适当的认知度和资源水平。为了确保项目获得所需的关注,请重点关注迁移过程中最具激发性的因素,也就是旧系统将关闭,您最终将得到重要利益相关方的关注,我们保证。
升级系统或将数据中心扩展到云具有诸多业务优势。对于许多企业来说,这是一个非常自然的演变过程。使用云的企业希望他们能够将员工的精力集中在业务优先级上,推动顶线增长,提高灵活性,降低资本支出,以及按需付费。但是,迁移类型往往决定 IT 员工可以腾出多少时间来处理其他项目。
首先,我们来定义迁移类型:
数据迁移包括 3 个基本步骤:
移动重要或敏感数据以及停用旧系统不免会让利益相关方神经紧张。制定可靠的计划是必不可少的;但是,您不必重新发明车轮。您可以在网络上找到许多数据迁移计划和检查清单示例。例如, Data Migration Pro,这是一个由数据迁移专家组成的社区,拥有一个概况了 7 阶段流程的全面的检查清单:
这似乎是一项巨大的工作,但并非每次迁移都需要执行所有这些步骤。每种情况都是独一无二的,每家公司都以不同方式处理任务。
尽管几十年来数据迁移一直是 IT 生活的一部分,但每年仍有令人震惊的事件发生。以下是企业在移动数据时面临的十大挑战:
未联系主要利益相关方。无论迁移规模如何,都有人关心您所移动的数据。在开始执行任务之前,请先对其进行跟踪,并说明此项目的需求及其影响。否则,您肯定会在某个阶段听到他们的声音,他们很可能会打乱您的时间表。
不与业务部门沟通。向利益相关方说明项目后,请务必让他们了解您的进度。最好在每周的同一天提供状态报告,尤其是在情况偏离正常时。定期沟通对于与所有受影响的人建立信任有很大的帮助。
缺乏数据治理。请确保您清楚知道谁有权在源系统中创建批准、编辑或删除数据,并将这些数据以书面形式记录在项目计划中。
专业知识匮乏。尽管这是一项简单的任务,但移动数据涉及到许多复杂因素。拥有经验丰富的专业人员以及出色的参考资料,有助于顺利完成此过程。
缺乏规划。平均而言,家庭在计划假期时花费 10 到 20 个小时,而 IT 团队在规划小型数据迁移时所花费的时间可能只有一半。花费数小时的规划并不总是能保证成功,但制定可靠的数据迁移计划确实可以节省数小时的实际数据移动时间。
数据准备软件和技能不足。如果这是一次大规模迁移(数百万条记录或数百张表),请使用一流的数据质量软件,并考虑聘请一家专业公司来提供帮助。好消息:有外部公司可以向您出租软件,帮助您节省成本。
等待目标系统完美符合规格。如果实施团队正在整理设计标准,请继续执行步骤 2 和 3 。目标系统就绪在项目后期会很重要,但现在不要让它阻止您。
未经验证的迁移方法。进行一些研究,以确保数据移动过程对像您这样的其他公司行之有效。请勿再接受供应商提供的通用过程。
供应商和项目管理。必须管理供应商和项目。如果您还在进行日常工作,请确保您有时间管理项目以及任何相关供应商。
跨对象依赖关系。虽然目前有可用的数据管理工具技术和功能,但发现原始计划中有未包含的相关数据集,依然是晴天霹雳。由于跨对象依赖关系往往要等到迁移过程很晚才会发现,因此请务必构建一个相应的应急计划,避免整个交付日期受影响。
数据迁移和数据转换这两个术语有时会在互联网上互换使用,因此让我们来澄清一下:它们的含义不同。如前文所述,数据迁移是指在不同位置,格式或系统之间移动数据的过程。数据迁移包括目标系统中的数据剖析,数据清理,数据验证以及持续的数据质量保证流程。在典型的数据迁移场景中,数据转换只是复杂过程中的第一步。
术语“数据转换”是指将数据从一种格式转换为另一种格式的过程。如果要将数据从原应用程序移动到同一应用程序的升级版本或具有新结构的完全不同的应用程序,则必须执行数据转化。要转换数据,必须根据一组要求从源系统提取数据,然后更改数据并将其加载到新的目标系统中。
有时与数据迁移相混淆的另一个术语是数据集成。数据集成是指将驻留在不同数据源的数据组合在一起,为用户提供所有数据的统一视图的过程。集成来自多个数据源的数据对于数据分析至关重要。数据集成的示例包括数据仓库、数据湖和 NetApp® FabricPools,后者可以在内部数据中心和云之间自动进行数据分层,或者在 AWS EBS 块存储和 AWS S3 对象存储之间自动分层数据。
迁移到 基础架构即服务 (IaaS):
迁移到 平台即服务 (PaaS):
要确保任何数据迁移都能顺利成功,并且性能、安全性和 ROI 可以创造业务价值,选择符合业务需求的部署模式至关重要。
将您的应用程序与云中的新服务集成在一起,甚至还可以弥补部分技术问题!
加快数据中心迁移速度,降低风险,消除或最大程度地减少中断,并确保数据中心为云做好准备。