云计算
Cloud FinOps 对组织影响的 5 个关键指标
Cloud FinOps 意在构建将技术、财务和业务融于一体的运营框架和文化转变,以推动财务责任并通过云转型加速实现业务价值。 请参阅有关 Cloud FinOps 是什么 文章。
建立指标基线的价值
随着组织继续利用云投资来推动业务增长和收入,业务、财务和技术主管需要在努力交付强大业务结果的过程中变得越来越紧密地联系在一起。 与以往任何时候相比,高管们更需要量化他们在业务和技术能力方面投资的价值。因此,业务和 IT 领导者需要一组价值度量标准,这些标准包括运营和战略结果,以及风险和机会。 尽管如此,运营 IT 指标常常与业务结果脱节,执行人员需要在技术和业务结果之间建立联系,以促进 IT 和业务领导者之间进行有意义的对话。
与 IT 运营的许多方面一样,指标和 KPI 通常是一个过程。 组织通常从关注云成本的单位指标开始这一旅程,并最终朝着一组明确定义的业务价值指标迈进。
当我们定义云 FinOps 的五个关键组成部分(包括问责与实现、测量与实现、成本优化、规划与预测以及工具与加速器)的指标集时,我们确保这些指标在处于数字化转型过程中的组织中易于衡量和普遍实现。
问责制和支持度量
问责制和实施支持是建立成本和价值意识文化的基础,并为云 FinOps 的流程和文化转型过程绘制了路线图。主要目标是通过简化 IT 财务流程和实现无摩擦的云治理来帮助推动财务问责制和加速业务价值的实现。 实现通过培训使 IT、财务和业务团队能够更好地理解云资源和策略,从而有效地部署和管理它们。推动问责制和实现从一个章程和核心治理策略开始,然后指导连接财务、 IT 和业务所有者的流程的转换。
我们建议采用云实现百分比作为问责制和实施支持的标准度量,衡量标准是组织中受过培训和认证的业务领导者的数量。
这是一个重要的指标,因为许多组织由于缺乏认识和培训而未能采用 Cloud FinOps。这个云实现度量标准将帮助业务领导者更好地理解云的价值,以及它如何成为驱动可持续业务结果的实现者。
通过基于整个组织中已确定的业务领导者数量的设定目标,可以很容易地实现云实现度量。尽管如此,在这里利用80/20规则的帕雷托法则很重要,确定那些广泛使用云服务的关键业务领导人应该是主要关注点。 谷歌云最近发布了一个新的云数字领导者认证,旨在为商业领袖和高管。通过获得云计算数字领导者认证,它确保个人精通基本的云计算概念,能够展示云计算知识在各种应用中的广泛应用,以及谷歌云服务如何帮助实现期望的业务目标。 此外,FinOps 基金会 还向从事各种云、金融和技术工作的从业人员提供培训和认证,以验证他们的 FinOps 知识,提高他们的专业信誉。
Metric | Crawl | Walk | Run |
---|---|---|---|
云实现 % | < 40% | 40% - 70% | > 70% |
最终,我们看到,超过70% 的企业领导人获得云数字领导者认证的目标,可以显著推动整个组织对云 FinOps 的调整和采用,并利用云技术作为创造可持续业务结果的推动因素。
测量与实现度量
对于任何好的过程来说,准确的数据和有效的度量都是基础,它们从云成本可见性和可跟踪性的概念开始。这是由适当的资源层次结构和项目结构标准驱动的,并得到了组织使用云资源背后的标签和标记数据体系结构的支持。 虽然许多常见的标签包括 IT 驱动的指示器,如应用程序、环境和项目,但是通过将成本中心或帐户图表作为标签,将损益直接连接到标签和标签体系结构中是非常重要的。 此外,标记的自动化确保所有可标记的资源都使用一致和准确的标签进行部署,并为 FinOps 指标提供可靠的数据。
建立一致且详细的标签对于将云资源不仅归属于特定的产品和项目,而且归属于与业务线和相关损益相一致的详细成本中心都是必不可少的。 为了建立一个典型的云服务的全额退款,客户将需要归因与3种类型的云资源相关的成本。 第一个也是最简单的方法是将可标记的资源(计算实例、数据库和存储桶)归属到一个特定的损益表中,比如某个给定的应用程序只被一个业务部门使用。
第二种情况是可标记的资源跨多个业务线共享。许多客户将采用传统的损益分配模式,如利用业务收入或相关业务单位的人数来分摊成本。 为了更准确地分配共享应用程序的成本,前沿客户在他们的云微服务架构中使用元素,例如 API 调用,来专门测量共享应用程序的相对消耗。
第三种类型的云资源是那些无法标记的云资源。常见的例子包括支持、网络成本和第三方市场成本。在这里,通常使用上述传统的损益分配模型(使用人数或收入)。 一些客户将使用其可标记的资源分配的相对分配,以适当的非标记成本到他们的业务单位,而一些类型的成本,如网络,是根据 API 调用分配的。
为了衡量这三种云资源中云 FinOps 的度量和实现支柱的有效性,我们建议采用云分配% 作为主要度量。 这个度量标准是分配给负责业务所有者的总云成本(单个业务单元消耗的可标记资源、多个业务单元共享的可标记资源和非标记资源)的百分比。
这个度量标准可以用来支持 Showback (云成本保存在中央 IT 损益表中,但报告给业务单位)和 Chargeback 模型(云成本完全由业务单位损益表支付) ,并反映了资源标签和业务单位成本归属的潜在有效性和准确性。 可以通过两种方式实现云分配% 。基本的实现将限定任何损益指标(消费或传统的损益分配,如收入或人数)分摊的成本。 这个度量标准的更高级的实现将只限定那些使用标记或 API 调用来度量消耗并将相关成本归因于业务单元的资源(特定的和共享的)。
Metric | Crawl | Walk | Run |
---|---|---|---|
分配给负责任的企业主的云支出 % | < 70% | 70% - 90% | > 90% |
从 Crawl 到 Walk 实现阶段的客户将寻求分配总云成本的 70% 或更多,而那些转移到 Run 状态的客户将实现90% 或更多的成本分配,基于直接消费度量。
成本优化度量
云成本优化不仅仅是降低成本ーー它还包括知道在哪里花钱,以实现业务价值的最大化。它是一个迭代和持续的过程,提供了一个一致的方法,以最具成本效益的方式可视化和管理云消耗。 成本优化的成功不仅可以显著减少云开销,有时还可以提高应用程序的性能,以便在相同的成本范围内管理更高的流量(每秒用户请求或处理的事务)。
对于组织来说,自动化通过获取计费使用和成本数据以及为优化而生成的建议和生成的报告是非常重要的。这些优化反映了潜在的节省(也称为未实现的节省) ,它允许团队对实现进行优先排序以实现成本节省。
典型的潜在节约包括:
- 定价优化,如提交使用折扣(基于资源和基于支出) ,BigQuery 预订等。
- 对不提供任何业务价值的浪费资源(包括过期快照、空闲实例和过大的数据库)进行资源优化。
捕捉这个度量标准很重要,因为它可以让组织了解组织中存在的低效率问题,并让企业集中精力实现成本节约,从而捕捉在云中运行工作负载的真正价值。
成本优化指标可以通过将推荐中心集成到 FinOps 工作流中来实现。推荐中心是 Active Assist 的一部分,它包含智能工具和功能组合,可以帮助您以最小的努力优化工作负载。 它显示了项目中所有建议的总结,以及潜在的成本节约($) ,这样您就可以优先考虑成本优化工作。我们已经看到客户通过对IDLE VM推荐人产生的建议采取行动,使用折扣建议,VM机器类型推荐者等通过采取行动来获得节省。
Metric | Crawl | Walk | Run |
---|---|---|---|
云优化实现节约 % | < 70% | 70% - 90% | > 90% |
最终,我们看到客户在可优化的总体云服务上实现了90% 以上的节约。我们已经看到客户将这些节省的资金重新投资于创造不同的产品和产品,并改善他们的客户体验,从而加速从云端实现业务价值。
计划与预测度量
财务规划是财务机构的一项基础能力,它直接影响到每个公司的云计算预测准确性能力。财务规划的重点是准确预测财务指标,这些指标是每年设定的,以指导公司的财务目标。 年度计划按季度进行衡量,并根据全年业绩进行调整; 预测业绩每月进行监测,以帮助影响业务结果。
规划和预测云计算成本通常是负责云运营的团队的责任。业务预测规划是基于消费量计划、历史轨迹、季节性和先行指标。转型项目还会为预测的准确性带来重大风险。
在云支出中建立准确的财务预测需要重新思考资产折旧耗尽的传统方法,以及基于趋势的维护和许可费用预测。 使用特定于工作负载的预测模型,利用基于趋势的模型对稳定状态的工作负载进行组合,使用基于驱动程序的模型对应用程序进行缩放,以及使用月度方差分析,可以大大提高动态云需求的准确性。
捕捉和衡量预测的准确性使公司能够了解他们是否做了他们的计划。公司通过测量和讨论差异来获得他们测量的数据,从而更好地控制云支出分配。
云计算预测的准确性应该包括在财务和云运营团队至少每月讨论的话题中。云运营团队应该监控这个月的预测轨迹,并在发现意外变化时评估调整。
Metric | Crawl | Walk | Run |
---|---|---|---|
预测的准确性 % | < 70% | 70% - 90% | > 90% |
一个有效的预测准确性是避免公司高管和投资者感到意外。云计算往往具有更多的变异性和季节性,而不是资本支出在主要环境中的折旧。 协调项目和 sprint 敏捷管理有助于避免意外。如果开发变更导致开支出现意想不到的增长,那么应该对变更管理流程进行审查,以避免未来出现意外。
工具和加速器指标
使用适当的工具和加速器对于充分受益于 FinOps 实践非常重要。在早期阶段,公司可能会限制他们报告详细的云消费分析的能力。 随着实践的成熟和改进,资源的标签和标记被证明对于理解特定项目/团队的成本和构建单位成本指标是有价值的。
通过对资源进行自动化监控,提供有关支出、价值、遵从性和建议的见解,这些能力可以变得更加强大。
因此,工具和加速器成熟度的推荐衡量标准是评估已经实现的自动化建议的 # ,这些建议占所生成的自动化建议总列表的 %,从而节省成本
这是一个重要的指标,因为当组织将新的工作负载加载到云环境中时,缺乏强大的可操作建议和监控可能会导致云浪费的增加。这是阻止组织实现云投资总价值的一个关键因素。
客户可以利用云厂商的开箱即用的工具,一些例子包括 VM 正确的大小建议,BQ 插槽优化,提交使用折扣等,空闲资源建议。这可以使用建议 API 进一步集成到任何现有的企业工具中。 随着组织的成熟,他们可以利用云监控来创建基于自定义业务逻辑的高级建议。
Metric | Crawl | Walk | Run |
---|---|---|---|
FinOps 自动化% 基础设施自动化变更可节省成本 % |
< 20% | 20% - 50% | > 50% |
最终,我们看到,作为表面化建议的工具而实现的超过50% 的自动化建议的目标已经成熟,这将确保组织能够最小化和消除云浪费,从而最大化云投资的价值。
将其与 Cloud FinOps 仪表板结合在一起
随着技术和业务目标随着时间的推移不断发展,建立一个流程非常重要,在这个流程中,只要目标发生变化,云 FinOps 指标就会不断得到审查。 此外,需要注意的是,并非所有组织都需要实现已确定的度量目标的“运行”状态。度量标准是根据组织的优先级实现业务结果的手段。 通过与跨职能团队合作来量化和衡量 Cloud FinOps 指标的影响,执行领导者可以快速获得认可,突出共同的目标,并快速行动。
一些云厂商(例如 Google Cloud)已经开发了一些解决方案来帮助我们的客户建立一个 Cloud FinOps Dashboard 来获取这些指标来推动变革文化,并为转型和商业领导者提供工具来分享和跟踪关键指标的结果。 成功采用 Cloud FinOps 度量标准使组织能够关注业务结果,仪表板提供了一个有意义的反馈回路,可以报告影响并驱动整个组织的可见性。
如未另行说明,那么本页面中的内容已根据 知识共享署名 4.0 许可 获得了许可,并且代码示例已根据 Apache 2.0 许可 获得了许可。内容随着时间推移,可能会过期,会定时更新或移除一些旧的内容。
最后更新时间 (CST):2023-09-22
阅读更多
访问本博文的相关主题 云计算 以获取更多的精彩内容。