云监控工具使您能够跟踪您的云资源和服务。通常,实施云监控是为了确保最佳性能、计费和安全性。您可以使用一个工具,也可以组合使用多个工具。但是,请确保您选择的解决方案满足关键需求,包括原生云集成、云感知定价和可扩展性。
在本文中,我们将探讨作为原生一方工具和第三方监控解决方案提供的顶级云监控工具。我们还将展示 NetApp Cloud Insights 如何帮助您利用洞察力提升云性能和账单管理。
在本文中,您将了解:
云监控是一组实践,可帮助您确保云服务和应用程序的性能、安全性和可用性。您可以使用监控来优化基础设施、识别服务中断并检测漏洞或威胁。
在监控云资源和基础设施时,主要有三类监控。这包括:
在我们的指南中了解有关为您的监控工具收集日志数据的更多信息:cloud logging(即将推出)
有多种原生和第三方工具可用于监控您的云操作。根据您的云环境,您可能会选择一个通用工具,或者结合使用多个专用工具。为了确保全面监控您的环境,请考虑以下工具。
NetApp Cloud Insights
NetApp Cloud Insights 是一款基础设施监控工具,可让你全面了解整个基础设施。使用 Cloud Insights,你可以监控、排查并优化包括公有云和私有数据中心在内的所有资源。
Google Operations
Google Operations 是 Google Cloud Platform 的一款工具,可用于监控、排查和优化应用程序性能。通过它,您可以收集云资源和应用程序中的跟踪、日志和指标。Google Operations 包含内置仪表板和警报、实时日志分析以及应用性能管理(APM)套件。
Microsoft Azure Monitor
Azure Monitor 是一款专为 Azure 资源设计的工具,也可用于引入外部数据。它包含用于收集指标和日志的功能,可应用于基础设施、应用程序和网络的监控。Azure Monitor 提供一系列分析和机器学习工具的访问权限,并可与 Event Hubs 和 Logic Apps 集成。
Amazon CloudWatch
Amazon CloudWatch 是一项 AWS 监控服务,可用于了解您在 AWS 和本地的应用程序和资源。您可以将 CloudWatch 与 70 多种 AWS 服务集成,并用它来收集和分析指标和日志数据。您还可以将该服务与 CloudWatch Events 结合使用,以触发自动化操作和工作流。
Oracle 应用性能监控
应用性能监控是一款与厂商无关的工具,可用于监控本地、Oracle Cloud、多云和混合云环境。它包含用于监控浏览器性能、应用性能和资源性能的功能。您可以使用此服务收集和评估指标,并执行上下文日志分析。
Cisco CloudCenter
Cisco CloudCenter 是一款面向多云环境的、与厂商无关的管理和监控解决方案。它包含支持多云策略创建与管理、基础设施自动化、成本优化分析以及集中性能监控的功能。
Riemann
Reimann 是一个用于监控分布式系统的开源工具。您可以使用它将来自基础设施和应用程序的事件数据聚合到单一数据流中。您可以将 Riemann 与 Graphite 集成以实现数据可视化,或通过 Sinatra 应用界面查看系统概览。
cAdvisor
cAdvisor 是一个开源守护进程,可用于监控容器部署。它使您能够收集、汇总、处理和导出与资源使用、网络统计和隔离参数相关的数据。您可以通过基于 Web 的 UI 或通过 REST API 使用 cAdvisor。
Graphite
Graphite 是一款专为云和本地资源设计的开源监控工具。您可以使用它来存储、可视化和共享时间序列数据和指标。您不能使用此工具直接收集数据,但它确实包括兼容收集代理和集成的大型生态系统。
Prometheus
Prometheus 是一个开源监控实用程序,可用于收集、汇总、分析和可视化指标数据。它是 Kubernetes 部署的默认监控工具,可以与广泛的基础设施、资源和应用程序集成。您可以使用 Prometheus 客户端库来检测应用程序、存储和查询时间序列数据以及可视化系统运行状况。
在选择云监控工具时,您需要确保所选工具满足几个关键要求,以确保兼容性和价值。需要关注的一些重要要求包括以下内容。
全面可视性
云应用、用户和资源的分布式特性要求你监控比传统基础设施更多的组件。寻找能够集中并关联来自整个系统数据并提供端到端追踪的工具。
如果你的 IT 团队需要从多个工具中拼凑信息,他们更有可能忽略问题。缺乏集中化还会增加响应时间,使你更容易受到威胁或长时间停机。
原生云集成
理想情况下,您应寻找能够与您现有系统和服务提供商原生集成的工具。您需要包含的代理、插件或自定义集成越多,引入的故障点也就越多。此外,每当某个组件更新时,您都有可能失去兼容性。
云感知定价
传统的本地监控系统通常根据您打算监控的设备数量或用户数量来定价。然而,由于云资源的动态特性,这种定价结构并不适用于云资源。请寻找具有灵活定价或允许您按月浮动成本的解决方案。
请求数据捕获
云资源和应用程序涉及事件日志或指标可能无法捕获的请求数据。例如,eCommerce 客户可能会在访问您的微服务或数据库之前创建许多通过负载均衡器、移动设备或内容交付网络的来回请求。如果您无法通过请求跟踪或数据包捕获来监控这些动态组件,则可见性不完整。
可扩展性
云环境会产生大量数据,尤其是在添加物联网(IoT)或其他流式设备后。此外,用户数量可能会大幅波动,特别是在面向客户的应用程序和服务中。
您选择的任何监控工具都需要能够适应您的工作负载和用户生成的大量数据。这意味着需要扩展带宽和处理能力以实时采集数据,并扩展数据库以存储收集到的数据。
NetApp Cloud Insights 是一款基础设施监控工具,可让你全面了解整个基础设施。使用 Cloud Insights,你可以监控、排查并优化包括公有云和私有数据中心在内的所有资源。
Cloud Insights 帮助组织将平均故障恢复时间缩短 90%,防止 80% 的云问题影响最终用户,并将云基础设施成本平均降低 33%。它甚至可以通过识别敏感数据的风险来降低您遭受内部威胁的风险。
特别是,NetApp Cloud Insights 可帮助你发现整个混合基础架构,从公有云到数据中心。使用 NetApp Cloud Insights,你可以通过识别未使用的资源和合适的优化机会,优化云成本并在你的环境中节省资金。