①关键性能指标:当我们谈到KPI时,我们说的是应用程序性能指标,如响应时间、每分钟请求数、线程和会话细节、CPU利用率、磁盘和内存利用率、错误状态等。这包括第一组基本应用程序和基础架构指标,您可以通过检查来衡量应用程序效率。您的APM系统应该能够定期准确地呈现这些数据。
②代码级洞察和事务跟踪:大多数APM解决方案都提供了代码级的可见性,有助于在最终用户报告之前发现可能被忽略的问题。您的APM解决方案应该能够获取单个事务跟踪的快照,并允许您深入到SQL查询中,以检测缓慢的查询。在分布式事务跟踪的帮助下,APM解决方案应该能够跨各种平台和语言跟踪从一个服务到另一个服务的调用,尤其是当您的应用程序在微服务环境中运行时。面/应用程序中用户行为的合成事务,您应该能够发现应用程序性能的任何差异(页面加载时间、404错误等。)之后再部署。这也确保了部署后的应用程序性能在从世界各地的不同位置访问时提供相同的一致性能。
④广泛支持的应用:你的APM软件也许能够监控各种应用和框架,但更重要的是根据各个组织的业务需求来评估工具。例如,您的APM工具可以帮助您监控Web服务器和底层数据库的性能统计数据;但是,它能为您的内部定制Web应用程序执行应用程序性能管理吗?理想的APM工具应该灵活,并支持IT环境中所有必要的可监控接触点。
⑤全方位监控的单一控制台:如上所述,一个理想的APM工具应该包含基本要素,即全方位监控、报警和综合报告,免去了必须处理多个工具来测量和优化应用性能的麻烦。
⑥ADDM:ADDM 扩展到应用程序发现和依赖关系映射。您的 APM 管理工具不应该只是自动发现网络中的所有应用程序和服务器,它还应该能够对它们进行分类(数据库、虚拟机、服务器等)并为用户提供可视化应用程序相互依赖关系的能力。此功能特别有助于节省通常浪费在试图查明大量应用程序中的瓶颈的时间。
⑦报警和自动纠正措施:报警是APM监控工具的主要需求之一。这些警报的阈值应该可以针对单个指标和整个应用程序进行配置。这些警报有助于更快地发现应用程序性能问题。IT团队应该能够通过各种渠道接收这些警报——电子邮件、SMS、Slack消息、ITSM工具中的事件(如ServiceNow)等。但是,这些警报还应该能够执行预先配置的操作,以便更快地进行故障排除。执行纠正脚本或批处理文件、重启VM或容器实例、执行MBean操作、生成堆转储/线程转储/垃圾收集等。可以是自动化操作的一些例子。
⑧定制仪表板:用同样的注意力管理所有的应用程序是非常详细的。想象一下,您的监控工具中增加了数百个服务器/应用程序;有一个有组织的仪表板,显示统计数据,如最近的严重警报、繁忙的服务器和服务器的当前可用性。您将确切地知道哪个服务器需要您首先关注。当然,从业务价值的角度来看,最有意义的统计数据可能因组织而异,这就是为什么仪表板应该提供定制灵活性的原因。
⑨报告:报告是定期分析和分享应用性能意见的重要手段。这种分析有助于确定未充分利用和过度利用的服务器,了解APM性能趋势,并根据历史数据预测未来趋势,以便规划资源重新分配和基础架构升级。没有适当的应用程序分析,任何APM实例都是不完整的——无论是小型、中型还是企业应用程序。
⑩成本和可扩展性:选择APM工具最重要的因素之一几乎和它的功能一样重要(或者更重要?),是他们的价格。通常,对于任何供应商来说,一个监控数百台服务器的小型网络的价格似乎都不高。但是,必须记住,一旦一个组织决定增加其基础设施容量,最终成本就会增加。扩大后的价格会影响你的预算,阻碍数字化转型吗?这是值得深思的。
应用程序性能管理(APM)在了解各种组件对业务关键型应用程序的影响方面发挥着重要作用。它有助于揭示可以优化和增强的性能责任因素,以提高应用程序的整体性能。
免费与10000名中国最顶尖CIO、CTO交流





