最新公告
  • 欢迎您光临AA分享网,一个高级程序员的学习、分享的分享平台!立即加入我们
  • 有哪些常用的自动化运维工具?

    随着信息时代的不断发展,IT运维已成为IT服务内涵的重要组成部分。运维已从最初的几台服务器发展成为一个庞大的数据中心。单靠人工已不能再满足技术,业务,管理等方面的要求,因此标准化,自动化,体系结构优化,流程优化和其他降低IT服务成本的因素引起了人们越来越多的关注。其中,对自动化运维进行了广泛的研究,并将其作为替代手动操作的起点。那么有哪些常用的自动化运维工具?

      有哪些常用的自动化运维工具?

      1、监控

      2、网络设备存活监控

    对于SRE来说,需要监控程序是否正常;对于主机组来说,需要监控服务器硬件是否正常;对于网络来说,我们首先需要关心网络设备是否可达。当一台TOR不可达时,基本上预示着会有一片服务器不可达,业务的痛感是相当强烈的。

      3、设备日志监控

    设备存活告警虽然可以预警很多异常,并且准确度很高,但是对于冗余性做得比较好的网络,能Ping通并不代表完全没问题,此时,细心的网络工程师会去看日志,这里可以反映出更多细节。对于万台服务器规模,网络设备的数量也就千台,但是逐台查看日志,人肉判断是否有异常,那简直是场噩梦。

      4、流量监控

    高速公路铺得再好,也架不住车多人多。确保网络顺畅,品质优良,没有丢包,延时稳定也是网络工程师的职责 ,此时流量监控就成了刚需。

    业务的飞速发展体现在网络层面就是DC内流量上涨/DCI流量上涨/IDC出口流量上涨/专线流量上涨,流量监控可以准确掌握业务的高峰和低谷,当线路需要扩容时,带宽使用率是老板参考的重要数据。一般情况下线路中的流量超过50%即可发起扩容,因为这意味着当备份链路down之后,主线路将出现拥塞。

    5、接口error监控

    接口的Error包监控和流量监控一样,均可以通过snmp采集,OID:ifOutErrors,ifInErrors ,
    Error包出现增量会直接影响业务的服务质量,一旦发现需要优先处理,否则业务会拎着一堆TcpTimeOut指标找上门来。

      6、制造自动化运维工具

    第一章中的组合拳打完之后,基本上不会出现“意料之外的故障”,所有的异常都应该有据可查,当SRE莫名其妙提出对网络环境的质疑时,你应该早已心中有谱。

    但是网络工程师的工作并非只有救火,日常运维工作中,经常需要配合业务发展做一些线上变更/
    机房扩建/业务类故障排查等。作为一名“懒惰”的网络工程师,程序可以帮忙点什么忙呢?

      7、UserDevice Tracker

    这个名词借用于Solarwinds套装中的一个组件,直译为“用户设备追踪器” , 在中小型企业网运维中,经常会有这样的需求:

    · 知道服务器的IP,请问连接在交换机的哪个口?

    · 知道交换机的某个端口,请问连接的服务器的IP是多少?

    · 给你一台服务器的MAC地址,怎么知道在哪个交换机的哪个口?

    大型互联网公司一般会有CMDB或者网络管理平台来记录这些信息,
    但是如果你是一家中小型企业的网管,没有运维研发团队做支持,并且还在沿用二层的环境(服务器网关在核心设备),那就比较费劲了。以上几个问题其实归根到底是要捋清楚三个要素的对应关系:PORT<>MAC<>IP

      8、网络设备北向接口的二次封装

    日常网络运维工作中,经常会有一些 “简单重复劳动”,例如:为某个接口划分Vlan/给某台设备添加一条指向主机的路由等,
    这些操作既没有科技含量,还占用了工程师宝贵的时间,更要命的是再简单的人肉操作,重复的次数只要足够多,总有失误的时候,正所谓“常在河边走,哪有不湿鞋”,但是在这种问题上犯错误简直是对职业生涯的抹黑,如此“鸡肋”的工作怎么才能干得漂亮?

    上述就是关于有哪些常用的自动化运维工具的全部内容介绍,想了解更多关于自动化运维的信息,请继续关注中培教育。

    AA分享网一个高级程序员的学习、分享的IT资源分享平台
    AA分享网-企业网站源码-PHP源码-网站模板-视频教程-IT技术教程 » 有哪些常用的自动化运维工具?
    • 257会员总数(位)
    • 5897资源总数(个)
    • 8本周发布(个)
    • 0 今日发布(个)
    • 536稳定运行(天)

    提供最优质的资源集合

    立即查看 了解详情