前言:
这篇文章是我以前在51cto写的,加点料转过来 ! 运维啊,总是会在半夜三更处理一些个小问题,自己虽然感觉是小事,但是对于边缘节点业务线来说可能是天大的事。 在想,这些个东西是完全可以做成自动化的东西。但是这个时候就出现了走流程和承担责任的问题了 ~ 大家懂的~
其实对于快速运维方案来说,容易卡壳的地方,肯定会有走流程,确认流程这几步骤 ~ 其实有些时候,咱们可以下放些权利,让普通管理员有少许控制权 !
我就拿下面的例子说说吧,基础部门和业务部门分别做啥的大家肯定是有了解的 ~ 当业务运维工程师连接不上一台服务器的时候,会发邮件找人解决,他没有权限来进行管理,很多时候万能的重启是必须牛逼的。 其实这些个问题,往往是自己的程序致使cpu跑死了,或者是利用率跑满了,导致ssh连接不上,可以让他们选择重启或者是自己连接到管理网处理下 ~
Hello , 原文地址是 http://blog.xiaorui.cc
首先需要使用kerberos用户登录到平台上,平台的ip段做了控制,需要运维部和特定的运维人员的vpn的ip地址。这些通过后,后端会检测你是否已经有改组的权限。
然后输入你要处理的服务器ip地址 (只有个别机房支持这套系统),系统会做ip的配对和字段的过滤。
下一步后,会根据系统里面你的手机号码进行验证码推送。
这时候就可以在平台上输入你的验证码了 ~
验证通过后,你就可以赶紧自己的情况操作服务器了,需要注意的是,状态只存在于20分钟,20分钟之后会清空服务器端的认证session。
这里的重启服务器,调用的是ipmitool接口,可以实现针对硬件的操作。如果想执行管理网的console操作的话,虽然流程上需要你的领导审批一个认证,你得到一个验证码,也就是说 当你有手机验证码和审批下来的验证码才可以用这个功能。 我们也不建议他们使用。
点击执行后,还会给技术部抄发一份你刚才执行的执行的过程及结果了,因为是通过ipmitool调用的管理网,所以说,只要ipmi的ip和密码对了,那就成了。
像这样一个简单又高效的平台就产生了。这套系统安全方面我设计了两个点,一个是他的登录的判断,还有就是手机验证码的判断。
总结下:
平时我们可以把这些个小来小去的东西,都做成一些个小系统,以后这些个功能多了,可以集中在一个平台上。 这些都是咱们能提高效率,而不用为一些个鸡毛蒜皮的屁事,搞得都有跳槽的心 !