服务器宕机怎么处理
㈠ 服务器经常死机的常见解决方法
宕机,指操作系统无法从一个严重系统错误中恢复过来,或系统硬件层面出问题,以致系统长时间无响应,而不得不重新启动计算机的现象。那么服务器死机的原因有哪些呢?下面一起看看!
大概有一下几个方面:
1、散热
2、电源供电
3、系统自身问题
4、CPU 和 内存不够
方便的话可打开性能查看,死机的时候是否是CPU 运行到100%,物理内存是否已满!
注意数据库的使用
补充:预防死机的小技巧
1、不要在同个硬盘安装多个操作系统
2、不要一次性打开多个网页浏览
3、在关闭电脑时,不要直接按电源按钮,否则会导致文件丢失,下次使用不能正常开机导致死机
4、别让CPU、显卡超频,电脑温度过高
5、及时清理机箱内的灰尘
6、更换电脑硬件配置时,一定要插牢固
7、不要使用来历不明的软件和光盘,以免传染病毒
8、对系统文件或重要文件,最好使用隐含属性,以免因误操作而删除或覆盖这些文件
9、在安装应用软件时,若提示是否覆盖当前文件,一定不要覆盖,通常当前的系统文件是最好的
10、在运行大型应用软件时,不要在运行状态下退出以前运行的程序,否则会引起整个Windows崩溃
相关阅读:死机宕机实例介绍
自2015年3月11日下午5点起,据苹果用户反应AppStore、Mac AppStore、iTunesStore均为宕机状态,iTunes Connect无法登陆,iBooks商店没有响应。此外,iOS和Mac的应用商店也出现了大面积瘫痪。并显示为“所有用户不可用”。此次服务中断时间长达11个小时,甚为罕见。苹果公司在一份电子邮件声明中表示,服务中断是由于内部系统错误引起的。
2014年1月21日,大量QQ用户反映,腾讯的第三方登录出现故障,不少第三方服务使用QQ都登录不上。不仅是第三方登录,QQ邮箱也无法正常使用。这次受影响范围很大,腾讯的第三方登录服务器出现了宕机。
㈡ 服务器宕机原因及其解决方案
对于广大站长来说,服务器宕机对网站的收录跟排名都是有非常大的影响的,最重要的是宕机会影响网站业务的进行,所以无论不管说是用户还是服务商都不希望服务器出现宕机问题,那假如出现了,我们该如何解决它呢?
服务器宕机是每个服务商都会遇到的问题,一般有以下几种原因:
1.服务器性能
服务器的性能问题有很多,但最多见的应该就是sql,但我们也不能一概而论,还有别的可能性,例如有些问题就是服务器Bug或错误行为导致的。另外,较差的Schema和索引设计也是较多的出错原因之一。
2.运行环境
如果是这个问题,那么最常见的就是磁盘空间消耗完了。
3.数据丢了或损坏
数据丢失也有很多原因,可能不是用户错误操作,也可能是人为攻击造成的,但一般来说是由drop table错误操作导致,通常出现这个问题都会伴随着缺少可用备份的问题。
4.复制
复制问题一般是由主备数据不一致导致的。
我们了解了这几项宕机原因,那么如何判断或查看服务器宕机原因呢?
(1)查看是否是误操作导致的
(2)查看是否是应用程序导致的
(3)查看是否是应用程序导致内存溢出或者泄露,out of memory导致
(4)查看是否是流量负载过大导致的
(5)查看是否是遭受黑客入侵攻击导致的
那我们查明是如原因后,我们又该如何去解决问题呢?
1.发现服务器宕机后,及时联系服务商解决相关问题,就算短暂的宕机也可能会造成较大的损失,请大家及时联系自己的服务商。
2.做好提前防范的准备。可以同时运行两个网站空间,备份内容,当一个出现问题,立刻启动另一个。
3.使用一款功能好的宕机监控第一时间智能处理,故障发生时可设置自动切换至备用IP,恢复后将切换回原IP,能够有效提高网站可用性和页面性能。有效规避风险降低成本。
㈢ 服务器宕机了,应该怎么办
造成服务器宕机(死机)的原因是什么呢?那么他解决方法有哪些呢?壹基比来告诉你
引发服务器宕机原因大概有:运行环境问题、服务器性能问题、服务器硬件问题、数据丢失或损坏问题。下面我们对以上几个问题详情描述并提供解决办法:
一、运行环境问题导致服务器宕机
服务器运行环境包括操作系统,数据库,应用程序,应用程序bug,网络数据等,以上软件系统故障会引起服务器宕机现象。解决办法:需要我们查找分析系统、应用程序相关日志来找出真正的原因。一般都能发现问题,根据日志提供的错误信息修改相关设置来解决此类宕机故障,由于系统原因可以重装系统,或重启一下服务器就可以了。
二、服务器性能问题导致服务器宕机
服务器性能好坏也是引发宕机的一个因素,因为IDC提供商的服务器有些不是品牌服务器,是组装型的服务器,采购的硬件也不是品牌的,多用于杂牌硬件,难免会因硬件兼容性,CPU,内存等性能不好,导致宕机。解决办法:查看服务器硬件信息,在租用或选购时尽量用品牌服务器,品牌服务器在稳定性方面是没得说的。
三、服务器硬件问题导致服务器宕机
如服务器主板,电源,CPU,内存,磁盘有问题也会导致服务器宕机故障,解决办法:使用工具测试相关硬件配件,或更换配件测试服务器硬件问题。
四、数据丢失或损坏问题导致服务器宕机
数据丢失包括人为错删除数据,磁盘坏道导致数据丢失,磁盘写满等原因可导致服务器系统崩溃宕机,解决办法:做好数据备份,监控磁盘空间大小。
㈣ 网站宕机 服务器宕机 数据库宕机 宕机怎么办
最近遇到个比较有意思的问题,服务器宕掉后无法启动,想了好多办法,虽然解决了问题,数据没有丢失,但是没有按照自已的思路来,未免还是有些不甘。遇到问题不能慌,尤其是线上的环境,更不能紧张,心理素质对DBA来说也是一项挑战,可能你的手一抖就会导致多少人无法正常使用业务,如果你没有把握,请先把现场环境备份后再进行操作,避免数据的二次损坏,下面壹基比小喻说一下大概的思路吧。
1.检查是否有备份,如果备份存在,binlog存在,那么万事大吉,一切都有挽回的余地,慢慢来搞,只要你基础扎实,数据还原只是时间的问题。
2.对于没有备份的,那处理这个问题就有些棘手了,还得一步一步的来。
在my.cnf中[mysqld]下加上以下配置,采用强制恢复机制,看是否能够启动
[mysqld]
innodb_force_recovery=1
如果设置成1不能启动,可以逐渐的将数据增大到6,下文会详细说下1-6是什么意思,如果在1-6之间启动成功了,那么你运气还不错,这时候不要恢复业务,赶紧把数据用逻辑方式导出来,再启个新的实例把数据还原,有人会问,为什么mysql已经启动了,还要导出数据呢,原因在这:
当innodb_force_recovery被设置为大于0的时候 ,会阻止用户insert,update,delete也就是你启动的mysql不是一个正常的mysql服务,类似于windows系统下的安全模式。以下这段引于其它地方,具体地址不太清楚了,也可以从官方文档中找到。
innodb_force_recovery被允许的非零值如下。一个更大的数字包含所有更小数字的预防措施。如果你能够用一个多数是4的选项值来转储你的表,那么你是比较安全的,只有一些在损坏的单独页面上的数据会丢失。一个为6的值更夸张,因为数据库页被留在一个陈旧的状态,这个状态反过来可以引发对B树和其它数据库结构的更多破坏。
innodb_force_recovery=1 (SRV_FORCE_IGNORE_CORRUPT)
即使服务器检测到一个损坏的页,也让服务器运行着;试着让SELECT * FROM tbl_name 跳过损坏的索引记录和页,这样有助于转储表。
innodb_force_recovery=2 (SRV_FORCE_NO_BACKGROUND)
阻止主线程运行,如果崩溃可能在净化操作过程中发生,这将阻止它。
innodb_force_recovery=3 (SRV_FORCE_NO_TRX_UNDO)
恢复后不运行事务回滚。
innodb_force_recovery=4 (SRV_FORCE_NO_IBUF_MERGE)
也阻止插入缓冲合并操作。如果你可能会导致一个崩溃。最好不要做这些操作,不要计算表统计表。
innodb_force_recovery=5 (SRV_FORCE_NO_UNDO_LOG_SCAN)
启动数据库之时不查看未完成日志:InnoDB把未完成的事务视为已提交的。
innodb_force_recovery=6 (SRV_FORCE_NO_LOG_REDO)
不要在恢复连接中做日志前滚。
数据库不能另外地带着这些选项中被允许的选项来使用。作为一个安全措施,当innodb_force_recovery被设置为大于0的值时,InnoDB阻止用户执行INSERT, UPDATE或DELETE操作.
即使强制恢复被使用,你也可以DROP或CREATE表。如果你知道一个给定的表正在导致回滚崩溃,你可以移除它。你也可以用这个来停止由失败的大宗导入或失败的ALTER TABLE导致的失控回滚。你可以杀掉mysqld进程,然后设置innodb_force_recovery为3,使得数据库被挂起而不需要回滚,然后舍弃导致失控回滚的表。
关于上面进行逻辑备份也可能会遇到问题,可能会备份失败,如果出错,建议先按库一个一个的备份,到哪个库出错后,再按照当前库的表一个一个备份,表出错根据表中主键一点一点备份,最终将大部分数据导出。如果你的数据不重要,可以容忍丢失,那么可以当我说的都是废话了。
3.如果还是不可以启动,那么恭喜你,你遇到挑战了。
查看错误日志,看没有提示因为某个表的原因而导致启动不了,可以先把损坏的表的ibd文件先从数据目录mv走,再试着启动,在数据已经恢复后,我把当时错误的文件拿到本地,做了测试,把几个报错的ibd文件mv走后,数据库就可以正常启动了,但是mv走的这几个表数据会丢失。怎么把这个表的数据弄回来呢,曾想过用在线表空间传输,但是.cfg文件却没有,这种方法没有行通。后来用Percona Data Recovery Tool for InnoDB工具进行数据恢复,关于这个工具的介绍与操作,网上一大堆,我就不详细说明了。
㈤ 服务器死机,dcs失控如何处理
按照正常的处理,如果发生DCS操作界面全部死机,首先要联系热控仪表人员来现场。如果是比较容易处理的故障,比如通过重启DPU或者系统服务器或者重新下装,可以尽快恢复的,运行人员可通过后备盘监视重要参数,通过就地操作阀门,风门或者变频器等暂时稳定锅炉运行。待DCS系统恢复正常后可恢复锅炉正常运行。
如果是不能尽快恢复的故障,例如两个冗余的DPU都发生不可恢复的硬件故障,那么还是安排锅炉停运解列比较恰当。
㈥ 服务器宕机怎么解决远程
服务器宕机的话远程是没办法解决的,可以致电机房的运维部重启。重启后能重新启动就可以远程管理了。如果重启后还是不能远程连接,可以提供权限给运维人员现场登录系统查找故障原因。
㈦ 由于硬件故障造成宕机的原因有哪些该如何处理
—、服务器出现宕机的原因
1.运行环境出现问题,机房断电导致的服务器断电(欠压,过载,波动)、机房温度过高,散热不良、资源冲突、DirectX文件的损坏、系统不完善等等原因而造成服务器宕机。
⒉.服务器不堪负重,最常见的如磁盘空间耗尽、访问值过大、程序中毒、遭受攻击等大规模高消耗服务器资源情况。
3.由于主备数据不—致导致的复制问题。
4.性能问题,运维运行糟糕的SQL或Schema和索引设计等。
二、服务器宕机应该从哪些方面检查呢?
①硬件
(1)检查硬件是否有冲突;
(2)对比服务器电源所负载的功率判断电源是否出现故障;
(3)扫描硬盘表面检查是否有坏道;
(4)通过错误报告和操作系统的报错信息来判断;
(5)使用替换法判断主板、CPU、SCSI/RAID卡或其他PCI设备是否出现故障。
②软件
(1)检查操作系统的系统日志,可以通过系统日志来判断部分造成死机的原因;
(2)在判断硬件没有故障后,考虑系统软件的BUG和漏洞原因;
(3)如果是因为软件使用不当或系统工作压力过大,可以适当降低服务器的工作压力;
(4)电脑病毒。
以上就是有关服务器宕机的原因有哪些,应该从哪些方面检查的知识介绍。
在想解决处理办法之前要知道服务器宕机的两种形态:假死机和死机
假死机(非蓝屏死机)是由于硬件资源暂时性地被消耗殆尽,因而无法对外部指令进行响应的现象, 通常是网站处于访问高峰期,带宽等资源跑满,这时只需要等待一定的时间,待服务器腾出更多的硬件资源即可恢复正常。
而死机,如果通过ping测试服务器,键盘切换数字锁定键(NumLock)或大写锁定键(Caps Lock)功能, 显示器无画面输出,或者鼠标光标没有任何反应则表明服务器硬件故障。
再了解服务器出现宕机的常见原因 :
1.在运行环境的问题中,最普遍的问题时磁盘空间耗尽。
2.在性能问题中,最普通的服务器宕机原因确实是运行很糟糕的SQL, 但也不一定都是这个原因,比如也有很多问题是由于服务器Bug或错误的行为导致的。
3.糟糕的Schema和索引设计是第二大影响性能的问题。
4.复制问题通常由于主备数据不一致导致。
5.数据丢失问题通常由于drop table的错误操作导致,并总是便随着缺少可用备份的问题。
如何查看服务器宕机的原因:
a、是否是应用程序导致内存溢出或者泄露,out of memory导致
b、是否是进程过多或者不断创建,耗尽资源导致
c、是否是数据库程序死锁,连接数过多导致
d、是否是应用程序异常导致
e、是否是流量负载过大导致
f、 是否是遭受黑客入侵攻击导致
g、是否是误操作导致
服务器宕机自行解决办法:
1.要即时发现服务器宕机的问题。时间就是金钱,这是不变的真理。我们要第一时间, 发现宕机的问题,服务器宕机时,为了避免造成不必要的损失,要尽早通知IDC服务商解决相关问题。
2.最好准备2个服务器空间,他们存放的内容相同,而ip不同,并且机房的地理位置不同。这样2个区域的服务器, 能够做到有效异地容灾备份。发现宕机问题后,可以迅速的通过修改http://dnspod.com中的域名记录,指向目前正常的服务器。Dnspod解析生效的时间是实时的, 而一般的dns服务器,刷新时间较长,对外声称24小时内生效,按照实际经验看来,差不多30分钟内生效,否则就要检查域名绑定是否正确了。
1.什么是服务器宕机
可以简单的理解为死机.服务器是硬件设备.而且是全年二十四小时不间断运行的.通常负载量也较大.所以时间一长就容易出现宕机的情况.只要不是太频繁.就是完全正常的.一般常用服务器的人都知道.每隔一段时间定期手动重启下机器.对机器的性能有很大帮助.而且可以避免宕机的情况.毕竟服务器也是硬件.长期运行中间也应该有个喘气的过程.
2.服务器宕机的几种原因及解决办法
(1)客户端发出域名请求,形如xxx.com
这里可能出现的错误是,手工输入的域名网址错误。自然不能访问正确的网站了。这是最初级的错误,但还是容易发生的。要注意网址中,一些相近,或形似的字符,比如网址中 “1”与”l”,”0”与”o”,这些都是很容易混淆的字符。解决办法:认真审核一下网址,再次输入。或者网络一下,网址的核心关键字,或者品牌字,试一试。网络的结果,一般说来,还是比较准确的。
(2)通过dns服务器,将域名解析成对应的ip
这个步骤很关键,也是问题的高发期,40%的宕机,都是因为dns服务器不稳定造成的。Dns服务器,就像联系着姓名与电话号码的查询簿。这里如果出现问题,其后果是不堪设想的。因为一般的企业,和个人,多是选用网站空间建设网站,条件好一点的,也不过是租用或托管服务器。但是很少有人,拥有独立的dns服务器。80%的站长,都没有自已的dns服务器。大家的域名解析请求,一般通过域名商,提供的dns服务器完成。多对一,而这个服务的基数又是相当巨大的。当信息的洪流,集中到1-6台dns服务器上的时候,那么这几台dns服务器,就变的极不稳定了。
快速判定dns服务器故障的办法:
目前有一些网站,提供”IP反查”的功能。你需要找到一些,和你同ip的网站。可能因为更新有延时,有些域名的ip已经改变了。你需要再次ping一下选定的网址,确定该网站,和你的网站同属一个ip。把他们的网址记录下来。当你的网站不能打开的第一时间,你要登录同ip的网站看一看。如果,同ip下的其它网站,能打开,而唯独你的网站打不开。那就可以确定,是你网站的dns服务器,出现问题了。否则的话,那就要再进行下一步的故障排除。你也可以把,你的网站,和你同ip的网站,是否dns服务器故障,或是网站空间宕机故障了。
解决dns服务器不稳定的方法:
你可以选择一些专业的dns解析服务商,来解析你的域名。这些解析商,不但专业,而且也提供稳定而且免费的dns解析服务。在国内比较出名的dns解析商有:dnspod.com,dns.la,iidns.com等等…国外也有一些,不过推荐国内的服务。如果你的网站业务在国内,那么无论你的主机,还是dns服务器,都应该首选国内的机器。海外跨洋的线路,因为路途遥远,还有国家防火墙,等不可预知的因素较多,推荐国内的服务相对较稳定。在填写dns服务器列表的时候,也尽量将6个dns服务器,全部写上,比较稳妥。
(3)与ip对应的网站空间,或服务器做出响应
这个步骤,引起服务器宕机的概率在40%左右。这里故障的原因,就是服务器宕机了。一般站长,所指的宕机,也主要在这里。服务器当机的原因很多,流量过大,DDOS攻击,内部不稳定的程序,等等…
服务器宕机的判断方法:
同上一个步骤,如果同ip下的网站,都不能打开,那么基本上可以确定,是服务器宕机所致。
解决服务器宕机的方法:
a.要即时发现服务器宕机的问题。时间就是金钱,这是不变的真理。我们要第一时间,发现宕机的问题。如果他第一时间发现你的网站无法访问,他将立即发送Email通知站长。
b.最好准备2个网站空间,他们存放的内容相同,而ip不同,并且机房的地理位置不同。这样2个主机,同时宕机的可能性就大大降低了。第一时间发现宕机问题后,可以迅速的通过修改dnspod.com中的域名记录,指向目前正常的网站空间。Dnspod解析生效的时间是实时的,而一般的dns服务器,刷新时间较长,对外声称24小时内生效,按照实际经验看来,差不多30分钟内生效,否则就要检查域名绑定是否正确了。
c.可能仍有一些站长朋友,觉得域名解析有点复杂。想通了,其实很简单。别看他们的教程可能有一大段文字,其实就2个步骤:aa.在dns服务器上,将域名指向ip.bb.在网站空间上,将主机绑定域名(也是在这里,申请网站备案的!)。一个是,发送给谁?另一个是,接受谁的请求?是不是很简单呢?
(4)数据下载至本地网络,完成一次请求
这里出现问题的机率较小,不过也有可能。其表现的症状就是,在你的机器上不能访问你的网站。而在别人的电脑上,却是可以打开的。如果发生了这样的情况,那就可能是因为你所在地的网络不稳定,而造成的访问中断。这个故障,通常影响的区域较小。如果要确定,本地网络是否畅通,在打不开你的网站的时候,通过”在线代理”打开你的网站试一试。网络一下”在线代理”,有一些网站能提供,用其它的ip,或国外ip代理访问某个网站的服务。如果在线代理,能够打开你的网站,基本上可以确定,你所在的本地网络,出现了暂时的不稳定情况。
看了以上的介绍,大家也有了一定的了解了。电脑本身就是个负荷量大的东西,尤其是在使用较长一段时间之后,很容易出现各种各样的问题。但有些问题我们是可以从中找到原因的,并自己解决。相信服务器宕机的情况的很多人都经历过,稍微了解电脑的人看看以上的原因,就可以自己动手解决了,也不用再拿出去维修。
㈧ 服务器宕机怎么办服务器故障应急预案
昨日携程旅行网站打不开服务器故障,相信大家也看到携程科技大楼彻夜明灯加紧整修的壮观场景,那么对于服务器宕机怎么办?本文小编就来教一下大家服务器故障应急预案。
首先分清导致服务器出故障的因素:
1、外部攻击
2、内部攻击
3、运维误操作
服务器宕机怎么办?服务器故障应急预案
不管是外部攻击还是内部故障,备份好以及冗余措施,可以使宕机时间缩短到最低。
备份问题尽管听起来不可思议,但在实践中,不少企业并未建立起一套检验过的备份系统。备份的意义在于危急时刻可以快速恢复或重建生产系统。在企业网络中,经常出现的问题实际上是:
备份步骤的瑕疵导致并未完成正确的备份过程
由于有限的存储空间导致一定时间后因存储空间耗尽导致的随后备份失败
备份介质受损导致无法成功恢复
传统上,磁带因其低造价以及高存储密度使其成为了理想的备份介质。然而,这种传统备份介质的几个致命缺点经常使其内含的数据变得不可存取:
丢失的磁带索引卡片
磁带介质在存储过程中容易受到外界磁场影响
介质本身损坏
介质读取过程中被读取设备损坏
此外,磁带备份介质本身存储在磁带仓库中,从仓库检索所需的备份磁带、转移至数据中心并重新加载数据的时间消耗通常也是客观的。
即使有一套备份系统仍然是不能抵挡所有的意外事故的。2014 年, Samsung 数据中心的一场大火使其云服务暂停服务。如果没有异地备份,这场大火将使其本地备份的恢复变得极为困难。
冗余对于突发性事件来说,尽快恢复,或者是持续的提供服务是非常重要的。本月,某知名支付公司因数据中心网络连接性故障导致了一段时间的服务中断。如果有更好的冗余方案,此种事故的影响面将会得以降低,甚至会化解为用户不可感知的内部事故。
大部分服务器都有两部独立的 PSU,任意一部 PSU失效并不会影响其正常服务;一般来说,服务器的两部 PSU 将连接到两路不同的电路或不间断电源上以避免市电失效;数据中心电源多数同时配备 UPS 和柴油发电机来避免发电公司未通知的停止供电服务导致的服务中断。网络亦然;同时接入多路 ISP 线路,并对其进行独立布线,同时在多条线路上宣告地址,便可使得网络服务的鲁棒性更高。
在系统的视角上,只有同时配置好的备份以及冗余方案,才能提高可用性,避免非可控因素导致的长时间服务中断。
服务器宕机怎么办?服务器故障应急预案就为大家介绍到这里
㈨ 服务器突然宕机是什么原因
服务器突然宕机原因:
1、由操作员意向操作的重启——用于维护或更新服务器、部署机房或特殊情况等等。
2、非操作员本身意愿造成的重启——如供电(欠压,过载,波动)、震动、硬件质量(热稳定性(热敏度)和抗干扰能力)、资源冲突、DirectX文件的损坏、系统不完善或瓶颈问题、病毒、灰尘、散热不良??等等原因而造成重启。
3、由于用户访问量过大,造成资源耗尽,或者你网站的数据超出你的空间限制范围大小也会出现宕机。