oracle資料庫連接不上
⑴ oracle無法連接到資料庫實例
oracle
11g如果報告——enterprise
manager
無法連接到資料庫實例,蘆運則可以按照如下方法排除故障:
1、使用sql
plus.
在dos模式下運行sql
plus.
sql>
conn
請輸做嘩遲入用戶名:
sys
as
sysdba
輸入密碼:
連接成功
sql>desc
dba_users
注意:如果此時提示發現該視圖純李無效。用d:\oracle\proct\10.2.0\db_1\rdbms\adminsql.bsq
新建立user_astatus_map
,
dba_users
.
否則會顯示如下信息:
名稱
是否為空?
類型
-----------------------------------------
--------
----------------------------
username
not
null
varchar2(30)
user_id
not
null
number
password
varchar2(30)
account_status
not
null
varchar2(32)
lock_date
date
expiry_date
date
default_tablespace
not
null
varchar2(30)
temporary_tablespace
not
null
varchar2(30)
created
not
null
date
profile
not
null
varchar2(30)
initial_rsrc_consumer_group
varchar2(30)
external_name
varchar2(4000)
sql>
select
username,account_status
from
dba_users
where
username='sysman'
;
username
account_status
------------------------------
--------------------------------
sysman
locked
sql>alter
user
sysman
account
unlock;
用戶已更改。
此時系統就可以連接到資料庫了。
-
⑵ plsql連接ORacle資料庫時報:因目標主機或對象不存在,連接失敗怎樣解決
解決方法如下:
查看主機名,linux看/etc/hosts里有沒有配置該主機與IP的對應關系,如果是IP地址,如果連接本機127.0.0.1試試看網路通不通;
看看防火碰者牆配笑肢薯置,是不是防火牆打開了,屏幕下方目標主機的埠,如果主機IP能通,而埠不通,可能是你自己主機上防火牆阻止了,也有可能目標主機限制了你IP域在埠的網路連接。
⑶ oracle資料庫無法連接資料庫
這是因為Oracle的服務沒有開啟,選擇啟動即可,詳細步驟:
操作設備:戴爾筆記本電腦
操作系統:win10
操作程序:計算機v2.01
1、首先右擊桌面上的計算機圖標,點擊管理。
⑷ Oracle資料庫連接是報如圖的錯誤,怎麼解決
這個是監聽沒有配置升手或者沒有啟動報錯
1.IP錯誤。 在設置URL時錯誤,例如:jdbc:oracle:thin:@192.168.0.36:1521:sharp 資料庫伺服器不正確:ping 伺服器IP是否正確。不正確,將URL更改為正確 埠號錯誤:一般不會錯誤。 進行一下操作:慎隱在DOS上鍵入sqlplus,檢查oracle是否開啟 一卻正常,執行下面第2步。
2.防火牆 如果機器上安裝有放火牆,可能是伺服器埠號屏蔽而造成的。關閉防火牆後,嘗試重新連接。 仍然不行,執行第3步。
3.資料庫監聽未啟動 修改PC上注冊表中的ImagePath值。 我下面以現在主流的資料庫ORACLE為例 重吵孝嫌新手動啟動資料庫監聽: 1:開始 → 運行→ 輸入CMD→ 進入DOS命令提示界面 d:>lsnrctl LSNRCTL> status 或者 LSNRCTL> start
⑸ oracle資料庫連接超時的原因
可能有很多種原因,建議具體情況具體分析芹橋。
可以排查下:
1、目標資料庫是否開啟了服務。
2、目標資料庫是否開啟了監聽。
3、目標伺服器是否有防火牆或是網路策略限制不允許訪問。
4、檢查下訪問的配置是否正確,如IP、埠號、用戶信高首扮息等等。
5、訪問賬號的連接戚灶數是否過多等等。
⑹ bde連oracle報錯,連不上資料庫,求大神指點
看來你是下載的源程序。沒有下載資料庫。找到顫扮代碼中連接資料庫的資料庫組件。將其中的盯鉛GZGL的資料庫連接刪除。
這是因茄則灶為源程序中連接了GZGL名稱的資料庫。而你的電腦中沒有設置這個資料庫別名造成的。和BDE重新安裝沒有關系。而是BDE中沒有設置這個別名的資料庫。
⑺ plsql無法連接oracle
1、首先我們打開PLSQL,點取消進去進入資料庫。
⑻ 如何連接oracle資料庫
如何配置才能使客戶端連到資料庫:x0dx0ax0dx0a要使一個客戶端機器能連接oracle資料庫,需要在客戶端機器上安裝oracle的客戶端軟體,唯一的例外就是java連接資料庫的時候,可以用 x0dx0ajdbc x0dx0athin模式,不用裝oracle的客戶端軟體。加入你在機器上裝了oracle資料庫,就不需要在單獨在該機器上安裝oracle客戶端了,因為裝 x0dx0aoracle資料庫的時候會自動安裝oracle客戶端。x0dx0a 用過sql x0dx0aserver資料庫然後又用oracle的新手可能會有這樣的疑問:問什麼我用sql server的時候不用裝sql x0dx0aserver的客戶端呢?原因很簡單,sql server也是microsoft的,它在操作系統中集成了sql x0dx0aserver客戶端,如果microsoft與oracle有協議,將oracle客戶端也集成到操作系統中,那我們也就不用在客戶端機器裝oraclex0dx0a 客戶端軟機就可訪問資料庫了,不過,這好像是不可能實現的事情。x0dx0a 也有的人會問:為什麼在sql x0dx0aserver中沒有偵聽埠一說,而在oracle中要配置偵聽埠?其實sql x0dx0aserver中也有偵聽埠,只不過microsoft將偵聽埠固定為1433,不允許你隨便改動,這樣給你一個錯覺感覺sql x0dx0aserver中沒有偵聽埠,咳,microsoft把太多的東西都封裝到黑盒子里,方便使用的同時也帶來的需要副作用。而oracle中的偵聽埠直接x0dx0a 在配置文件中,允許隨便改動,只不過無論怎樣改動,要與oracle伺服器端設置的偵聽埠一致。x0dx0a好,言歸正傳,我們如何做才能使客戶端機器連接到oracle資料庫呢?x0dx0aA. 安裝相關軟體x0dx0aB. 進行適當的配置x0dx0ax0dx0aA.在適當的位置安裝適當的軟體:x0dx0a在客戶端機器:x0dx0a1.在客戶端機器上安裝ORACLE的Oracle Net通訊軟體,它包含在oracle的客戶端軟體中。x0dx0a2.正確配置了sqlnet.ora文件:x0dx0aNAMES.DIRECTORY_PATH = (TNSNAMES, ?.)x0dx0aNAMES.DEFAULT_DOMAIN=DB_DOMAINx0dx0a一般情況下我們不用NAMES.DEFAULT_DOMAIN參數。如果想不用該參數用#注釋掉或將該參數刪除即可,對於NAMES.DIRECTORY_PATH參數採用預設值即可,對於NAMES.DEFAULT_DOMAIN參數有時需要注釋掉,在下面有詳細解釋。x0dx0a3.正確配置了tnsname.ora文件x0dx0ax0dx0a在伺服器端機器:x0dx0a1.保證listener已經啟動x0dx0a2.保證資料庫已經啟動。x0dx0a如果資料庫沒有啟動,用:x0dx0aOracle 9i:x0dx0ados>sqlplus 「/ as sysdba」x0dx0asqlplus> startupx0dx0aOracle 8i:x0dx0ados>svrmgrlx0dx0asvrmgrl>connect internalx0dx0asvrmgrl>startupx0dx0a命令啟動資料庫x0dx0a如果listener沒有啟動,用:x0dx0alsnrctl start [listener name]x0dx0alsnrctl status [listener name]x0dx0a命令啟動listenerx0dx0aB.進行適當的配置x0dx0a如何正確配置tnsname.ora文件:x0dx0ax0dx0a可x0dx0a 以在客戶端機器上使用oracle Net Configuration Assistant或oracle Net x0dx0aManager圖形配置工具對客戶端進行配置,該配置工具實際上修改tnsnames.ora文件。所以我們可以直接修改tnsnames.ora文件,x0dx0a 下面以直接修改tnsnames.ora文件為例:x0dx0a該文件的位置為: ?\network\admin\tnsnames.ora (for windows)x0dx0a?/network/admin/tnsnames.ora (for unix)x0dx0a此處,假設伺服器名為testserver,服務名為orcl.testserver.com,使用的偵聽埠為1521,則tnsnams.ora文件中的一個test網路服務名(資料庫別名)為:x0dx0atest =x0dx0a(DESCRIPTION=x0dx0a(ADDRESS_LIST=x0dx0a(ADDRESS=(PROTOCOL=TCP)(HOST=testserver)(PORT=1521))x0dx0a)x0dx0a(CONNECT_DATA=(SERVICE_NAME=orcl.testserver.com)x0dx0a)x0dx0a)x0dx0a此處的笑臉為)。x0dx0a 紅色的內容為需要根據實際情況修改的內容,現解釋如下:x0dx0a PROTOCOL:客戶端與伺服器端通訊的協議,一般為TCP,該內容一般不用改。x0dx0ax0dx0aHOST:資料庫偵聽所在的機器的機器名或IP地址,資料庫偵聽一般與資料庫在同一個機器上,所以當我說資料庫偵聽所在的機器一般也是指資料庫所在的機 x0dx0a x0dx0a器。在UNIX或WINDOWS下,可以通過在資料庫偵聽所在的機器的命令提示符下使用hostname命令得到機器名,或通過ipconfig(forx0dx0a WINDOWS) or ifconfig(for x0dx0aUNIX)命令得到IP地址。需要注意的是,不管用機器名或IP地址,在客戶端一定要用ping命令ping通資料庫偵聽所在的機器的機器名,否則需要在x0dx0a hosts文件中加入資料庫偵聽所在的機器的機器名的解析。x0dx0ax0dx0aPORT:資料庫偵聽正在偵聽的埠,可以察看伺服器端的listener.ora文件或在資料庫偵聽所在的機器的命令提示符下通過lnsrctl status [listener name]命令察看。此處Port的值一定要與資料庫偵聽正在偵聽的埠一樣。x0dx0a SERVICE_NAME:在伺服器端,用system用戶登陸後,sqlplus> show parameter service_name命令察看。x0dx0a 如何利用配置的網路服務名連接到資料庫:x0dx0a 用sqlplus程序通過test網路服務名進行測試,如sqlplus system/manager@test。x0dx0a 如果不能連接到資料庫,則在tnsname.ora文件中的test網路服務名(net x0dx0aservice)後面加上sqlnet.ora文件中NAMES.DEFAULT_DOMAIN參數的值,此處我的參數值為 x0dx0atestserver.com,將其加到網路服務名後面,修改後的tnsname.ora中關於該網路服務名的內容為:x0dx0ax0dx0a 什麼情況下會引起oracle自動設置NAMES.DEFAULT_DOMAIN參數?x0dx0a x0dx0a 出現這種情況的典型環境為windows的客戶端的『我得電腦à屬性à計算機名à更改à其它?à此計算機的主DNS後綴』中設置了『primary x0dx0a dns x0dx0asuffix』,因為在這種情況下安裝客戶端時,會在sqlnet.ora文件中自動設置NAMES.DEFAULT_DOMAIN參數,或許當把計算機x0dx0a 加入域中安裝oracle客戶端時也會出現這種情況,有條件的話大家可以試一下。x0dx0ax0dx0a我在設置oracle的客戶端時一般手工修改tnsnames.ora文件,但是還有許多人喜歡用圖形工具配置,該圖形工具最終還是修改tnsnames.ora文件,但是它有時會引起其它的問題:x0dx0ax0dx0a在用oracle的圖形配置軟體'net assistant'或『Net Configuration x0dx0aAssistant』配置網路服務名時,假如已經設置了『primary dns x0dx0asuffix』,但是在圖形配置軟體中寫的網路服務名的名字中沒有『primary dns x0dx0asuffix』,如只是寫了test,則圖形配置軟體會自動在後面加上『primary dns x0dx0asuffix』,使之變為test.testserver.com,並存在tnsnames.ora中,而不管你的sqlnet.ora文件中是否有 x0dx0aNAMES.DEFAULT_DOMAIN參數。此時,用圖形工具進行測試連接是通過的,但是假如此時sqlnet.ora文件中沒有 x0dx0aNAMES.DEFAULT_DOMAIN參數,則你在使用網路服務名時應該使用在tnsnames.ora中的 x0dx0atest.testserver.com,而不是你在圖形配置軟體中鍵入的test。解決的辦法為:x0dx0a<1>可以在sqlnet.ora文件中設置NAMES.DEFAULT_DOMAIN= testserver.com,這時你可以用test或test.testserver.com連接資料庫x0dx0a<2>在sqlnet.ora文件中不設置NAMES.DEFAULT_DOMAIN參數,在tnsnames.ora文件中將test.testserver.com中的.testserver.com去掉,這時你可以用test連接資料庫。x0dx0ax0dx0a關於為什們在網路服務名後面加db_domain參數,需要了解sql*plus連接資料庫的原理,我在後面解決12154常見故障中給出了詳細的說明。x0dx0ax0dx0a如果上面的招數還不奏效的話,只好用一下乾坤大挪移了。x0dx0a將客戶端的網路服務名部分x0dx0atest.testserver.com =x0dx0a(DESCRIPTION=x0dx0a(ADDRESS_LIST=(ADDRESS=(PROTOCOL=TCP)(HOST=testserver)(PORT=1521))x0dx0a)x0dx0a(CONNECT_DATA=(SERVICE_NAME=orcl.testserver.com)x0dx0a)x0dx0a)x0dx0a此處的笑臉為)。x0dx0a拷貝到伺服器的tnsnames.ora文件中。然後再伺服器端用sqlplus system/[email protected]連接到資料庫。x0dx0a 如果能連接成功,說明你的客戶端與伺服器端的網路有問題。x0dx0a 如果連接不成功,用前面的部分檢查網路服務名部分部分是否正確,如果確信網路服務名部分正確而且所有的客戶端都連不上資料庫則可能為系統TCP/IP或Oracle系統有問題,建議重新安裝資料庫。x0dx0a該錯誤表示用於連接的網路服務名在tnsnames.ora文件中不存在,如上面的tnsnames.ora中的網路服務名只有test,假如用戶在連接時用sqlplus system/manager@test1則就會給出TNS-12154錯誤。x0dx0a要注意的是,有時即使在tnsnames.ora文件中有相應的網路服務名,可是用該網路服務名連接時還會出錯,出現這種情況的典型配置如下(在客戶端的機器上):x0dx0asqlnet.ora文件:x0dx0aNAMES.DIRECTORY_PATH = (TNSNAMES, ?.)x0dx0aNAMES.DEFAULT_DOMAIN = server.comx0dx0atnsnames.ora文件:x0dx0atest =x0dx0a(DESCRIPTION=x0dx0a(ADDRESS_LIST=(ADDRESS=(PROTOCOL=TCP)(HOST=testserver)(PORT=1521))x0dx0a)x0dx0a(CONNECT_DATA=(SERVICE_NAME=orcl.testserver.com)x0dx0a)x0dx0a)x0dx0a此處的笑臉為)。x0dx0asql*plus運行基本機理:x0dx0a 在用戶輸入sqlplus system/manager@test後,sqlplus程序會自動到sqlnet.ora文件中找NAMES.DEFAULT_DOMAIN參數,假 如該參數存在,則將該參數中的值取出,加到網路服務名的後面, x0dx0ax0dx0a即此例中你的輸入由sqlplus system/manager@test自動變為sqlplus system/[email protected] x0dx0a,然後再到tnsnames.ora文件中找test.server.com網路服務名,這當然找不到了,因為該文件中只有test網路服務名,所以報 x0dx0a 錯。解決的辦法就是將sqlnet.ora文件中的NAMES.DEFAULT_DOMAIN參數注釋掉即可,如 x0dx0a#NAMES.DEFAULT_DOMAIN = x0dx0aserver.com。假如NAMES.DEFAULT_DOMAIN參數不存在,則sqlplus程序會直接到tnsnames.ora文件中找 x0dx0atest網路服務名,然後取出其中的host,port,tcp,service_name,利用這些信息將連接請求發送到正確的資料庫伺服器上。x0dx0a 另外原則上tnsnames.ora中的配置不區分大小寫,但是我的確遇到區分大小寫的情況,所以最好將使用的網路服務與tnsnames.ora中配置的完全一樣。x0dx0aORA-12514: TNS:listener could not resolve SERVICE_NAME given in connect Descriptor.x0dx0a該錯誤表示能在tnsnames.ora中找到網路服務名,但是在tnsnames.ora中指定的SERVICE_NAME與伺服器端的SERVICE_NAME不一致。解決的辦法是修改tnsnames.ora中的SERVICE_NAME。x0dx0ax0dx0a 易混淆術語介紹:x0dx0a x0dx0a Db_name:對一個資料庫(Oracle database)的唯一標識,該資料庫為第一章講到的Oracle x0dx0adatabase。這種表示對於單個資料庫是足夠的,但是隨著由多個資料庫構成的分布式資料庫的普及,這種命令資料庫的方法給資料庫的管理造成一定的負 x0dx0a 擔,因為各個資料庫的名字可能一樣,造成管理上的混亂。為了解決這種情況,引入了Db_domain參數,這樣在資料庫的標識是由Db_name和 x0dx0aDb_domain兩個參數共同決定的,避免了因為資料庫重名而造成管理上的混亂。這類似於互連網上的機器名的管理。我們將Db_name和 x0dx0aDb_domain兩個參數用』.』連接起來,表示一個資料庫,並將該資料庫的名稱稱為Global_name,即它擴展了Db_name。 x0dx0aDb_name參數只能由字母、數字、』_』、』#』、』$』組成,而且最多8個字元。x0dx0ax0dx0a Db_domain:定義一個資料庫所在的域,該域的命名同互聯網的』域』沒有任何關系,只是資料庫管理員為了更好的管理分布式資料庫而根據實際情況決定的。當然為了管理方便,可以將其等於互聯網的域。x0dx0ax0dx0aGlobal_name:對一個資料庫(Oracle x0dx0adatabase)的唯一標識,oracle建議用此種方法命令資料庫。該值是在創建資料庫是決定的,預設值為Db_name. x0dx0aDb_domain。在以後對參數文件中Db_name與Db_domain參數的任何修改不影響Global_name的值,如果要修改 x0dx0aGlobal_name,只能用ALTER DATABASE RENAME GLOBAL_NAME TO x0dx0a
⑼ oracle資料庫連接不上
sqlplus "/ as sysdba" 連不上,報ora-01031:insufficient privileges解決方法
注意多個資料庫實例時候,setORACLE_SID='',
1、檢查sqlnet.ora(WINDOWS下位於%ORACLE_HOME%NETWORKADMIN目錄)是否包含這句:SQLNET.AUTHENTICATION_SERVICES=(NTS),沒有的話加上
2、檢查登陸windows的用戶(administrator或安裝oracle時候使用的用戶)是不是在包含在ORA_DBA組中,域用戶沒有連上域伺服器時就可能出現這種現象。
3. 要保證 remote_login_passwordfile 參數 = EXCLUSIVE .
4. 看看是否需要使用orapassw生成口令文件 .
一種解決方法案例:
1、檢查系統參數:SQL> show parameter password
NAME TYPE VALUE------------------------------------ ----------- ------------------------------
remote_login_passwordfile string EXCLUSIVE
2、
select * from v$pwfile_users;
SQL>
為空
3、SQL> grant sysdba to sys;
grant sysdba to sys
*
ERROR at line 1:
ORA-01994: GRANT failed: password file missing or disabled
4、建立password文件
D:/>orapwd file="D:/oracle/proct/10g/db_1/database/PWDoratest.ora" password=gp
oswong entries=10
5、
SQL> select * from v$pwfile_users;
USERNAME SYSDB SYSOP------------------------------ ----- -----
SYS TRUE TRUE
SYS正常顯示出來。
6、重新在遠程以SYSDBA登錄,可正常使用。
如果口令文件創建的有問題,也是會報如下的錯誤:
ora-01031:insufficient privileges
口令文件的命名格式應為orapwsid,並且sid是區分大小寫的。由於Target Database連接Auxiliary Database時需要驗證口令,如果違反了以上規則,將會提示ORA-01031: insufficient privileges。
我在用linux創建plicate資料庫的時候 就是因為口令文件創建的路徑和名稱不對才遇到這個錯誤
-----end-------
⑽ Oracle資料庫無響應故障處理方式
Oracle資料庫無響應故障處理方式
Oracle資料庫無響應故障,簡單地講就是資料庫實例不能響應客戶端發起的請求,客戶端提交一個SQL後,就一直處於等待資料庫實例返回結果的狀態。更嚴重的現象是客戶端根本不能連接到資料庫,發起一個連接請求後,一直處於等待狀態。Oracle資料庫無響應故障怎麼處理呢?下面跟我一起來學習Oracle資料庫無響應故障的處理方法吧!
無響應的故障現象一般有以下幾種:
1.Oracle的進程在等待某個資源或事件
這種現象一般可以從V$SESSION_WAT、V$LATCH、V$LATCHHOLDER等動態視圖中檢查進程正在等待的資源或事件,而被等待的資源或事件,一直都不能被獲取,甚至是很長時間都不可獲得。如果這個正在等待的進程持有了其他的資源,則會引起其他的進程等待,這樣就很可能引起實例中大范圍的會話發生等待。由於進程在等待資源或事件時,通常都處於SLEEP狀態,消耗的CPU資源非常少(在等待latch時要稍微多消耗一些CPU資源),所以從OS來看,CPU的消耗並不高,甚至是非常低。
這種因為等待而引起的個別進程Hang,相對比較容易處理。
2. OracleProcess Spins
所謂Spin,就是指Oracle進程中的代碼在執行某個過程時,陷入了循環。在V$SESSION視圖中,往往可以看到Hang住的會話,一直處於“ACTIVE”狀態。對於這樣的會話,用“alter system kill session ‘sid,serial#’”命令也不能完全斷開會話,會話只能被標記為“killed”,會話會繼續消耗大量的CPU。進程Spins由於是在做循環,CPU的消耗非常大,從OS上明顯可以看到這樣的進程,通常會消耗整個CPU的資源。
而對於這樣的Hang住的會話,處理起來相對比較復雜,並且為了從根本上解決問題,需要超過DBA日常維護所需要的技能。
從故障范圍來看,無響應故障可以分為以下幾種情況:
1. 單個或部分會話(進程)Hang住
這種情況屬於小范圍的故障,業務影響相對較小,一般來說只會影響業務系統的個別模塊。在一個多應用系統的資料庫上面,如果Hang住的會話比較多,則影響的可能是其中的一個應用系統。這里有一個例外,如果Hang住的進程是系統後台進程,如pmon、smon等,則影響的范圍就非常大了,最終甚至會影響整個資料庫及所有應用系統。還有值得注意的是,即使是少部分會話Hang住,也要及時處理,否則極有可能會擴散到整個系統。
2. 單個資料庫實例Hang住
這種情況造成的影響非常大。在這個實例上的所有應用系統均受到嚴重影響,並且在找到根源並最終解決問題之前,資料庫實例往往須要重啟。
3. OPS或RAC中的多個實例或所有實例都Hang住
在這種情況下,即使是OPS或RAC,都已經沒辦法提供高可用特性了。使用這個資料庫的所有應用系統將不能繼續提供服務,這種情況往往須要重啟。
無響應故障成因分析
Oracle資料庫無響應,一般主要由以下幾種原因引起:
1. 資料庫主機負載過高,嚴重超過主機承受能力
比如應用設計不當,資料庫性能低下,活動會話數的大量增加,導致資料庫主機的負載迅速增加,資料庫不能正常操作,並最終Hang住;主機物理內存嚴重不足,引起大量的換頁,特別是在SGA中的內存被大量換出到虛擬內存時,資料庫實例往往就會Hang住。
2. 日常維護不當、不正確的操作引起資料庫Hang住
比如歸檔日誌的存儲空間滿,導致資料庫不能歸檔,引起資料庫Hang住;在一個大並發的繁忙的系
統上,對DML操作比較多的大表進行move、增加外鍵約束等操作也可能使系統在短時間內負載大幅升高,並引起資料庫系統Hang住;不正確的資源計劃(Resource Plan)配置,使進程得不到足夠的CPU等。
3. Oracle資料庫的Bug
幾乎每個版本都存在著會導致資料庫系統Hang住的Bug,這些Bug會在一些特定的條件下觸發,特別是在RAC資料庫中,引起資料庫Hang住的Bug比較多。
4. 其他方面的一些原因
比如在RAC資料庫中,如果一個節點退出或加入到RAC的過程中,當進行Resource Reconfiguration時,會使系統凍結一段時間,也有可能使系統Hang住。
以上所描述的幾種常見的會導致Oracle資料庫實例Hang住的原因中,大部分的情況是可以避免的,只要維護得當,一般不會出現這種故障。對於Oracle資料庫Bug所導致的資料庫無響應故障,由於是在特定的情況下才會觸發,所以如果能夠盡量對資料庫打上最新版本的補丁,並且熟悉當前版本中會導致系統Hang住的Bug以及觸發條件,就能夠最大限度地避免這種故障的發生,提高系統的可用性。
那麼,在資料庫Hang住的情況下,如何去分析並發現導致問題的根源?一方面,由於系統Hang住會導致業務系統不可用,為了能夠盡快地恢復業務,須快速地判斷問題所在,然後Kill掉引起故障的會話和進程,或者資料庫實例不得不重啟以迅速恢復業務;但另一方面,如果只是重啟資料庫或Kill會話和進程來解決問題,在很多情況下是治標不治本的辦法,在以後故障隨時可能會出現。如何在二者之間進行抉擇呢?對於資料庫Hang故障的處理,首先是盡可能地收集到系統Hang住時的狀態數據,然後盡快地恢復業務,恢復業務後分析收集到的數據,找到資料庫系統Hang住的真正原因,然後再進行相應的處理。下一節將詳細描述資料庫系統Hang住後的處理流程。
無響應故障處理流程
對於Oracle無響應故障的處理,我們可以按下圖所示的流程進行。
值得注意的是,上圖並不是一個完整的Oracle資料庫故障處理流程圖,只是處理Oralce資料庫無響應這一類特定的故障的流程,只列出了針對這一特定類型故障處理時的關鍵處理點。不過既然是故障,所以這類故障的處理流程與其他故障的處理流程,有著非常相似的地方。
下面是整個流程的詳細說明:
1. 在出現資料庫無響應故障後,首先確認系統的影響范圍,如上節所描述的',是部分業務系統或模塊還是所有的業務系統都受影響,是不是整個實例或多個實例都無響應。同時應詢問系統維護和開發人員,受影響的系統在出現故障前是否有過變動,包括主機硬體、操作系統、網路、資料庫以及應用等。有時一個細小的變動就可能導致出現資料庫Hang住這樣嚴重的故障。曾經遇到一個庫,應用只是修改了一個SELECT語句就導致了資料庫Hang住。
2. 為了避免由於網路、資料庫監聽或客戶端因素影響分析,建議都登錄到主機上進行操作。
3. 如果主機不能登錄(為了避免干擾流程主線,這里不討論如網路問題這樣也會導致不能連接的故障),嘗試關閉出現問題的業務系統,甚至是所有的業務系統。如果關閉了所有的業務系統之後,仍然不能連接,則只有考慮重新啟動資料庫主機。在資料庫主機重新啟動後,使用操作系統工具或OSW等長期監控操作系統的資源使用,同時監控Oracle資料庫的性能和等待等。
4. 登錄上主機後,先用top、topas等命令簡單觀察一下系統。看看系統的CPU使用、物理內存和虛擬內存的使用、IO使用等情況。
5. 使用SQLPLUS連接資料庫,如果不能連接,則只能從操作系統上觀察系統中是否有異常的現象,比如佔用CPU過高的進程。使用gdb、dbx等debugger工具對資料庫進行system state mp;使用strace、truss等工具檢查異常進程的系統調用;使用pstack、procstack等工具察看異常進程的call stack等。
6. 使用SQLPLUS連接上資料庫後,進行hanganalyze、system state mp等操作;或檢查等待事件、異常會話等正在執行的SQL等待。
7. 找到故障產生的原因,如果暫時找不到原因,盡量收集數據。
8.確良如果應用急須恢復,可通過Kill會話、重啟資料庫實例等方式,先恢復應用。
9. 根據最終診斷結果,對資料庫升級打補丁,或者修改應用等方式從根本上解決問題。
怎樣避免資料庫出現無響應故障
作為Oracle資料庫DBA,除了處理故障之外,更重要的是如何預防故障的發生。根據前面對資料庫無響應故障的成因分析,在日常的維護工作中,須做到以下幾點:
1. 進行正確的維護操作
很多的資料庫無響應故障都是由於不正確的維護操作引起的。應避免在業務高峰期做大的維護操作,比如像move、加主外鍵約束等會長時間鎖表的操作。如果的確需要,盡量使用正確的操作方法。比如用ONLINE方式重建索引;建主鍵、唯一鍵約束時先建索引,然後在建約束時指定新建的索引,等等。也就是保證系統的並發性、可伸縮性,避免系統串列操作的出現。
2. 優化應用設計,優化資料庫性能
為避免性能問題導致在業務高峰期資料庫不能及時有效處理來自業務的請求,甚至於完全Hang住。對於資料庫中存在串列訪問的部分進行優化,比如latch、enqueue,還包括不合理的sequence設計等。特別是在RAC資料庫中,嚴重串列訪問等待往往更容易引起嚴重的性能問題。優化應用設計,使資料庫具有更好的可伸縮性和並行處理能力,能夠有效地避免性能問題引起的資料庫Hang住。
3. 利用監控系統隨時監控系統負載
遇到系統負載過高,內存不足,OS中虛擬內存換頁很頻繁等情況時,及時採取措施;監控Oracle資料庫的核心進程,如pmon、smon等,看是否有異常,如過高的CPU消耗。出現異常應立即處理;監控歸檔空間和日誌切換;監控資料庫中的等待事件,比如是否有大量的enqueue、log file switch (archiving needed)、resmgr:become active等待事件等。
4. 為資料庫打上補丁
很多的無響應故障是由於Oracle的Bug引起的,資料庫DBA應關注當前版本中有哪些Bug會導致資料庫Hang住,盡量為資料庫打上解決這些Bug的補丁。
;