oracle数据库启动阶段分析

中岁颇好道,晚家南山陲。兴来美独往,胜事空自知。一些风景再好,终不属于自己;有些情感,路过交错,已然是最好的结局。

Oracle Server主要由两部分组成:Instance 和Database 。Instance 是指一组后台进程/线程和一块共享内存区域,而 Database是指存储在磁盘上的一组物理文件。本文由数据库 如何启动入手。

数据库的启动

首先来分析一下数据库的启动过程,Oracle 数据库的启动主要包含 3 个步骤:

(1)启动数据库到 nomount 状态;

(2)启动数据库到 mount 状态;

(3)启动数据库到 open 状态。

下面逐个来看看各个步骤的具体过程以其含义。

1. 启动数据库到nomount 状态

在启动的第一步骤,Oracle 首先寻找参数文件(pfile/spfile ),然后根据参数文件中 的设置,创建实例,分配内存,启动后台进程。

在这里可以看到,只要拥有了一个参数文件,就可以凭之启动实例(Instance), 这一步 骤并不需要任何控制文件或数据文件的参与。

在创建数据库时,如果在这一步骤就出现问题,那么通常可能是系统配置(内核参数等)存在问题,用户需要检查是否分配了足够的系统资源等。 来看一下启动到 nomount 状态的过程:

[oracle@dbtest dbs]$ cd $ORACLE_HOME/dbs
[oracle@dbtest dbs]$ ls
hc_orcl.dat init.ora initorcl.ora lkORCL orapworcl spfileorcl.ora
[oracle@dbtest dbs]$ sqlplus / as sysdba
SQL*Plus: Release 11.2.0.1.0 Production on Wed May 4 10:36:45 2016
Copyright (c) 1982, 2009, Oracle. All rights reserved.
Connected to an idle instance.
SQL> startup nomount;
ORACLE instance started.
Total System Global Area 1152450560 bytes
Fixed Size         2212696 bytes
Variable Size       922750120 bytes
Database Buffers     218103808 bytes
Redo Buffers        9383936 bytes
SQL>

注意这里,Oracle 根据参数文件的内容,创建了 instance ,分配了相应的内存区域,启 动了相应的后台进程。 此时观察警报日志文件(alert_<sid>.log ; show parameter dump查看路径),可以看到这一阶段的启动过程,读取参数 文件,应用参数启动实例,所有在参数文件中定义的非缺省参数都会记录在警报日志文件中:

Starting up:
Oracle Database 11g Enterprise Edition Release 11.2.0.1.0 - 64bit Production
With the Partitioning, OLAP, Data Mining and Real Application Testing options.
Using parameter settings in server-side spfile /u01/app/oracle/product/11.2.0/db_1/dbs/spfileorcl.ora
System parameters with non-default values:
 processes        = 150
 sga_target        = 176M
 memory_target      = 1104M
 memory_max_target    = 1104M
 control_files      = "/u01/app/oracle/oradata/orcl/control01.ctl"
 control_files      = "/u01/app/oracle/flash_recovery_area/orcl/control02.ctl"
 db_block_size      = 8192
 compatible        = "11.2.0.0.0"
 db_recovery_file_dest  = "/u01/app/oracle/flash_recovery_area"
 db_recovery_file_dest_size= 3882M
 undo_tablespace     = "UNDOTBS1"
 remote_login_passwordfile= "EXCLUSIVE"
 db_domain        = "oracle.com"
 global_names       = FALSE
 dispatchers       = "(PROTOCOL=TCP) (SERVICE=orclXDB)"
 shared_servers      = 5
 audit_file_dest     = "/u01/app/oracle/admin/orcl/adump"
 audit_trail       = "DB"
 db_name         = "orcl"
 open_cursors       = 300
 diagnostic_dest     = "/u01/app/oracle"

然后后台进程依次启动:

Wed May 04 10:36:55 2016
PMON started with pid=2, OS id=3128 
Wed May 04 10:36:55 2016
VKTM started with pid=3, OS id=3132 at elevated priority
VKTM running at (10)millisec precision with DBRM quantum (100)ms
Wed May 04 10:36:55 2016
GEN0 started with pid=4, OS id=3138 
Wed May 04 10:36:55 2016
DIAG started with pid=5, OS id=3142 
Wed May 04 10:36:55 2016
DBRM started with pid=6, OS id=3146 
Wed May 04 10:36:55 2016
PSP0 started with pid=7, OS id=3150 
Wed May 04 10:36:55 2016
DIA0 started with pid=8, OS id=3158 
Wed May 04 10:36:55 2016
MMAN started with pid=9, OS id=3162 
Wed May 04 10:36:55 2016
DBW0 started with pid=10, OS id=3166 
Wed May 04 10:36:55 2016
LGWR started with pid=11, OS id=3170 
Wed May 04 10:36:55 2016
CKPT started with pid=12, OS id=3175 
Wed May 04 10:36:55 2016
SMON started with pid=13, OS id=3179 
Wed May 04 10:36:55 2016
RECO started with pid=14, OS id=3184 
Wed May 04 10:36:55 2016
MMON started with pid=15, OS id=3189 
starting up 1 dispatcher(s) for network address '(ADDRESS=(PARTIAL=YES)(PROTOCOL=TCP))'...
Wed May 04 10:36:55 2016
MMNL started with pid=16, OS id=3193 
starting up 5 shared server(s) ...
ORACLE_BASE from environment = /u01/app/oracle

这里注意一下 Oracle选择参数文件的顺序:

Oracle 首选spfile<sid>.ora文件作为启动参数文件;如果该文件不 存在,Oracle选择spfile.ora 文件;如果前两者都不存在,Oracle将会选择 init<sid>.ora文件;如果以上 3 个文件都不存在,Oracle 将无法创建和启动 instance ,Oracle将无法启动。

用户可以在SQL*PLUS 中通过show parameter spfile 命令来检查数据库是否使用了 spfile文件,如果 value 不为Null,则数据库使用了 spfile文件:

SQL> show parameter spfile

NAME                 TYPE    VALUE
------------------------------------ ----------- ------------------------------
spfile                string   /u01/app/oracle/product/11.2.0
                         /db_1/dbs/spfileorcl.ora
SQL>

这时候也可以从操作系统查看启动了的后台进:

[root@dbtest trace]# ps -ef|grep ora_ 
oracle  3128   1 0 10:36 ?    00:00:00 ora_pmon_orcl
oracle  3132   1 0 10:36 ?    00:00:00 ora_vktm_orcl
oracle  3138   1 0 10:36 ?    00:00:00 ora_gen0_orcl
oracle  3142   1 0 10:36 ?    00:00:00 ora_diag_orcl
oracle  3146   1 0 10:36 ?    00:00:00 ora_dbrm_orcl
oracle  3150   1 0 10:36 ?    00:00:00 ora_psp0_orcl
oracle  3158   1 0 10:36 ?    00:00:00 ora_dia0_orcl
oracle  3162   1 0 10:36 ?    00:00:00 ora_mman_orcl
oracle  3166   1 0 10:36 ?    00:00:00 ora_dbw0_orcl
oracle  3170   1 0 10:36 ?    00:00:00 ora_lgwr_orcl
oracle  3175   1 0 10:36 ?    00:00:00 ora_ckpt_orcl
oracle  3179   1 0 10:36 ?    00:00:00 ora_smon_orcl
oracle  3184   1 0 10:36 ?    00:00:00 ora_reco_orcl
oracle  3189   1 0 10:36 ?    00:00:00 ora_mmon_orcl
oracle  3193   1 0 10:36 ?    00:00:00 ora_mmnl_orcl
oracle  3197   1 0 10:36 ?    00:00:00 ora_d000_orcl
oracle  3201   1 0 10:36 ?    00:00:00 ora_s000_orcl
oracle  3205   1 0 10:36 ?    00:00:00 ora_s001_orcl
oracle  3209   1 0 10:36 ?    00:00:00 ora_s002_orcl
oracle  3213   1 0 10:36 ?    00:00:00 ora_s003_orcl
oracle  3217   1 0 10:36 ?    00:00:00 ora_s004_orcl
root   3358 3253 0 10:50 pts/3  00:00:00 grep ora_

如果这3 个文件都不存在,Oracle 将无法启动:

[oracle@dbtest dbs]$ mv init.ora init.ora.bak
[oracle@dbtest dbs]$ mv initorcl.ora initorcl.ora.bak
[oracle@dbtest dbs]$ mv spfileorcl.ora spfileorcl.ora.bak
[oracle@dbtest dbs]$ ls
hc_orcl.dat init.ora.bak initorcl.ora.bak lkORCL orapworcl spfileorcl.ora.bak
[oracle@dbtest dbs]$ sqlplus / as sysdba
SQL*Plus: Release 11.2.0.1.0 Production on Wed May 4 10:55:42 2016
Copyright (c) 1982, 2009, Oracle. All rights reserved.
Connected to an idle instance.
SQL> startup nomount;
ORA-01078: failure in processing system parameters
LRM-00109: could not open parameter file '/u01/app/oracle/product/11.2.0/db_1/dbs/initorcl.ora'

在Oracle整个启动过程中,参数文件是写在应用程序中的硬代码,按照如上顺序进行查 找,不能改变Oracle的搜索路径及行为,但是如果参数文件不在相应的位置,在Linux/UNIX 系统上,可以通过符号链接来进行重定位。

在参数文件中,通常需要最少的参数是 db_name,设置了这个参数之后,数据库实例就可以启动,来看一个简单的测试:

SQL> ! echo "db_name=julia" > initorcl.ora
SQL> startup nomount;
ORACLE instance started.
Total System Global Area 217157632 bytes
Fixed Size         2211928 bytes
Variable Size       159387560 bytes
Database Buffers      50331648 bytes
Redo Buffers        5226496 bytes

这样,就通过了最少的参数需求启动了 Oracle实例。

2. 启动数据库到mount 状态

启动到nomount 状态以后,Oracle就可以从参数文件中获得控制文件的位置信息, 这一部分信息在参数文件中的记录类似如下所示(Oracle缺省会创建3 个控制文件,这 3 个控制文件的内容完全一致,是Oracle为了安全而采用的镜像手段,在生产环境中,通 常应该将3 个控制文件存放在不同的物理硬盘上,避免因为介质故障而同时损坏3 个控制 文件):

SQL> show parameter control_files

NAME                 TYPE    VALUE
------------------------------------ ----------- ------------------------------
control_files            string   /u01/app/oracle/product/11.2.0
                         /db_1/dbs/cntrlorcl.dbf

在nomount 状态,可以查询v$parameter视图,获得控制文件信息,这部分信息来自启 动的参数文件;当数据库 mount 之后,可以查询 v$controlfile视图获得关于控制文件的信 息,此时,这部分信息来自控制文件:

[oracle@dbtest dbs]$ mv init.ora.bak init.ora
[oracle@dbtest dbs]$ mv initorcl.ora.bak initorcl.ora
[oracle@dbtest dbs]$ mv spfileorcl.ora.bak spfileorcl.ora
[oracle@dbtest dbs]$ sqlplus / as sysdba

SQL*Plus: Release 11.2.0.1.0 Production on Wed May 4 11:07:07 2016
Copyright (c) 1982, 2009, Oracle. All rights reserved.
Connected to an idle instance.
SQL> startup nomount;
ORACLE instance started.
Total System Global Area 1152450560 bytes
Fixed Size         2212696 bytes
Variable Size       922750120 bytes
Database Buffers     218103808 bytes
Redo Buffers        9383936 bytes
SQL> alter database mount;  
Database altered.
SQL> select * from v$controlfile; 
STATUS
-------
NAME
--------------------------------------------------------------------------------
IS_ BLOCK_SIZE FILE_SIZE_BLKS
--- ---------- --------------
/u01/app/oracle/oradata/orcl/control01.ctl
NO    16384      594
/u01/app/oracle/flash_recovery_area/orcl/control02.ctl
NO    16384      594
STATUS
-------
NAME
--------------------------------------------------------------------------------
IS_ BLOCK_SIZE FILE_SIZE_BLKS
--- ---------- --------------

在mount 数据库的过程中,Oracle需要找到控制文件并锁定控制文件。如果控制文件全 部丢失此时就会报出如下错误:

SQL> alter database mount; 
alter database mount
*
ERROR at line 1:
ORA-00205: error in identifying control file, check alert log for more info

这时候alert.log 文件中通常会记录更为详细的信息。

因为Oracle的3 个(缺省的)控制文件内容完全相同,如果只是损失了其中 1~2 个, 可以复制完好的控制文件,更改为相应的名称,就可以启动数据库;如果丢失了所有的控制 文件,那么就需要恢复或重建控制文件来打开数据库。

在正常Mount 数据库的过程中,数据库的警报日志文件仅记录如下信息:

alter database mount
Wed May 04 11:07:44 2016
Successful mount of redo thread 1, with mount id 1438756220
Database mounted in Exclusive Mode
Lost write protection disabled
Completed: alter database mount

在这一步骤中,数据库需要计算Mount id 并将其记录在控制文件中,然后开始启动 Heartbeat(心跳),每3 秒更新一次控制文件。

启动到Mount 状态,数据库必须具备的另外一个重要文件是口令文件,该文件位于 $ORACLE_HOME/dbs 目录下,缺省的名称为 orapw 。 口令文件中存放 sysdba/sysoper 用户的用户名及口令:

[oracle@dbtest dbs]$ strings orapworcl 
]\[Z
ORACLE Remote Password file
INTERNAL
769C0CD849F9B8B2
5638228DAF52805F
[oracle@dbtest dbs]$

在数据库没有启动之前,数据库内建用户是无法通过数据库本身来验证身份的,通过口 令文件,Oracle 可以实现对用户的身份认证,在数据库未启动之前登录,进而启动数据库。 对于口令文件,Oracle 缺省查找 orapw 文件,如果该文件不存在,则继续查找orapw 文件,如果两者都不存在,则数据库将会出现错误。

如果口令文件丢失,通过 orapw 工具即可重建,所以在通常的备份策略中可以不必包含 口令文件:

[oracle@dbtest dbs]$ orapwd
Usage: orapwd file=<fname> entries=<users> force=<y/n> ignorecase=<y/n> nosysdba=<y/n>

 where
	file - name of password file (required),
	password - password for SYS will be prompted if not specified at command line,
	entries - maximum number of distinct DBA (optional),
	force - whether to overwrite existing file (optional),
	ignorecase - passwords are case-insensitive (optional),
	nosysdba - whether to shut out the SYSDBA logon (optional Database Vault only).
	
 There must be no spaces around the equal-to (=) character.
[oracle@dbtest dbs]$

通常在Linux/UNIX 平台下,在$ORACLE_HOME/dbs 目录下,还会存在另外一个文件,该文件命名规则为 lk<SID>,lk指lock ,该文件在数据库启动时创建,用于操作系统对数据库的锁定。当数据库启动时获得锁定,数据库关闭时释放。该文件内容通常只有一行,提示不要删除,该文件仅仅用于锁定.

3. 启动数据库open阶段

由于控制文件中记录了数据库中数据文件、日志文件的位置信息、检查点信息等重要信 息,所以在数据库的 open阶段,Oracle可以根据控制文件中记录的这些信息找到这些文件, 然后进行检查点及完整性检查。

如果不存在问题就可以启动数据库,如果存在不一致或文件丢失则需要进行恢复。

进一步地说,实际上在数据库 open的过程中,Oracle 进行的检查中包括以下两项:

第一次检查数据文件头中的检查点计数(Checkpoint cnt )是否和控制文件中的检查点 计数(Checkpoint cnt )一致。此步骤检查用以确认数据文件是来自同一版本,而不是从备 份中恢复而来(因为 Checkpoint Cnt 不会被冻结,会一直被修改)。 下面通过一个简单的测试来说明一下 Checkpoint Cnt的作用。

如果检查点计数检查通过,则数据库进行第二次检查。第二次检查数据文件头的开始SCN 和控制文件中记录的该文件的结束 SCN 是否一致,如果控制文件中记录的结束 SCN 等于数据 文件头的开始 SCN,则不需要对那个文件进行恢复。

总结

以上就是本文关于oracle 数据库启动阶段分析的全部内容,希望对大家有所帮助。感兴趣的朋友可以参阅:Oracle创建带有参数的视图代码介绍、 Oracle分页查询性能优化代码详解、 oracle 虚拟专用数据库详细介绍等,感谢大家对本站的支持。有什么问题可以随时留言,小编会竭尽所能给您想要的答案。

您可能有感兴趣的文章
Oracle缩表空间的完整如何解决实例

详解Oracle控制文件及日志文件的管理问题

oracle指定类型和指定位数创建序列号的代码详解

Oracle官方工具SQLDeveloper的简单如何使用

Oracle中锁(lock)的用法