1.空指针
一般来说,程序的起始地址是从“代码区”的0地址开始存放的(注:如果插入一个内存分布图,则更能说明问题,此处省略),但实际上现代操作系统并非如此,却保留了从0开始的一块内存。至于这块内存到底有有多大,与具体的操作系统有关。如果程序试图访问这块内存,则系统提示异常。
为什么操作系统不是保留一个字节呢?由于内存管理是按页来进行的,因此无法做到单独保留一个字节。尽管如此,但还是有极少数系统设定RAM区从0地址开始,但指向有效变量的指针不会指向0地址。即使“代码区”从0地址开始,但在任何情况下,0地址都不是C语言中任何函数的起始地址,因此指向有效函数地址的指针也不会指向0地址。
?课外知识延伸
虽然80C51微控制器XDATA区(外部RAM)是从0地址开始的,但只要对保存在0地址中的变量不进行取地址操作(&操作),即可有效地保证指针不会指向0地址。
与此同时,虽然32位ARM7微控制器也是从0地址开始的,但这块内存仅用于存放中断向量代码,而不是程序中的有效变量地址,因此即便用空指针来判断指针的有效性,其仍然是可行的。
基于此,于是将空指针定义为指向0地址的指针。毫无疑问,任何一种指针类型都有一个特殊的指针值,即空指针。它既不会指向任何对象或函数,也不是任何对象或函数的地址。而未初始化的指针,则完全可能指向任何地方。
由此可见,空指针与未初始化的指针是完全不同的两个概念。那么,将如何在程序中获得一个空指针呢?
2.空指针常量与NULL
标准C规定,在初始化、赋值或比较时,如果一边是变量或指针类型的表达式,则编译器可以确定另一边的常数0为空指针,并生成正确的空指针值。即在指针上下文中“值为0的整型常量表达式”在编译时转换为空指针。
为了让程序中的空指针使用更加明确,标准C专门定义了一个标准预处理宏NULL,其值为“空指针常量”,通常为0或(void *)0,即在指针上下文中NULL与0是等价的,而未加修饰的0也是完全可以接受的。由于void *指针的特殊赋值属性,比如:
#define NULL ((void *)0)
当NULL定义为((void *)0)时,即NULL是可以赋值给任何类型指针的值,它的类型为void*,而不是整数0,因此初始化“FILE *fp = NULL;”是完全合法的。
而为了区分整数0和空指针0,当需要其它类型的0的时候,即使可能工作,但也不能使用NULL,如果这样处理其格式是错误的,这在非指针上下文中是不能工作的。特别地,不能在需要ASCII空字符(NUL)的地方使用NULL。如果确实需要,则可以自定义为:
#define NUL
由此可见,常数0是一个空指针常量,而NULL仅仅是它的一个别名。
3.空指针的用途
一般来说,未初始化是不能使用的非法指针,因为它完全有可能指向任何地方,从而导致程序无法判断它为非法指针。因此,不管指针变量是全局的还是局部的、静态的还是非静态的,都应该在声明它的同时进行初始化,要么赋予一个有效的地址,要么赋予NULL。
标准C规定,全局指针变量的默认值为NULL,而对于局部指针变量则必须明确地指定其初值。因此,void通常用于指针变量的初始化,用来判断一个指针的有效性。比如:
unsigned char *pucBuf=(void *)0;//定义pucBuf为unsigned char类型指针并初始化为空指针
如果后续的代码忘记初始化指针而直接使用的话,则可能造成程序失败。虽然空指针也是非法指针,但可以通过程序判断并告诉程序员代码可能有问题。也就是说,如果一开始就将指针初始化为空指针,则可避免程序异常。比如:
if(pucBuf==0){
return error;//如果pucBuf为空指针,则返回参数错误
}
由于void类型指针的不确定性,因此它可以指向任意类型的数据,那么只要在使用时做一个简单的强制类型转换就可以了。比如:
unsignned char*pcData = NULL;//定义pcData为unsigned char类型指针
void*pvData;//定义pvData为void类型指针
pvData = pcData;//无需进行强制类型转换
pcData = (unsigned char*) pvData;//将pvData强制转换为unsigned char类型指针
显然不存在void类型的对象,也就是说,当对象为空类型时,其大小为0字节;当对象未确定类型时,那么它的大小也是未确定的,因此不能声明void类型变量。比如:
void a;//非法声明
既然上述声明是非法的,那么,也就不能将sizeof运算符用于void类型。也就意味着,编译器不知道所指对象的大小,由于指针的算术运算总是基于所指对象的大小的,因此不允许对void指针进行算术运算。
总之,在指针声明中,void *表示通用指针的类型。如果void作为函数的返