int a[3];
int i=0;
for(i=0;i<4;i++)
{
a[i] = i;
}
for(i=0;i<4;i++)
{
printf("a[%d]=%d\n",i,a[i]);
}
很显然,在上面的示例程序中,访问 a[3] 是非法的,将会发生越界错误。因此,我们应该将上面的代码修改成如下形式:
int a[3];
int i=0;
for(i=0;i<3;i++)
{
a[i] = i;
}
for(i=0;i<3;i++)
{
printf("a[%d]=%d\n",i,a[i]);
}
int i;
int *p;
int a[5];
/*数组a的头指针赋值给指针p*/
p=a;
for(i=0;i<10;i++)
{
/*指针p指向的变量*/
*p=i+10;
/*指针p下一个变量*/
p++;
}
在上面的示例代码中,for 循环会使指针 p 向后移动 10 次,并且每次向指针指向的单元赋值。但是,这里数组 a 的下标取值范围是 [0,4](即 a[0]、a[1]、a[2]、a[3] 与 a[4])。因此,后 5 次的操作会对未知的内存区域赋值,而这种向内存未知区域赋值的操作会使系统发生错误。正确的操作应该是指针移动的次数与数组中的变量个数相同,如下面的代码所示:
int i;
int *p;
int a[5];
/*数组a的头指针赋值给指针p*/
p=a;
for(i=0;i<5;i++)
{
/*指针p指向的变量*/
*p=i+10;
/*指针p下一个变量*/
p++;
}
为了加深大家对数组越界的了解,下面通过一段完整的数组越界示例来演示编程中数组越界将会导致哪些问题。
#define PASSWORD "123456"
int Test(char *str)
{
int flag;
char buffer[7];
flag=strcmp(str,PASSWORD);
strcpy(buffer,str);
return flag;
}
int main(void)
{
int flag=0;
char str[1024];
while(1)
{
printf("请输入密码: ");
scanf("%s",str);
flag = Test(str);
if(flag)
{
printf("密码错误!\n");
}
else
{
printf("密码正确!\n");
}
}
return 0;
}
上面的示例代码模拟了一个密码验证的例子,它将用户输入的密码与宏定义中的密码“123456”进行比较。很显然,本示例中最大的设计漏洞就在于 Test() 函数中的 strcpy(buffer,str) 调用。
int a[]={1,2,3,4,5,6,7,8,9,10};
很显然,对于上面的数组 a[],虽然编译器可以根据始化值列表来计算出数组的长度。但是,如果我们显式地指定该数组的长度,例如:
int a[10]={1,2,3,4,5,6,7,8,9,10};
它不仅使程序具有更好的可读性,并且大多数编译器在数组长度小于初始化值列表的长度时还会发生相应警告。
#define MAX 10
…
int a[MAX]={1,2,3,4,5,6,7,8,9,10};
除此之外,在 C99 标准中,还允许我们使用单个指示符为数组的两段“分配”空间,如下面的代码所示:
int a[MAX]={1,2,3,4,5,[MAX-5]=6,7,8,9,10};
在上面的 a[MAX] 数组中,如果 MAX 大于 10,数组中间将用 0 值元素进行填充(填充的个数为 MAX-10,并从 a[5] 开始进行 0 值填充);如果 MAX 小于 10,“[MAX-5]”之前的 5 个元素(1,2,3,4,5)中将有几个被“[MAX-5]”之后的 5 个元素(6,7,8,9,10)所覆盖,示例代码如下所示:
#define MAX 10
#define MAX1 15
#define MAX2 6
int main(void)
{
int a[MAX]={1,2,3,4,5,[MAX-5]=6,7,8,9,10};
int b[MAX1]={1,2,3,4,5,[MAX1-5]=6,7,8,9,10};
int c[MAX2]={1,2,3,4,5,[MAX2-5]=6,7,8,9,10};
int i=0;
int j=0;
int z=0;
printf("a[MAX]:\n");
for(i=0;i<MAX;i++)
{
printf("a[%d]=%d ",i,a[i]);
}
printf("\nb[MAX1]:\n");
for(j=0;j<MAX1;j++)
{
printf("b[%d]=%d ",j,b[j]);
}
printf("\nc[MAX2]:\n");
for(z=0;z<MAX2;z++)
{
printf("c[%d]=%d ",z,c[z]);
}
printf("\n");
return 0;
}
运行结果为:
#define ARRAY_NUM 10
int *TestArray(int num,int value)
{
int *arr=NULL;
arr=(int *)malloc(sizeof(int)*ARRAY_NUM);
if(arr!=NULL)
{
arr[num]=value;
}
else
{
/*处理arr==NULL*/
}
return arr;
}
从上面的“int*TestArray(int num,int value)”函数中不难看出,其中存在着一个很明显的问题,那就是无法保证 num 参数是否越界(即当 num>=ARRAY_NUM 的情况)。因此,应该对 num 参数进行越界检查,示例代码如下所示:
int *TestArray(int num,int value)
{
int *arr=NULL;
/*越界检查(越上界)*/
if(num<ARRAY_NUM)
{
arr=(int *)malloc(sizeof(int)*ARRAY_NUM);
if(arr!=NULL)
{
arr[num]=value;
}
else
{
/*处理arr==NULL*/
}
}
return arr;
}
这样通过“if(num<ARRAY_NUM)”语句进行越界检查,从而保证 num 参数没有越过这个数组的上界。现在看起来,TestArray() 函数应该没什么问题,也不会发生什么越界错误。
if(num>=0&&num<ARRAY_NUM)
{
}
但是,这样的函数形式对调用者来说是不友好的(由于 int 类型的原因,对调用者来说仍然可以传递负数,至于在函数中怎么处理那是另外一件事情),因此,最佳的解决方案是将 num 参数声明为 size_t 类型,从根本上防止它传递负数,示例代码如下所示:
int *TestArray(size_t num,int value)
{
int *arr=NULL;
/*越界检查(越上界)*/
if(num<ARRAY_NUM)
{
arr=(int *)malloc(sizeof(int)*ARRAY_NUM);
if(arr!=NULL)
{
arr[num]=value;
}
else
{
/*处理arr==NULL*/
}
}
return arr;
}
/*若此时max定义为intmax();*/
sizeof(max)
/*若此时arr定义为char arr[MAX],且MAX未知*/
sizeof(arr)
/*不能够用于void类型*/
sizeof(void)
/*不能够用于位字段*/
struct S
{
unsigned int f1 : 1;
unsigned int f2 : 5;
unsigned int f3 : 12;
};
sizeof(S.f1);
了解 sizeof 操作符之后,现在来看下面的示例代码:
void Init(int arr[])
{
size_t i=0;
for(i=0;i<sizeof(arr)/sizeof(arr[0]);i++)
{
arr[i]=i;
}
}
int main(void)
{
int i=0;
int a[10];
Init(a);
for(i=0;i<10;i++)
{
printf("%d\n",a[i]);
}
return 0;
}
从表面看,上面代码的输出结果应该是“0,1,2,3,4,5,6,7,8,9”,但实际结果却出乎我们的意料,如图 1 所示。
void Init(int arr[],size_t arr_len)
{
size_t i=0;
for(i=0;i<arr_len;i++)
{
arr[i]=i;
}
}
int main(void)
{
int i=0;
int a[10];
Init(a,10);
for(i=0;i<10;i++)
{
printf("%d\n",a[i]);
}
return 0;
}
除此之外,我们还可以通过指针的方式来解决上面的问题,示例代码如下所示:
void Init(int (*arr)[10])
{
size_t i=0;
for(i=0;i< sizeof(*arr)/sizeof(int);i++)
{
(*arr)[i]=i;
}
}
int main(void)
{
int i=0;
int a[10];
Init(&a);
for(i=0;i<10;i++)
{
printf("%d\n",a[i]);
}
return 0;
}
现在,Init() 函数中的 arr 参数是一个指向“arr[10]”类型的指针。需要特别注意的是,这里绝对不能够使用“void Init(int(*arr)[])”来声明函数,而是必须指明要传入的数组的大小,否则“sizeof(*arr)”无法计算。但是在这种情况下,再通过 sizeof 来计算数组大小已经没有意义了,因为此时数组大小已经指定为 10 了。
版权说明:Copyright © 广州松河信息科技有限公司 2005-2025 版权所有 粤ICP备16019765号
广州松河信息科技有限公司 版权所有