首页 > 代码库 > C陷阱与缺陷整理二

C陷阱与缺陷整理二

1.在C语言中,我们没有办法将一个数组作为函数参数传递,如果我们使用数组名作为参数,这个时候数组名立刻会被转换为指向该数组的第一个元素的指针。
    关于这一点的理解可以向前深入一步,比如定义的数组为int a[3],那么a作为参数传递之后会变为int *类型;如果定义的数组为int a[3][4],那么a作为参数传递之后被变为int (*)[4];如果定义的数组为int a[3][4][5],那么a作为参数传递之后会变为int (*)[4][5];后续的以此类推。为什么可以这样呢?因为C语言中的多维数组都是利用一维数组仿真出来的,即一维数组的每一个元素都可以是别的类型的数据单元,即便这个数据单元又是另一个数组,然而根据上面的观点,一维数组a在被作为参数传递的时候会自动退化为指向该一维数组的第一个单元的指针,所以如果第一个单元是一个一维数组,那么a就退化为一个一维数组指针,如果a的第一个单元是一个二维数组,那么a就退化为一个二维数组指针,所以上面的结论是不难得出的。

2.看下面的代码片段输出会是多少?
void print(int b[])
{
    printf("%d", sizeof(b));
}
int main(void)
{
    int a[4];
    print(a);
    return 0;
}
分析:要弄清楚这段代码片段的输出,还是要清楚函数调用时候数组的传递过程,上面第一点已经说过了,在传递参数的时候数组已经自动被退化为指向其第一个单元的指针,所以在函数传递的过程中相当于出现了这样的一个赋值的过程,int b[] = a或者更清楚一些int b[] = &a[0],但是这样的语句编译器会认为是一个错误的语法!但是实际中我们经常可能会这样来使用却并没有报错,这是因为编译器在这里会将b强制做一次退化,退化为一个int *的指针类型。所以上面的程序片段输出内容显而易见,输出的就是一个int类型的指针变量的大小,也就是4(32位系统)。

3.main函数参数的两种形式
int main(int argc, char *argv[])
int main(int argc, char **argv)
需要注意的是,前一种写法强调的重点在于argv是一个指向某数组的起始元素的指针,该数组的元素为字符指针类型。

4.以下的这种写法:
    char *p = "xyz";
    p[0] = ‘A‘;
编译的器件可能不会产生问题,但是运行的时候很可能会碰到类似于某地址不能为written这种提示,K&RC中对这种修改行为的说明是:试图修改字符串常量的行为是未定义的。虽然有些编译器允许这样的行为,但是这种写法是不值得提倡的。

5.除了一个重要的例外情况,在C语言中将一个整数转换为一个指针,最后得到的结果都取决于具体的C编译器实现。这个特殊情况就是常数0,编译器保证由0转换而来的指针不等于任何有效的指针,出于代码文档化的考虑,常数0这个值经常用一个符号来代替:
#define NULL 0
需要记住的是当常数0被转换为指针使用时,这个指针绝对不能被解除引用(解除引用即是使用(*p)这类取该地址中内容的操作),换句话说,当我们将0赋值为一个指针变量时,绝对不能企图使用该指针所指向的内存中所存储的内容。

6.C语言中“不对称边界”的好处
    在C语言中定义了一个数组int a[10]之后,数组的下标0~9为合法的下标,而下标10已经超出了数组的范围。这样做的好处是什么呢?
第一个好处,请看下面的一个例子:
for(i = 0; i < 10; i++)
    a[i] = *p++;
如果用户给出了begin(0)和end(10)的范围之后要求对这之间的单元进行操作,如果用户给定的begin和end是相同的话,上面这种写法完全可以避免出现错误。同时要操作的单元个数可以通过end-begin简单的就算出来,这样做的前提就是用户给出的begin和end都是遵守C语言的“不对称边界”使用方法。而如果不使用不对称边界时候(这时候数组的下标为1~10合法)的诸如代码:
for(i = 1; i <= 10; i++)
    a[i] = *p++;
才可以完成对数组的初始化或者遍历等操作,这样写之后,实际操作的单元个数为10-1+1=10个,这样的计算过程如果程序员在编程的时候忘了加上一个1那么很容易造成程序的bug。同时如果将1和10换成begin和end变量的话,那么用户在调用这个函数的时候传递的begin和end值就算是同一个值,这段代码也会操作到数组中的a[begin]值,这个也会造成调用者使用的困难。
第二个好处是我们可以将&a[10]来作为一个判断条件,作为缓冲区或者数组操作完成的一个标志,这在实际编程中也是相当方便的。虽然对a[10]的值进行操作是属于非法的行为,但是在ANSI中明确规定了&a[10]这种操作是合法的。

7.在大多数的C语言实现中,--n >= 0至少与等效的n-- > 0一样快,甚至在某些C实现中还要更快,第一个表达式--n >= 0的计算是首先从n中减去1,然后将结果与0比较;第二个表达式的计算则首先保存n,然后从n中减去1,最后比较保存值与0的大小。

8.C语言中只有四个运算符(&&、||、?:、,)存在规定的求值顺序,运算符&&和运算符||首先对左侧的操作数求值,只有在需要的时候才会对右侧的操作数求值。运算符?:有三个操作数,在a?b:c中,操作数a首先被求值,根据a的值在求操作数b或者c的值(b和c只有一个表达式会被计算)。而逗号运算符,首先对左侧的操作数求值,然后该值被“丢弃”,在对右侧操作数求值,整个表达式的值是最右侧表达式的值。
逗号运算符举例:a = (1, 2, 3);
a最后被赋值为3。
注意:分隔函数参数的逗号并非逗号运算符,例如:f(x, y)中的求值顺序是未定义的,而在函数g((x,y))中却是确定的先x后y的顺序,在后一个例子中,函数g只有一个参数,这个参数的值就是括号中逗号运算符的值。
注意:在C语言中其他所有运算符对其操作数求值的顺序是未定义的。特别地,赋值运算符并不保证任何求值顺序。如果在一个表达式中出现对同一变量的多次使用中出现了++或者--等操作后果有时是不可预计的。例如:
y[i] = x[i++];

9.逻辑运算符的结果是一个逻辑值,即真(1)或假(0),而逻辑判断的时候通常约定将0视作假,非0视作真。所以!10表达式的值为假(0),因为10非0在进行非运算的时候被视作真,真的非即为假。

10.C语言中存在两类整数算术运算,有符号数与无符号数运算。无符号数运算中没有溢出的说法,然而有符号数操作就可能会发生溢出的情况,当一个运算的结果发生“溢出”时,作出任何假设都是不安全的。当碰到可能溢出的情况应该采取的方法是将两个操作数a和b都强制转换为无符号整数:
if((unsigned)a + (unsigned)b > INT_MAX)
    complain();
此处的INT_MAX是一个已定义常量,代表可能的最大整数值。ANSI C标准在<limits.h>中定义了INT_MAX;如果在其它的C语言实现上,读者可能需要自己重新定义这个值。

C陷阱与缺陷整理二