導讀:Dennis Ritchie過世了,他發明了C語言,一個影響深遠并徹底改變世界的計算機語言。一門經歷40多年的到今天還長盛不訓的語言,今天很多語言都受到C的影響,C++,Java,C#,Perl,PHP,Javascript等等。但是,你對C了解嗎?相信你看過本站的《C語言的謎題》還有《誰說C語言很簡單?》。這里,我再寫一篇關于深入理解C語言的文章,一方面是緬懷Dennis,另一方面是告訴大家應該如何學好一門語言。(順便注明一下,下面的一些例子來源于這個slides)。
文章內容如下:
首先,我們先來看下面這個經典的代碼:
- int main()
- {
- int a = 42;
- printf(“%d\n”, a);
- }
從這段代碼里你看到了什么問題?我們都知道,這段程序里少了一個#include <stdio.h> 還少了一個return 0;的返回語句。
不過,讓我們來深入的學習一下,
這段代碼在C++下無法編譯,因為C++需要明確聲明函數
這段代碼在C的編譯器下會編譯通過,因為在編譯期,編譯器會生成一個printf的函數定義,并生成.o文件,鏈接時,會找到標準的鏈接庫,所以能編譯通過。
但是,你知道這段程序的退出碼嗎?在ANSI-C下,退出碼是一些未定義的垃圾數。但在C89下,退出碼是3,因為其取了printf的返回值。為什么printf函數返回3呢?因為其輸出了’4′, ’2′,’\n’ 三個字符。而在C99下,其會返回0,也就是成功地運行了這段程序。你可以使用gcc的 -std=c89或是-std=c99來編譯上面的程序看結果。
另外,我們還要注意main(),在C標準下,如果一個函數不要參數,應該聲明成main(void),而main()其實相當于main(…),也就是說其可以有任意多的參數。
我們再來看一段代碼:
- #include <stdio.h>
- void f(void)
- {
- static int a = 3;
- static int b;
- int c;
- ++a; ++b; ++c;
- printf("a=%d\n", a);
- printf("b=%d\n", b);
- printf("c=%d\n", c);
- }
- int main(void)
- {
- f();
- f();
- f();
- }
這個程序會輸出什么?
我相信你對a的輸出相當有把握,就分別是4,5,6,因為那個靜態變量。
對于c呢,你應該也比較肯定,那是一堆亂數。
但是你可能不知道b的輸出會是什么?答案是1,2,3。為什么和c不一樣呢?因為,如果要初始化,每次調用函數里,編譯器都要初始化函數棧空間,這太費性能了。但是c的編譯器會初始化靜態變量為0,因為這只是在啟動程序時的動作。
全局變量同樣會被初始化。
說到全局變量,你知道 靜態全局變量和一般全局變量的差別嗎?是的,對于static 的全局變量,其對鏈接器不可以見,也就是說,這個變量只能在當前文件中使用。
我們再來看一個例子:
- #include <stdio.h>
- void foo(void)
- {
- int a;
- printf("%d\n", a);
- }
- void bar(void)
- {
- int a = 42;
- }
- int main(void)
- {
- bar();
- foo();
- }
你知道這段代碼會輸出什么嗎?A) 一個隨機值,B) 42。A 和 B都對(在“在函數外存取局部變量的一個比喻”文中的最后給過這個例子),不過,你知道為什么嗎?
如果你使用一般的編譯,會輸出42,因為我們的編譯器優化了函數的調用棧(重用了之前的棧),為的是更快,這沒有什么副作用。反正你不初始化,他就是隨機值,既然是隨機值,什么都無所謂。
但是,如果你的編譯打開了代碼優化的開關,-O,這意味著,foo()函數的代碼會被優化成main()里的一個inline函數,也就是說沒有函數調用,就像宏定義一樣。于是你會看到一個隨機的垃圾數。
下面,我們再來看一個示例:
- #include <stdio.h>
- int b(void) { printf(“3”); return 3; }
- int c(void) { printf(“4”); return 4; }
- int main(void)
- {
- int a = b() + c();
- printf(“%d\n”, a);
- }
這段程序會輸出什么?,你會說是,3,4,7。但是我想告訴你,這也有可能輸出,4,3,7。為什么呢? 這是因為,在C/C++中,表達的評估次序是沒有標準定義的。編譯器可以正著來,也可以反著來,所以,不同的編譯器會有不同的輸出。你知道這個特性以后,你就知道這樣的程序是沒有可移植性的。
我們再來看看下面的這堆代碼,他們分別輸出什么呢?
示例一
- int a=41; a++; printf("%d\n", a);
示例二
- int a=41; a++ & printf("%d\n", a);
示例三
- int a=41; a++ && printf("%d\n", a);
示例四
- int a=41; if (a++ < 42) printf("%d\n", a);
示例五
- int a=41; aa = a++; printf("%d\n", a);
只有示例一,示例三,示例四輸出42,而示例二和五的行為則是未定義的。關于這種未定義的東西又叫Sequence Points,因為這會讓編譯器不知道在一個表達式順列上如何存取變量的值。比如a = a++,a + a++,不過,在C中,這樣的情況很少。
下面,再看一段代碼:(假設int為4字節,char為1字節)
- struct X { int a; char b; int c; };
- printf("%d,", sizeof(struct X));
- struct Y { int a; char b; int c; char d};
- printf("%d\n", sizeof(struct Y));
這個代碼會輸出什么?
a) 9,10
b)12, 12
c)12, 16
答案是C,我想,你一定知道字節對齊,是向4的倍數對齊。
但是,你知道為什么要字節對齊嗎?還是因為性能。因為這些東西都在內存里,如果不對齊的話,我們的編譯器就要向內存一個字節一個字節的取,這樣一來,struct X,就需要取9次,太浪費性能了,而如果我一次取4個字節,那么我三次就搞定了。所以,這是為了性能的原因。
但是,為什么struct Y不向12 對齊,卻要向16對齊,因為char d; 被加在了最后,當編譯器計算一個結構體的尺寸時,是邊計算,邊對齊的。也就是說,編譯器先看到了int,很好,4字節,然后是 char,一個字節,而后面的int又不能填上還剩的3個字節,不爽,把char b對齊成4,于是計算到d時,就是13 個字節,于是就是16啦。但是如果換一下d和c的聲明位置,就是12了。
另外,再提一下,上述程序的printf中的%d并不好,因為,在64位下,sizeof的size_t是unsigned long,而32位下是 unsigned int,所以,C99引入了一個專門給size_t用的%zu。這點需要注意。在64位平臺下,C/C++ 的編譯需要注意很多事。你可以參看《64位平臺C/C++開發注意事項》。
下面,我們再說說編譯器的Warning,請看代碼:
- #include <stdio.h>
- int main(void)
- {
- int a;
- printf("%d\n", a);
- }
考慮下面兩種編譯代碼的方式 :
cc -Wall a.c
cc -Wall -O a.c
前一種是不會編譯出a未初化的警告信息的,而只有在-O的情況下,再會有未初始化的警告信息。這點就是為什么我們在makefile里的CFLAGS上總是需要-Wall和 -O。
最后,我們再來看一個指針問題,你看下面的代碼:
- #include <stdio.h>
- int main(void)
- {
- int a[5];
- printf("%x\n", a);
- printf("%x\n", a+1);
- printf("%x\n", &a);
- printf("%x\n", &a+1);
- }
假如我們的a的地址是:0Xbfe2e100, 而且是32位機,那么這個程序會輸出什么?
第一條printf語句應該沒有問題,就是 bfe2e100
第二條printf語句你可能會以為是bfe2e101。那就錯了,a+1,編譯器會編譯成 a+ 1*sizeof(int),int在32位下是4字節,所以是加4,也就是bfe2e104
第三條printf語句可能是你最頭疼的,我們怎么知道a的地址?我不知道嗎?可不就是bfe2e100。那豈不成了a==&a啦?這怎么可能?自己存自己的?也許很多人會覺得指針和數組是一回事,那么你就錯了。如果是 int *a,那么沒有問題,a == &a。但是這是數組啊a[],所以&a其實是被編譯成了 &a[0]。
第四條printf語句就很自然了,就是bfe2e114。
看過這么多,你可能會覺得C語言設計得真拉淡啊。不過我要告訴下面幾點Dennis當初設計C語言的初衷:
1)相信程序員,不阻止程序員做他們想做的事。
2)保持語言的簡潔,以及概念上的簡單。
3)保證性能,就算犧牲移植性。
今天很多語言進化得很高級了,語法也越來越復雜和強大,但是C語言依然光芒四射,Dennis離世了,但是C語言的這些設計思路將永遠不朽。
聲明:本網部份文章為轉載文章,在每篇文章底部有說明,文章的觀點和立場僅代表作者個人立場,不代表微網立場,若是文章轉載中有侵范您的權益,請發郵件到 493149@qq.com或致電13922854199通知刪除,謝謝!