聊聊這道【快手】面試題
0x00 前言
前幾天大白參加了快手的視頻面試,第一次使用牛客網(wǎng)的在線面試系統(tǒng),10點開始12點才結(jié)束,一面竟然持續(xù)了兩個小時,期間最開始用手機面試,20分鐘簡單聊完項目之后開始編碼,于是切換到PC上。
奈何??途W(wǎng)的在線面試系統(tǒng)在 Chrome 上不好用,一度以為我電腦的攝像頭壞掉了,查了一下說可能是瀏覽器問題,果然快速換到火狐之后就 OK 了,期間我調(diào)試環(huán)境花了大約10分鐘,之后便開始了重頭戲-寫代碼。
快手這個崗位的題目均不是 Leetcode 的題目,都是比較偏實際的問題,期間要進行 debug 所以時間會長一些。
其中有一道題看著挺簡單,但是后面仔細想了想,還算是個知識的模糊點,所以決定寫出來和大家分享一下。
0x01 題目描述
題目是口述并簡單寫了一下,基本上達意了,一起看下:
簡述在 Linux 環(huán)境中使用 C++ 編寫的代碼輸出結(jié)果 以及原因。給定兩個函數(shù) func1 和 func2,包含的代碼如下:
int *glob_ptr = NULL;
void func1(){
int a = 10;
int *b = &a;
glob_ptr = b;
while(true){
//do sth
}
}
void func2(){
int *c = NULL;
c = glob_ptr;
printf("%d\n",*c)
}
thread1調(diào)用func1
thread2調(diào)用func2
可確保thread1調(diào)用的func1先跑
程序的執(zhí)行結(jié)果將是什么?
是否會coredump?
如果沒有coredump將輸出什么?
并對你的答案做出解釋。
簡單說這是道多線程的問題,兩個線程函數(shù)運行之后,查看輸出結(jié)果是什么并給出解釋。
0x02 題目解析
題目中給出了全局指針變量 glob_ptr ,該變量是在進程的堆上存儲的。
在 func1 中定義了局部變量a和局部指針變量b,隨后將全局變量glob_ptr 的值賦給局部變量b,之后是一個 while 的死循環(huán),來保證 func1 一直活著,從而局部變量a和b都是有效的,進而全局變量glob_ptr 也是指向一個有效的地址。
在 func2 中同樣定義了局部指針變量c,并將全局指針變量glob_ptr 賦值給了局部指針變量c,之后將其結(jié)果進行輸出。
2.1 一些必備知識
進程是線程的載體,也可以認為是容器,進程與進程之間是有地址隔離的,Linux 是虛地址模式,每個進程都認為自己持有了全部的內(nèi)存空間,沒錯是 OS 騙了它。
本質(zhì)上各個進程的內(nèi)存訪問都涉及到虛擬地址和物理地址轉(zhuǎn)換,在系統(tǒng)層面避免了多進程之間的直接訪問,所以進程之間的通信需要借助于共享內(nèi)存、消息隊列等機制,從而也更加安全。
虛地址模式要比實地址模式更加安全,這個是由OS來保證的,對于一些單任務(wù)的操作系統(tǒng)比如 vxwork 很多都是實地址模式,題目中的Linux 便是典型的虛地址模式。
進程內(nèi)的多個線程共享進程的資源并且也擁有自己的獨立資源,這樣線程間的通信就方便很多了。
進程與進程就像獨立的家庭,每個家庭是有自己的領(lǐng)地的,如果要進行交流需要通過其他手段。
線程與線程之間就像一個家庭中的成員,每個人都生活在相同的家庭空間,但是每個人也都有自己的私有空間,所以每個線程之間的通信要方便的多,只要喊一嗓子就可以聽到了。
2.2 大白的答案
經(jīng)過前簡單分析,題目確保了局部變量地址的有效性,不同的地方在于一般的多線程同步都是使用鎖、條件變量等手段借助于全局變量來進行多線程的數(shù)據(jù)通信和同步。
題目中借助于局部變量的實現(xiàn)確實是沒有見過,這也是大白要寫這道題的初衷。
很多時候我們對于常見的東西的正確性沒有疑問,比如借助于鎖的線程同步,但是有時候沒見過的形式也不一定就是錯誤的,只能說可能是可行但不完善,其實本題就是后者情況。
經(jīng)過幾分鐘的思考,大白給出了答案:
可能結(jié)果1:coredump掉,因為在我看來Linux是比較安全的,進程內(nèi)的多個線程的局部變量存儲在私有空間棧上,從安全角度來說應(yīng)該是不可以相互訪問私有??臻g的,所以coredump。
可能結(jié)果2:沒有coredump,因為可能Linux并沒有那么做,為進程內(nèi)的線程間也做了屏障,多個線程的私有??臻g是可以相互訪問的。
所以兩個答案的區(qū)別根源就在于Linux本身是否允許多線程內(nèi)私有空間的訪問,來看一張進程內(nèi)多線程的內(nèi)存空間分布圖吧:
經(jīng)過一番思考(其實算是直覺吧),大白覺得是結(jié)果2,因為Linux本身并沒有必要來實現(xiàn)線程內(nèi)私有棧的隔離,而且Linux的地址空間的隔離應(yīng)該是進程粒度的,線程還是可以相互訪問的,所以我選擇了不會coredump并且輸出10。
但是我并不確定,因為兩種結(jié)果都說得通,不確定的根源在于自己知識的盲點:多線程私有空間的訪問權(quán)限問題。
0x03 代碼實踐
面試結(jié)束之后,晚上大白實踐了一下,發(fā)現(xiàn)確實是結(jié)果2。簡單寫的糙代碼如下:
為了避免程序的偶然性結(jié)果,大白在func2中間隔1s打印了10次,簡單編譯執(zhí)行結(jié)果確實是沒有coredump,間隔1s輸出10。
這個問題算是被驗證了,不過總覺得不能這樣結(jié)束,于是在網(wǎng)上搜索了一些東西。
0x04 繼續(xù)思考
在知乎上看到一個很相似的問題:
https://www.zhihu.com/question/265224833
有意思了!和我剛才驗證的問題是矛盾的,不過知乎上總是會出現(xiàn)一些并不成立的問題,所以還是先說是什么再說為什么吧!
簡單看了幾個高票答案,也證明了這個提問者問題本身的不成立,在一個騰訊員工的回答中看到一個華麗麗的代碼:
大神這個代碼是C++14的一些高級特性,并且沒有借助于全局指針變量,直接使用局部變量來相互訪問的,看下編譯執(zhí)行結(jié)果:
其中一個回答的圖也比較好,貼一下:
0x05.筆者小結(jié)
快手的這道題目并不復(fù)雜,但是對一些不常見的形式探究的比較深入,對此大白覺得用幾句話概況吧:
正確的并不一定是好用的,不常見的也并非是錯誤的,正確且常見的形式往往是取舍驗證之后的優(yōu)解,但是并不是唯一解,掌握根源我們才能靈活應(yīng)對各種奇怪的形式,并作出分析。
就這么多吧!本期完,祝各位周末愉快,疫情之下 注意防護。
春風在不久之后將吹開緊閉的家門,我們紛紛摘下口罩,洋溢著久違的笑容,自由呼吸、快樂奔跑!
免責聲明:本文內(nèi)容由21ic獲得授權(quán)后發(fā)布,版權(quán)歸原作者所有,本平臺僅提供信息存儲服務(wù)。文章僅代表作者個人觀點,不代表本平臺立場,如有問題,請聯(lián)系我們,謝謝!