2016年5月24日 星期二

學貴慎始

這四個字,用 Google 就可以查到出處。可以引喻為好的開始是成功的一半。但錯誤的第一步,會從天堂掉到地獄。

        話說,前陣子公司接到大客戶的單子而雀躍不已,但....小弟我額頭直冒冷汗,你以為他們會像其他阿薩布魯的客戶嗎?


        客戶看上我們某個型號(當然也許是業務推的),但好死不死的,這台系統是遇到過兩個散熱性能最差中的一個。不僅操作環境變高,而且風扇還要 N+1 不降頻。結果做了一些測試,看幾款 CPU 的性能如何?但這在我眼中,是一些無意義的測試。不要忘了我們是在做系統的散熱,而不是在做驗證。

        或許,你看完之後認為這是抱怨文,或許是在抱怨,但看文章要看重點,重點是這台系統已經設計完成,他的散熱特性就是這樣子,CPU 能不能用,是驗證問題,而不是設計問題。這問題應該回歸當初在做設計時,到底如何定義這台系統的散熱性能。很不幸,敝公司走的是獨樹一格 Simulation 跑一跑,產品產出後,CPU 裝上去跑一跑,通過自家的測試軟體就算 Pass....但,以常規的標準設計流程而言,完全不及格....如果這樣,Intel 的 TMDG 真的是寫辛酸的。

        TMDG 為 Thermal Mechanical Design Guideline,顧名思義,他是拿來作設計用的。在 CPU 的 Thermal Profile 中,一條是 T_case,一條是 T_junction,先撇開是否需要遵循 Profile,至少他告訴你設計要求為何。

        但系統的散熱設計完成時,他的特性就幾乎固定了,除非更換散熱元件,否則散熱器的熱阻值就固定了,或者說散熱器的熱阻值與系統風扇轉速關係式就固定了,熱阻值與 Intel 的 TMDG 的 Thermal Profile 比對一下,就大致可以知道哪些 CPU 可以用,哪些 CPU 是會過熱的。

        但比對 TMDG 後不能 Pass 的 CPU 就完全不能用了嗎?這也未必。有兩個因素可能讓某些 CPU 也能通過溫度測試。一是 CPU 的封裝特性,二是 CPU 的 Power 死操活操都操不起來。封裝特性可以說是設計驗證者賺到的部分(因為這部份是穩賺不賠,頂多沒賺到而已),但 Power 死操活操都操不起來,會是一個較有爭議的部份,相信 Intel 不會對 CPU Power 操不起來掛保證的。所以這一部分相信會回到當初的設計,並且這部份應該算是驗證問題,而不是設計問題。

        所以,在當初系統散熱部分沒有做確實的設計驗證下,現在只有挨打的份了。

沒有留言: