2017年5月3日 星期三

他們說,我提的問題是無關緊要的....

        最近,不知道是帶賽還是怎樣,客戶總會出一些奇奇怪怪的問題,這個客戶更有趣,寄了一個 Excel 檔,裡面一大堆數據,卻沒明白說明那些數據是什麼,害我差點在裡面找明牌去簽威力彩....


        信裡面只大約說明,那是他們測試不同機台的溫度結果,要我們解釋為什麼機器與機器間的溫度差異,為什麼差了十多度?這真是一個哭么的問題,我哪知道那些數據代表什麼東西?哪裡的溫度?怎麼測試?所以請 PM 問客人這一些問題,對方回答說,他們怎麼測試,是與這問題無關的,不過,倒是解釋了那些數據是哪裡的溫度,以及怎麼得到那些數據。這....還是一個很有趣的問題。我想,全世界的人都知道,要解決問題,總得先讓我把問題或現象複製出來吧?如果都無法複製,我哪知道是什麼問題?所以詢問測試與方式,一點也不為過吧?真懷念當初做 HP 案子的時候,雖然我 Key 一個 Bug 大概要半小時(因為少用不熟悉,並且要 Key 的內容實在太多了),但至少一目了然,鉅細靡遺的紀錄配置,過程與結果狀況。這才是道地的 Bug System,寄個 Excel 就算?又當我是算命仙?

        當初,我就懷疑是客戶因為測試的邊界條件的關係,所以造成機器間的溫度差異。這差異就好像,甲的存款有五百萬,但是貸款三百萬;乙的存款是三百萬,貸款一百萬,所以甲比較有錢?不同的機器在不同的邊界條件,測出來的結果當然不一樣。但要如何證明這是客戶自己測試耍的白爛呢?

        首先,客戶寄來的數據一堆,除了上面有機器序號外,還有四個溫度,只是不知道那是哪裡的溫度。跟客戶詢問清楚後,再去比對溫度 Sensor 的 Datasheet,發現 CPU 的溫度 Sensor 較不靠譜,板上放的 Sensor 的精確度反而較高,所以就從板上 Sensor 下手。而客戶提供的數據中,恰巧兩個 Sensor 就在電源區塊的附近,如果系統 Loading 一樣,理論上這兩個 Sensor 的差值要一樣,這想法類似熱阻的概念,因為這樣,就可以將邊界條件的影響降低,例如環溫。因此,將所有客戶的數據,計算這兩個 Sensor 的差值發現,絕大部分幾乎都落在 8~9C 之間,因此幾乎可以確定,機器與機器間的溫度差異,是由於客戶自己不嚴謹的測試手法下造成的,而並非機器本身的差異造成的。而我自己本身也量了兩台機器的數據,兩部機器所有的溫度 Sensor 僅差 1C,而同樣兩個 Sensor 的差值,兩部機器都是 7C。雖然取樣數不夠,但至少能夠說明,如果邊界條件控制得當,機器間的差異,並不會有 14C 那麼離譜,並且從客戶的數據說明,機器間 Sensor 的差異,是實驗手法的問題。

        報告也給 PM 了,客戶接不接受我就不知道了。

更新........

        據 PM 說,客戶看了報告,沒有繼續來盧了。搞定!收工!

沒有留言: