Intel 前任CEO 季辛格,對媒體上傳聞TSMC 2nm 技術的高「良率」,很不以為然。在社群媒體上發表對「良率」定義的高見,引發爭論風波。
許多半導體產業的從業人員,一定很納悶Intel 前CEO的知識和眼界竟是如此,和業界的「分析師」無異。四年珍貴的關𨫡時刻、數百億公司的資產的掉落,董事會迫其「自動退休」,一定有其道理,是不是罪有應得?
媒體大多都認為季辛格被逼退的理由:他耗了三、四年關𨫡時間,花了Intel 不少錢,以billion 計,卻不能令 Intel 跟上AI 洶湧的新潮流,至使公司陷入泥沼,脫身無策。
媒體的這種說法「似是而非」。季辛格首要致命的的錯誤 ,是他仍然相信Intel 設計的上一代「CPU」,具有像 NVIDIA 的CUDA系統中(新近被電腦科學家發現的)超凡計算能力,因此可以和NVIDIA一較高下。不僅在計算中心當作伺服器(Server )的推動引擎,而且更可望用於AI 的機器學習和「深度學習」,可望開發出「再生AI」或「大型語言模型」的演算工具。
事實上,Intel 的敗落,AI 不是主因,而是後果。NVIDIA 系統中超凡的計算能力,才是使多年來奄奄一息,不被看好的AI,重獲新生命的主因。
十幾年年赫赫有名、幾乎是 Intel 專有的「摩爾定律」:積體電路密度每兩年可望增加一倍,因此計算速度也增加一倍,也因此成為過時雲煙、昨日黃花。—— 速度僅增加一倍?NVIDIA 的 CUDA 系統可以增加百倍以上 !許多 AI 演算法可以加以運用,更新和更先進的演算法,可以被探索和發現,計算機可能進入新的紀元,只因此類「運算速度」的突破。
這種新發現,在NVIDIA 系統上存在,Intel 產品卻沒有,可說是「正格典範的移動」( paradigm shift ) ,作者不敏,相信可能有兩大原因:
(1)NVIDIA 的 CUDA 系統使用GPU,因為原先繪圖的需要,使用「大量平行運算」,而且它的 architecture 有各種 lever 的垂直深度設計,依系統軟體而設計的積體電路元件,容易 mapping 到程序工程技術上 ( process technology )。當 TSMC 可以把「程序工程」的技術,push 到 3nm 、2nm 時,大量平行運算,可以因device 變小,彼此間距也跟著縮小,通訊更形容易,不僅在平面,或垂直,甚至「多向度」,不會再是限制的因子。device 間的邏輯空間擴大,不僅可以是線性的、非線性的,更可以是「拓樸關係」( topological relation ):平行運作下,數千個、數萬個 device 可以同時運作達成上下左右、各類流向的邏輯關係。
(2)相較之下,Intel 可沒有這麼大的「自由度」,多年來在「伺服器」晶片的成功和收益,在系統設計上,有它傳承(legacy )的負擔,系統上Intel 所用的,可歸之於 「clustering computing 」:它可以在系統上同時使用8個、9 個、10來個 CPU,決不能像NVIDIA 數千個、數萬個GPU同時運算。如果用高能理論物理作個比喻:Intel 系統要行得通,它的系統「味道」(flavor ) 要對,「色澤」( color ) 要對,是「正規化」( normalizable ),才能通過數學函數的要求,才可能發現「新粒子」可能存在的「相空間」。NVIDIA 的系統的要求近於無味、無色、管它是不是正規化,任何系統公司可以使用NVIDIA軟體或TSMC 幫助其生產的晶片,來設計他們的系統,簡單明瞭。
現今的系統公司大多用 ARM 的 「簡單指令架構 」( Reduced Instruction Set ) ,而不是 Intel 的「複雜指令架構」( Complex Instruction Set ) 。這兩類指令架構的選擇不同,會對「程序工程」的總體設計和建構,有所不同,因此「運算速度」和「可靠性」( reliability ) 也跟著不同。史丹福大學有位名教授,對於「不同語言」在不同的「指令架構」下,運算的速度,會如何有所不同,有一套系統性的書籍,詳細分析。你或許會發現Intel 「程序工程技術」傳承的負擔會有多大 ?
總而言之,Intel 有兩大傳𠄘( legacy ) 負擔,要傳承「指令架構」,它不能改變「程序工程」的設計和結構。要傳承「程序工程」的設計和結構,它不能改變伺服器系統晶片的設計。如果你我反方向思考,從系統到程序工程,再到指令架構,也會是相同的結論。不像TSMC ,「指令架構」可以依工業主流而定,專注「程序工程」的精進,自己沒有系統晶片,當然不會和來客的產品有有任何利益衝突。三十多年前,張忠謀提倡「代工」和「設計」分流,當時可說是「離經叛道」,不知所云。許多從業人員是在 Electronic News , 才認識到 fabless 這個字!
從Intel 眼前的敗落,可以令你我認識到前賢所說「知識的成長是難以預測的,成長的知識會對實業(尤其是科技)和社會有必然的而重大的衝擊。」—— 想想看AT&T 的 Bell !ab、Motorola、Digital 、Cray Research、IBM 的 Main Frame 的命運 ……。公司的生老病死和人類並無差異。太成功的公司,故步自封,「漸凍人症」就會上來了!照這樣做就不會有錯( Copy Exactly ) !回想當年某大公司內部自以是的口號,而且尊其為「方法論」( methodology )。
Intel 目前所面臨的難關和當年的 IBM 並無兩樣。PC 革命一來,當年 IBM 的Main Frame 不再風行於世,Pradigm Shift , 幾十年來的所仰賴的Milky Cow 不再奶汁充沛,嗷嗷待哺者眾,怎麼辦 ?要怎麼樣收編?
當時,微軟的 Bill Gates 有個評論:IBM 最困難的決定,是決定是否放棄「製作程序技術」( 而當個典型系統軟體公司)?在當時製作程序技術最先進而且是最 innovative 公司,舉個例,為求「光刻機」高頻光源,IBM 由英國引進「同步幅射」(synchrotron radiation ) 的加速器:這種魄力是少見。為保有先進的程序技術,IBM 掙扎了好幾年,才放棄。接著,把研究中心的物理學家們趕去重新受訓,學習「電路設計」,顯然當時的認識還不清楚,沒有劃對重點:IBM應該把他們的物理學家趕去學習「演算法」( Algorithms )才對。
IBM 近年來令人注目的技術是他們的超級電腦 Deep Blue 打敗西洋棋的世界冠軍,電腦所用的元件一定不是IBM parts。900 磅的大猩猩會跳舞,是它割掉了傳承的絆繫。IBM 或許會很快的把 NVIDIA 系統引入他們的系統中,看看對他們的 Total Solution 策略有何必然的助益?
前面所說Intel 前任 CEO所犯的最大錯誤,是要把傳承的系統設計的方法不變,不改變 Intel 傳承的程序技術,只想軋下大資金,就以為兮提升Intel 「程序技術」到TSMC的水準,再建立新的 Fab 和其競爭 Foundry 的生意,顯然是沒有 intellectual 自覺,傳承的系統和程序技術,有其弱點和限度。當半導體從業人員看到他花精神和分析師爭辯「良率」的定義時,一定有許多人認為 Intel 董事會令他去職是正確的決定。
你若是 Intel 新的 CEO ,首先要做的痛苦決定是把 Intel 分割為二,一是系統設計的 Intel ,另外一個是「生產傳承產品」的 Intel 。兩類公司所需要的人員的 talent 不同,事業迴旋的時間也不同,因此公司的治理也會有所不同。
第一類的公司,人員的「耐用」和「適用」的時間比較短,要非常 alert ,隨時準備業界的變動,任何技術的 shift ,人員的技術知識要經常性的要求更新:這是動力學的問題。第二類人員「耐用」、「適用」的時間比較長,生產作業要求的是「穩定」,包括人員的穩定:這是靜力學的問題。兩類公司豁在一起,互相抵觸,不同調,難得「平衡」,企業的效果會很不理想。
公司分割為二之後,哪一個公司應該是 Intel 真正的傳承,有可能要一段日子才能知曉。新的 CEO 有時要是「理想主義」,另外時候要是「現實主義」,兩者可以同時得兼,技術知識和經營手腕,可以同時擁有,—— 有這樣的人才嗎?還是先設計個「雙首長制」,一段日子才「分」,如何「分」?甚至分合之間,0 與 1 間有多種組合方式?Intel 會像IBM 當時那頭900磅重的大猩猩,用樣也可跳起舞來嗎 ?
作者: 張柏年