開欄語
當人工智能的浪潮席卷全球,北京正以科技創(chuàng)新之姿,成為AI大模型領域的戰(zhàn)略高地。從智源研究院的“悟道”大模型問世,到“天使投資人”模式孵化頂尖學者,再到月之暗面、DeepSeek、智譜等人工智能獨角獸崛起,這座城市不僅匯聚了前沿技術,更以開放生態(tài)孕育突破性成果。
如今,北京正積極打造“全球開源之都”,一大批研發(fā)機構、企業(yè)積極擁抱開源,而開源也已深入到汽車、機器人等眾多行業(yè)。發(fā)展AI將是一場科技長征,在北京市科委、中關村管委會的支持和推動下,新京報AI研究院推出“AI浪潮錄”系列專欄,深度訪談此次AI浪潮的親歷者與見證人,講述AI競爭新格局與背后的故事。
清程極智聯(lián)合創(chuàng)始人師天麾。受訪者供圖
人工智能是年輕的事業(yè),也是年輕人的事業(yè)。
清程極智聯(lián)合創(chuàng)始人師天麾正成為這句話的一個生動的注腳,而他的經(jīng)歷也是當前中國年輕一代AI高端人才的縮影——高中拿下信息學奧林匹克競賽金獎保送清華大學,大學確定了系統(tǒng)和高性能計算的研究方向,博士畢業(yè)后成為中國科學院計算技術研究所課程講師、中國信通院萬卡智算集群服務能力推進方陣技術專家。
多個身份標簽加持,互聯(lián)網(wǎng)大廠曾向師天麾拋出高薪的橄欖枝,他最終卻選擇自己創(chuàng)業(yè),理由也很簡單,“做一些不同的事”。在他眼中,大廠“老板安排”和KPI均是束縛,創(chuàng)新將難以開展。
在AI圈,年輕的身影已然顯眼。2024年異軍突起的Kimi由90后楊植麟領軍,2025年席卷全球的DeepSeek核心團隊成員為清北的應屆畢業(yè)生組成。根據(jù)獵聘大數(shù)據(jù)研究院報告,近一年AI技術活躍人才中,30歲以下的人才占比59.90%。
如今,創(chuàng)立一年多時間,清程極智已同時入駐上海“模速空間”和北京“人工智能創(chuàng)新街區(qū)”,這個清華系AI Infra(人工智能基礎設施)創(chuàng)新企業(yè),員工平均年齡不到30歲。
作為一名95后,師天麾的身上看不到老一輩人心中那座名為“技術差距”的大山。面對新京報AI研究院關于算力、創(chuàng)新等問題時,師天麾坦言,英偉達從建立起CUDA到很多人用,其實也沒有很久。國產(chǎn)芯片只要解決好更好用的問題,以國內(nèi)的工業(yè)制造能力,將以超高性價比在競爭中勝出。
他所在的這支由清華計算機系師兄弟組建的團隊,既是中國AI新生代的典型樣本,也是破解國產(chǎn)算力短缺的探路者,開源的大模型推理引擎“赤兔”通過底層技術革新,實現(xiàn)了大多數(shù)老舊英偉達GPU和國產(chǎn)芯片對原生FP8模型的高效部署,從而能夠運行DeepSeek滿血版。當全球AI競賽進入算力攻堅階段,年輕團隊正在為國產(chǎn)芯片與大模型之間架起一座“通天塔”,在英偉達主導的算力版圖中撕開一道創(chuàng)新裂縫。
創(chuàng)業(yè)·代碼寫得特別快的愉悅
新京報AI研究院:你最早接觸AI是什么時候,為何選擇了這個行業(yè)?
師天麾:我最早接觸AI要追溯到初高中加入信息學奧林匹克競賽小組的時候,當時的學習內(nèi)容主要為“算法和數(shù)據(jù)結構”。之所以學習奧賽,主要是對計算機感興趣,還能偷偷打游戲。高二的暑假,我獲得了2014全國青少年信息學奧林匹克競賽金牌,保送了清華大學計算機系。
在我的大學期間,人工智能已經(jīng)迎來了以智能駕駛和CV(計算機視覺)為主的第一波浪潮,大二時,我還沒想好將來是就業(yè)還是從事科研,于是去了智能駕駛企業(yè)Momenta實習研究算法。經(jīng)過工作實踐,我發(fā)現(xiàn)人工智能算法的“黑箱”特性導致可解釋性不強,這無法給我很高的成就感。大三時,我去商湯科技的高性能計算部門進行了嘗試,才找到了自己真正的興趣所在。
實際上,信息學奧林匹克競賽本身就對程序運行的時間有要求,這也讓我對“把一份代碼寫得特別快”很感興趣,最終我成為清華大學高性能計算研究所翟季冬老師的博士。在博士研究過程中,多年積累也為創(chuàng)業(yè)提供了條件。2023年,我們清程極智成立,主要以清華計算機系高性能計算所的師兄弟為班底,清程主要做AI Infra。
簡單來講,AI Infra是連接硬件與AI算法之間的“中間層”,通過我們的軟件,客戶可以在相同的硬件資源上實現(xiàn)更快的推理速度和更高的并發(fā)性能,實現(xiàn)AI應用落地更高效、更低成本,讓國產(chǎn)硬件也能“比肩”英偉達。
新京報AI研究院:清程極智的員工非常年輕,團隊為何是這樣的組合?
師天麾:我們團隊30歲以上的人很少,只有三名80后。年齡最大的為1985年出生,最小的則是一名已經(jīng)保送清華的高三實習生。相比學校更側重理論基礎學習,企業(yè)可以真正讓理論學以致用。當我們把一個實際問題足夠細化,最后就會變成一個題目,交給這名高三實習生后,他用一兩天時間就做完了一周的工作,并且反饋說終于明白了在學校學習的計算機理論基礎“有什么用”。
我們團隊年輕的原因一方面是所在的行業(yè)比較熱門,團隊技術背景也很好,對同學們挺有吸引力的,所以一些剛出校門的同學就加入清程了。另一方面,其實AI Infra研究相關職位并不好招人,相比算法,我們的工作更加偏向底層,圈子“就這么大”。所以,我們也愿意招一些有想法、有熱情、基礎扎實、學習能力強的年輕人進行培養(yǎng),有些甚至是在校生。同時,AI行業(yè)本身也比較年輕,有些擔起重任的技術大佬也是95后甚至00后,也就是互聯(lián)網(wǎng)原住民一代。
新京報AI研究院:從你進入清華到現(xiàn)在,已經(jīng)過去了十年,這期間AI技術已經(jīng)經(jīng)歷了至少兩輪浪潮,對此有什么感受?怎么看待熱點變化對學生選擇專業(yè)的影響?
師天麾:當我決定走高性能算力這條路時,技術熱點的變化對我就影響不大了。因為不論是CV、大模型,還是再往前的云計算、超算,哪一項技術火爆,只要用的人多起來,成本在一定程度上就會變高,都需要通過高性能計算來加速、降本。
入校時火爆的熱點,可能畢業(yè)時不一定再熱。但學生只要打牢基礎,無論未來什么熱點火爆,高性能計算的能力都可以很好地運用進去。
商機· 從訓練轉向推理,踩點DeepSeek爆火
新京報AI研究院:今年1月底開始,DeepSeek爆火,作為從事算力研究的AI Infra公司,你們受到了怎樣的影響?
師天麾:春節(jié)期間打開手機,朋友圈到處都是DeepSeek的消息。很多去年和我們合作的國產(chǎn)公司開始密集和我們探討怎樣快速適配DeepSeek。春節(jié)期間,我們和這些公司幾乎每天都在溝通。
DeepSeek采用MoE(混合專家模型)架構,我們在前幾年MoE剛出現(xiàn)時就判斷它會成為未來的重要趨勢,因此進行了MoE模型訓練、推理加速的技術積累,也發(fā)表了一些國際頂級會議的論文。
清程極智的客戶生態(tài)主要包括硬件廠商、大模型研發(fā)企業(yè)以及有數(shù)字化轉型需求的企業(yè)。去年,大模型訓練的需求高于推理的需求,但隨著DeepSeek出現(xiàn),企業(yè)對推理服務的需求正超越傳統(tǒng)的訓練需求,而我們推出的DeepSeek一體機以低技術門檻,讓企業(yè)在無需專業(yè)AI團隊支撐的環(huán)境下也能部署并使用大模型,作用類似于AI領域的“傻瓜相機”。
我們做推理的優(yōu)勢很大,因為DeepSeek需要多機器推理,涉及上層并行計算的優(yōu)化,這方面我們有面向超大規(guī)模國產(chǎn)算力集群研制的大模型訓練系統(tǒng)“八卦爐”,計算能力已擴展到10萬臺服務器超大規(guī)模集群,所以在多機并行計算、通信優(yōu)化等方面經(jīng)驗豐富,將這一數(shù)量級的集群優(yōu)化經(jīng)驗放到幾臺機器上,做起來非常順手。
目前,我們的一體機產(chǎn)品部署較多的模型主要有DeepSeek、智譜GLM 、Qwen和llama等主流模型。
新京報AI研究院:發(fā)展大模型,算力是一個繞不開的話題。英偉達在這一領域經(jīng)營多年,甚至衡量一家企業(yè)的算力往往是看其擁有多少張“英偉達卡”。你的發(fā)展愿景會是成為下一個英偉達嗎?
師天麾:相比于成為英偉達,我們的定位更類似于幫助國產(chǎn)芯片比肩英偉達。讓國產(chǎn)芯片以及老舊英偉達芯片的能力達到和英偉達新版芯片一樣。今年初,清程極智與清華共同開源了大模型推理引擎“赤兔”(chitu),通過赤兔的部署,讓英偉達老卡舊卡及國產(chǎn)芯片可以支持FP8精度模型,從而能夠運行DeepSeek滿血版。下一步,我們也將嘗試讓CPU服務器也能高效運行大模型。
當前,國產(chǎn)硬件正在慢慢變成熟,但這需要一定的過程,比如我們在使用國產(chǎn)硬件時會發(fā)現(xiàn)一些底層Bug,此時我們會和對方進行反饋。
其實,英偉達從建立起CUDA生態(tài)到很多人用,時間上也沒有很久,其崛起的主要因素是趕上了GPU適配AI訓練推理的技術紅利期。所以歸根結底,這還是國產(chǎn)生態(tài)的問題——不一定需要一味在硬件上追逐趕超,通過軟硬協(xié)同一樣能讓國產(chǎn)顯卡更好用,以我國在工業(yè)制造領域強大的產(chǎn)業(yè)化能力,參照手機、汽車等行業(yè)的演進軌跡,完全具備在合理周期內(nèi)實現(xiàn)顯卡產(chǎn)品的性價比突破。
當前,很多央國企已批量采購國產(chǎn)顯卡設備,但實際部署時仍依賴海外推理引擎,而部分前瞻性客戶已啟動專項采購流程,將國產(chǎn)推理引擎納入采購流程,這標志著市場對純國產(chǎn)技術棧的認可度正在提升。
當前,DeepSeek的出現(xiàn)證明國產(chǎn)大模型已經(jīng)不輸世界一流模型了,如果不用上同樣好的國產(chǎn)顯卡和推理引擎,生態(tài)就不完整,只有生態(tài)好,算力國產(chǎn)化的目標才能更好實現(xiàn)。
我們的最終目標是:不管底層的硬件是什么,只要通過我們的軟件引擎,都能夠感受到相同性能的算力服務,規(guī)避掉硬件的差異。
抉擇·KPI壓力帶不來創(chuàng)新
新京報AI研究院:DeepSeek的團隊也很年輕,你怎么看待DeepSeek在創(chuàng)新方面的成功?
師天麾:DeepSeek做得很好,原因之一當然是他們招攬的人才非常厲害。我們組博二和博三的同學全部收到過DeepSeek的郵件。相比大廠,DeepSeek少了一些KPI的壓力,更類似于學校里博士從事的科研工作,即“找一個有意思的點,盡量去實現(xiàn)。做一件有意義的事情,但不要求給我?guī)矶嗌偈找妗薄?/p>
一旦有了KPI的壓力,往往就不敢去做收益不確定的事情,會更加傾向于復制已有的、明確的路徑,這不會冒險,但也做不出“特別不一樣”的東西。
新京報AI研究院:以你自身的經(jīng)歷來看,AI相關專業(yè)畢業(yè)生在初創(chuàng)企業(yè)、大廠與學??蒲兄g如何抉擇?在企業(yè)的經(jīng)歷和實驗室有何不同?
師天麾:我博士畢業(yè)后,就已經(jīng)有大廠發(fā)來了薪資很高的offer,但我當時更傾向于創(chuàng)業(yè),做一些不同的事。在大廠,大多情況下是“老板安排什么就做什么”,同時要背負一定KPI,如果被這些東西束縛住,可能一些事情將難以開展。當初如果我選擇了大廠,可能也會先待兩三年熟悉產(chǎn)業(yè)界,有了經(jīng)驗再出來創(chuàng)業(yè)。對于大廠來說,“你就值這個錢,你必須做這件事才能發(fā)揮價值?!?/p>
在清程極智,我們基本很少加班,氛圍開放并不“內(nèi)卷”。我們對自己的技術非常有信心,我們相信,頂級的技術人員不是逼著加班就能釋放出生產(chǎn)力的,最重要的是不受限制的創(chuàng)造力。
對于學界與企業(yè)的區(qū)別,學校的實驗室會更多地從技術角度分析一件事,比如大模型訓練推理系統(tǒng)的性能瓶頸在哪里,如何解決使其加速。在學校,1萬行代碼就能驗證一個想法,但要把這個想法變成可用、穩(wěn)定、幾乎沒有Bug的產(chǎn)品,可能需要幾十萬代碼。這就是企業(yè)要做的,對于企業(yè)的產(chǎn)品,性能好并不代表絕對好用,需要更多權衡,更多產(chǎn)品工程化。
同時,實驗室對于投產(chǎn)比沒有那么在意。企業(yè)則需要向投資人交代,試錯成本不能太大。最后,二者的節(jié)奏也有所不同,企業(yè)需要看市場上客戶真正需要什么,要從用戶角度來考慮市場的變化,并進行積極地適配。
記者聯(lián)系郵箱:luoyidan@xjbnews.com
新京報貝殼財經(jīng)記者 羅亦丹
編輯 王進雨
校對 楊許麗