近期,DeepSeek在全世界引起了廣泛的關(guān)注。高效推理、訓(xùn)練成本低、模型開源等特點使其脫穎而出。在遭受大規(guī)模惡意攻擊、美國國家安全調(diào)查等事件之后,英偉達、微軟、亞馬遜等美國巨頭又先后接入,證明了DeepSeek的實力和影響力。
以開放打破技術(shù)壁壘
推理能力強,訓(xùn)練成本低。DeepSeek得益于先進的模型架構(gòu)、首創(chuàng)的聯(lián)網(wǎng)推理能力以及數(shù)據(jù)與算法的雙重優(yōu)化等,其推理能力在多個基準(zhǔn)測試中表現(xiàn)出色,尤其針對中文推理能力的專項優(yōu)化,使其在理解中文復(fù)雜語境等方面表現(xiàn)出色。在實際使用DeepSeek后,筆者亦對其在數(shù)學(xué)、代碼等問題上的推理能力由衷贊賞。此外,這些技術(shù)組合也使得DeepSeek的訓(xùn)練成本遠(yuǎn)低于其他競爭對手。
據(jù)悉,DeepSeek-V3與GPT-4o性能接近,但訓(xùn)練成本僅為后者的十幾分之一。新發(fā)布的DeepSeek-R1性能對齊OpenAI-o1,但訓(xùn)練成本亦遠(yuǎn)低于后者。或受此影響,美國AI芯片巨頭英偉達總市值一周縮水5520億美元(約合4.3萬億港元),其他主要科技股亦出現(xiàn)不同程度下跌。
模型開源,提升AI普惠。除了在技術(shù)上的突破,DeepSeek的開源策略也獲得了廣泛的認(rèn)可,為其發(fā)展帶來了諸多積極影響。這種開放性打破了技術(shù)壁壘,展示了中國在AI領(lǐng)域的技術(shù)實力和開放態(tài)度,讓不同地區(qū)、不同背景的技術(shù)人員都能站在巨人的肩膀上進行探索和創(chuàng)新。個人亦可在自己的電腦部署和應(yīng)用DeepSeek模型。目前香港的多所大學(xué)都已經(jīng)開始使用或計劃使用DeepSeek進行研究和教學(xué),可見其開源策略的積極反響,未來有望惠及更多的科研和產(chǎn)業(yè)。
DeepSeek的出現(xiàn)讓AI領(lǐng)域的發(fā)展從“算力競賽”轉(zhuǎn)向了“效率創(chuàng)新”,不僅為國家AI領(lǐng)域的發(fā)展樹立了新的標(biāo)桿,也為香港創(chuàng)新科技提供了新的思路和方向。香港應(yīng)充分發(fā)揮自身的優(yōu)勢,與內(nèi)地協(xié)同合作,推動AI技術(shù)在金融、貿(mào)易等領(lǐng)域的深度融合,實現(xiàn)互利共贏。同時,還應(yīng)進一步加強在AI領(lǐng)域的研發(fā)投入和人才培養(yǎng),不斷提升自身的創(chuàng)新能力和競爭力。
2023年,DeepSeek創(chuàng)始人梁文鋒在接受媒體采訪時,探討了人才招聘的問題。他認(rèn)為,“如果追求短期目標(biāo),找現(xiàn)成有經(jīng)驗的人是對的。但如果看長遠(yuǎn),經(jīng)驗就沒那么重要,基礎(chǔ)能力、創(chuàng)造性、熱愛等更重要”。他表示,“我們的總結(jié)是,創(chuàng)新需要盡可能少的干預(yù)和管理,讓每個人有自由發(fā)揮的空間和試錯機會”。
進一步優(yōu)化政策環(huán)境
在2024年的采訪中,他再次強調(diào)了選人標(biāo)準(zhǔn)一直都是熱愛和好奇心,并采用自下而上、自然分工的策略,讓每位自帶想法的人,自主探索和互相協(xié)同。他亦表示,創(chuàng)新的MLA架構(gòu)即來自一位年輕研究員突發(fā)奇想設(shè)計的一個替代方案。
筆者認(rèn)為,這種策略是DeepSeek能夠快速成長和持續(xù)創(chuàng)新的關(guān)鍵之一,體現(xiàn)了對員工創(chuàng)造力的尊重和信任,從而激發(fā)了團隊的創(chuàng)新活力,這為香港創(chuàng)新生態(tài)建設(shè)提供了有益的參考。香港若能在鼓勵探索、支持創(chuàng)新、尊重個人、寬容失敗等方面持續(xù)完善和改進,并進一步優(yōu)化政策環(huán)境,為本地企業(yè)提供更多的支持和資源,將有助于吸引和培養(yǎng)更多像DeepSeek這樣的創(chuàng)新型企業(yè)和AI領(lǐng)域的杰出人才,進而推動整個行業(yè)的前進和發(fā)展。此外,香港若能在特區(qū)政府層面設(shè)立青年創(chuàng)科獎項、創(chuàng)科獎學(xué)金,鼓勵香港青年學(xué)習(xí)理科投身科技事業(yè),將有助于激發(fā)青年一代的創(chuàng)新熱情和科技夢想,為香港創(chuàng)新科技事業(yè)的長遠(yuǎn)發(fā)展注入源源不斷的新鮮血液。
港區(qū)全國人大代表、香港互聯(lián)網(wǎng)專業(yè)協(xié)會會長