2025年初,全球人工智能領域的聚光燈突然轉向一家名不見經傳的中國初創公司——杭州深度求索人工智能基礎技術研究有限公司(DeepSeek)。這家企業憑借一款名為“DeepSeekV3”的大語言模型引發全球轟動。
DeepSeek的故事始于中國杭州的一間共享辦公室,深度求索公司成立于2023年7月17日,由知名量化資管巨頭幻方量化創立。創始團隊由梁文鋒等幾位年輕科學家組成,創業初期立下DeepSeek的理想主義:開源、降本與AI普惠。
2024年1月5日發布DeepSeek LLM,這是深度求索的第一個大模型。2024年12月26日晚,DeepSeek正式上線全新系列模型DeepSeek-V3首個版本并同步開源。這個大模型有6710億參數,激活參數為370億,在14.8萬億token(詞元)上進行了預訓練。在沒有預熱、沒有炒作的情況下,“DeepSeek-V3”模型迅速走紅,達到了令人咋舌的程度。
官方數據顯示,該模型多項評測成績超越了頭部開源模型,它在性能上與世界頂尖的閉源模型GPT-4o不分伯仲。令AI界感到不可思議的是這款大模型的訓練成本極其低廉。官方技術論文披露,DeepSeek-V3在預訓練階段僅使用2048塊GPU訓練了2個月,且只花費557.6萬美元。而GPT-4o的模型訓練成本約為1億美元。憑借獨有的技術架構與算法優化,DeepSeek大幅削減模型研發與運維成本,實現低成本高回報。以達成與OpenAI o1模型相當性能為例,耗費資金僅為其3%-5%,這引起了硅谷的巨大轟動。要知道,OpenAI一直在巨虧——僅去年就“燒”掉了50億美元。其2023年至2028年預計累計虧損高達440億美元,2026年的支出可能攀升至95億美元。
Meta CEO扎克伯格則評價說,DeepSeek展現出的技術實力和性能令人印象深刻,并指出中美之間的AI差距已經微乎其微。
Meta首席AI科學家Yann Lecun表示,DeepSeek-R1面世與其說意味著中國公司在AI領域正在超越美國公司,不如說意味著開源大模型正在超越閉源。他在社交媒體直言:“西方公司該醒醒了,中國同行正在定義新的游戲規則?!?/p>
前谷歌首席執行官埃里克·施密特表示,DeepSeek的崛起標志著全球人工智能競賽的“轉折點”,證明中國可以用更少的資源與大型科技公司競爭。
微軟首席執行官薩提亞?納德拉在瑞士達沃斯的世界經濟論壇上表示:“DeepSeek的新模型令人印象深刻,尤其是在如何高效開發開源模型并進行推理計算方面,它的計算效率非常出色。我們應當非常、非常認真地對待來自中國的這些技術進展?!?/p>
英偉達在聲明中指出,DeepSeek在人工智能技術的創新與應用方面,展現了難以置信的成就。
DeepSeek的確在全球技術領域豎起了一個重要的里程碑。中國科學家以超人的智慧應對美國對中國高端芯片的封殺,以低功能芯片和低成本殺入世界頂級AI大模型的巔峰。
DeepSeek以令人稱奇的使用體驗帶來強勁的擴散效應,在蘋果AppStore應用商店美國區登頂,超越了長期霸榜的ChatGPT。有報道說,目前160多個國家或地區下載榜同時登頂!僅俄羅斯就有超過500萬人下載使用。隨著人們下載使用體驗感的提升,相信這款大模型的全球下載量將越來越多,前途不可限量。
DeepSeek異軍突起,實力盡顯鋒芒。中國用戶面對DeepSeek這種強大的人工智能,從質疑、體驗到全民狂歡似乎是一夜之間。的確,AI已經把未來送到了每個人的家門口。今日頭條和小紅書等各大平臺上處處都是使用這一大模型的體驗和指令輸出范例,稱奇者比比皆是。
DeepSeek的成功,不僅象征著中國在AI領域科技實力的大幅提升,更顯現著中國在全球未來科技競爭中話語權份量在增強?!督鹑跁r報》將其描述為“震驚國際科技界的黑馬”,認為其性能已與資金雄厚的OpenAI等美國競爭對手的模型相媲美?!督洕鷮W人》表示,認為中國AI技術在成本效益方面的快速突破,已經開始動搖美國的技術優勢。
BBC則報道稱,中國新推出的人工智能應用程序DeepSeek以驚人的速度震撼了科技行業、市場以及美國在人工智能領域的優越感。
據報道,DeepSeek大模型遭遇了史上最大規模網絡攻擊,溯源顯示攻擊源來自美國。1月28日凌晨,DeepSeek官網的服務狀態頁面發布了一份緊急聲明,指出其線上服務近期遭遇了大規模的惡意攻擊。由于此次攻擊的影響,新用戶的注冊過程變得異常繁忙,甚至有時無法完成,DeepSeek迅速調整了服務器的配置和策略,加強了網絡安全防護,有效地抵御了攻擊的進一步蔓延。他們與多家知名的網絡安全公司建立了緊密的合作關系,共同應對這次攻擊。
DeepSeek正全力加快AI智能生態的發展和豐富,加快從工具到生態的躍進。近日,DeepSeek團隊正式發布了兩款多模態框架——Janus-Pro和JanusFlow。其中,Janus-Pro是一款統一多模態理解與生成的創新框架,通過解耦視覺編碼的方式,極大提升了模型在不同任務中的適配性與性能,不僅展示了DeepSeek在技術創新方面的實力,也為用戶提供了更加多樣化和高效化的AI服務。
從“無名之輩”到“現象級AI公司”,從技術自信到生態布局,DeepSeek的崛起已超越商業范疇。以技術奇點重新定義AI賽道的底層邏輯和大模型范式,已經打破從技術、產業到資本市場對AI發展的固有認知,掀起了一場前所未有的技術變革,它正在演繹的是未來科技智慧之戰,或者說是技術理想主義與國家使命的演進。中國科技正在為人類命運共同體提供數字時代的創新范例,這是一場技術理想主義與國家宏大戰略的共振,更是一個古老文明在智能時代的強勢宣言。
AI來自于人類的智慧,并將催化智慧之光。智能文明時代需要更多的深度求索公司,相信中國科技界會涌現出更多的創新“黑馬”?。?span style="font-kerning: none;">中國日報網特約撰稿人:鞠傳江)
?