螞蟻進入中美競爭！官宣利用中國芯片獲得AI突破：成本降低20%

文 / Becky 2025-03-24 03:55:48 來源：FX168

FX168財經報社(亞太)訊 3月24日，根據知情人士透露，由馬雲支持的螞蟻集團公司利用中國制造的芯片開發訓練人工智能模型的技術，該技術可將成本降低20%。

知情人士稱，螞蟻集團使用包括其關聯公司阿里巴巴和華為在內的國產芯片，利用混合專家機器學習方法來訓練模型。他們表示，其結果與英偉達公司H800等芯片類似。由於信息未公開，他們要求不具名。其中一位知情人士表示，螞蟻集團仍在使用英偉達進行人工智能開發，但現在其最新模型主要依賴於其他替代產品，包括超威半導體公和最新型號的中國芯片。

這些模型標誌着螞蟻集團進入中美公司之間的競爭，自DeepSeek展示如何以遠低於OpenAI和谷歌數十億美元的投資訓練出功能強大的模型以來，這場競爭一直在加速。這凸顯了中國公司如何試圖利用本地替代品來替代最先進的英偉達半導體。雖然H800並非最先進的產品，但它是一款相對強大的處理器，目前美國禁止其出口到中國。

該公司本月發布一份研究論文，稱其模型在某些基準測試中有時優於Meta Platforms公司，但彭博新聞尚未對此進行獨立核實。但如果它們像宣傳的那樣工作，螞蟻集團的平台可能會通過降低推理或支持人工智能服務的成本，標誌着中國人工智能發展又向前邁進了一步。

隨着公司在人工智能領域投入大量資金，混合專家模型已成為一種流行的選擇，並因谷歌和杭州初創公司DeepSeek等公司的使用而獲得認可。這種技術將任務分成更小的數據集，就像擁有一個專家團隊，每個人專注於一項工作的一部分，從而使流程更高效。螞蟻在一份電子郵件聲明中拒絕置評。

然而，混合專家模型的訓練通常依賴於英偉達銷售的圖形處理器(GPU)等高性能芯片。迄今為止，成本對於許多小型公司來說一直令人望而卻步，並限制了更廣泛的應用。螞蟻集團一直在研究更高效地訓練大型語言模型並消除這一限制的方法。其論文標題明確表明這一點，因為該公司的目標是在“沒有高端GPU”的情況下擴展模型。

這與英偉達首席執行官黃仁勳的觀點背道而馳。黃仁勳認為，即使像DeepSeek的R1這樣更高效的模型出現，計算需求也會增長，他認為，公司需要更好的芯片來創造更多收入，而不是更便宜的芯片來降低成本。他一直堅持構建具有更多處理核心、晶體管和更大內存容量的大型GPU的戰略。

彭博情報分析師Robert Lea表示，螞蟻集團的論文凸顯了中國人工智能領域日益增長的創新和加速的技術進步。如果該公司的說法得到證實，將凸顯出隨着中國轉向低成本、計算效率高的模型，以規避對英偉達芯片的出口管制，中國在人工智能領域實現自給自足的道路上進展順利。

螞蟻集團表示，使用高性能硬件訓練1萬億個tokens的成本約為635萬元人民幣（88萬美元），但其優化方法可以使用較低規格的硬件將成本降低至510萬元人民幣。Tokens是模型為了了解世界並向用戶查詢提供有用響應而攝取的信息單位。

知情人士稱，該公司計劃利用其開發的大型語言模型Ling-Plus和Ling-Lite的最新突破，為包括醫療保健和金融在內的工業人工智能解決方案提供支持。

螞蟻集團今年收購中國在線平台好大夫在線，以加強其在醫療保健領域的人工智能服務。它還擁有一款名為“支小寶”的人工智能“生活助手”應用程序和一款名為“螞蟻財富”的金融咨詢人工智能服務。

在英語理解方面，螞蟻集團在其論文中表示，Ling-Lite模型在關鍵基準測試中優於Meta的Llama模型之一。Ling-Lite和Ling-Plus模型在中國語言基準測試中均優於DeepSeek的同類模型。

北京人工智能解決方案提供商Shengshang Tech Co.首席技術官Robin Yu表示：“如果你找到一個擊敗世界頂級功夫大師的攻擊點，你也可以說你擊敗了他們，這就是為什麼實際應用很重要。”

螞蟻集團已將Ling模型開源。Ling-Lite包含168億個參數，這些參數是像旋鈕和撥盤一樣調節模型性能的可調設置。Ling-Plus包含2900億個參數，這在語言模型領域被認為是相對較大的。相比之下，專家估計ChatGPT的GPT-4.5包含1.8萬億個參數，DeepSeek-R1包含6710億個參數。

螞蟻集團在訓練的某些領域面臨挑戰，包括穩定性。該公司在論文中表示，即使硬件或模型結構的微小變化也會導致問題，包括模型錯誤率的跳躍。