大模型冷思考：企業(yè)“可控”價值創(chuàng)造空間還有多少？

2023-11-01 17:34 來源：A5專欄我來投稿撤稿糾錯

文 | 智能相對論

作者 | 葉遠風

毫無疑問，大模型熱潮正一浪高過一浪。

在發(fā)展進程上，從最開始的技術比拼到現(xiàn)在已開始全面強調商業(yè)價值變現(xiàn)，百度、科大訊飛等廠商都喊出類似“不能落地的大模型沒有意義”等口號。

在模型類型上，除了百度文心大模型、訊飛星火認知大模型、阿里通義千問大模型等通用大模型，醫(yī)藥研發(fā)、金融等垂直大模型正積極涌現(xiàn)。幾個月前，新華三集團在業(yè)內(nèi)首提“私域大模型”概念，并發(fā)布融合了行業(yè)屬性及地域屬性的私域大模型——“百業(yè)靈犀”LinSeer，為行業(yè)增添了企業(yè)落地大模型的創(chuàng)新類型。

而在更直接的數(shù)字上，截止到2023年10月初，國內(nèi)僅公開的大模型數(shù)量已達238個，百模大戰(zhàn)正在升級千模大戰(zhàn)。

……接近一年的熱潮后大模型沒有冷卻的跡象，行業(yè)普遍的共識形成，這不是風口，而是技術革命。

然而，歷史一次次證明，賽道越是熱鬧，參賽者越需要冷靜的思考。

種種跡象顯示，雖然看起來百花齊放，但事實上AI三大要素（算力、數(shù)據(jù)、算法），以及大模型發(fā)展的行業(yè)規(guī)則中，當下以及未來很多因素已經(jīng)既定，一頭熱扎進去的企業(yè)們，更應該尋找的是那些不由既成的客觀因素所限制、能夠進行自我價值發(fā)揮的地方，才能盡可能獲得相對競爭優(yōu)勢。

算力“積木化”，可控價值創(chuàng)造集中到“調度”環(huán)節(jié)

算力常常被視為大模型發(fā)展的瓶頸問題，但是，如果從是否“可控”的視角看，在業(yè)務層面企業(yè)能自己做出決定從而影響算力獲取的地方，其實越來越少。

IT時代Windows+Intel構建起WinTel體，演變?yōu)橐苿踊ヂ?lián)網(wǎng)時代安卓+ARM（以高通為代表），到了大模型時代，又進一步演化為AI大模型+GPU——在當前，Nvidia已經(jīng)成為大模型趨同的算力來源。

2021的Ampere（對應A100等）、2022年的Hopper（對應H100等）、2023的Ada架構……性價比高不高，要看Nvidia架構發(fā)展有多快。

算力不再是瓶頸，或者說，其“總體基本面”的提升并沒有什么操作空間——要多少算力就需要多少資本投入，反過來有多少資本投入基本也能買來多少算力。

當算力“口子”被外部技術、內(nèi)部預算等限定，通過調度提升既有資源利用效率，就成為企業(yè)“可控”的價值創(chuàng)造過程。特別是私域大模型，對于企業(yè)來說，AI大模型的大小需要平衡算力和能耗的開支，應選擇適合行業(yè)特點和業(yè)務特點的大模型進行私域部署。

此時，如何榨取硬件資源提供的每一滴能力，加速模型的訓練速度成為首要考慮的問題，而這方面術業(yè)有專攻，往往依賴基礎設施服務廠商——針對算力等底層基礎設施提供支撐成為考驗各個服務廠商最基本的能力，其中尤以算力調度能力是其重點。

算力調度往往需要多維能力協(xié)同，所以，作為業(yè)內(nèi)首倡私域大模型的新華三給出了自己的回答：依托通過傲飛算力平臺實現(xiàn)算力調度的“最優(yōu)解”，讓算力可以最大化的按需調度。另一方面以綠洲平臺實現(xiàn)大模型所需的數(shù)據(jù)支撐，同時在分布式訓練等需求下以智能無損網(wǎng)絡支持AI集群訓練，配備高性能存儲帶來更好的底層存儲支撐，甚至還建設有液冷數(shù)據(jù)中心來維持算力輸出的穩(wěn)定性，以此構成一套完整的智算解決方案。

而新華三算力調度的“主腦”傲飛算力平臺則具備異構計算資源統(tǒng)一管理、多元算力資源智能調度的能力，提供包含智能標注、智能訓練、智能調優(yōu)、智能部署、智能推理的全流程算力智能調度能力。

按官方數(shù)據(jù)，該平臺能夠將算力利用率提高至70%以上。同時，還支持8000節(jié)點的算力調度，并發(fā)訓練時間縮短至50%，且斷點自動接續(xù)無感知訓練更穩(wěn)定，在既有GPU資源下能全方面提升大模型訓練性能。

說白了，就是通過一系列算力流程環(huán)節(jié)的銜接優(yōu)化（尤其是面對并行計算與分布式計算需求），在充分保障訓練與應用需求的同時降低GPU的空閑時間，讓巨大成本獲取來的算力資源工作盡可能飽和。

總體而言，這一整套高性能算力集群及調度讓客戶能夠實現(xiàn)算力、存力、運力協(xié)同感知，實現(xiàn)算力資源充分供給、靈活部署、異構算力最優(yōu)調度——雖然有多少算力資源很難控制，但用好這些資源企業(yè)卻能夠做到完全可控。

當然，除了提升算力利用效率，行業(yè)中一些做法還在試圖通過其他方式直接降低模型訓練對GPU資源的要求，例如數(shù)據(jù)存儲層面進行算子優(yōu)化等，未來或也存在較大的價值開發(fā)空間。

數(shù)據(jù)“斷面化”，以數(shù)據(jù)質量建設帶來“護城河”成為企業(yè)的必然選擇

目前，企業(yè)能夠獲得的數(shù)據(jù)量來源主要包括公開的數(shù)據(jù)集與自身沉淀。

在當下時間斷面，這兩種都只能被動等待或由時間積累，數(shù)據(jù)“量”其實很難有突破，優(yōu)勢有就是有，沒有就是沒有，并不可控。

當然，也有一些企業(yè)試圖主動出擊，例如國外公司Inflection AI以大規(guī)模提問的方式來主動提升數(shù)據(jù)沉淀速度，但這顯然這并不會是主流。

“量”上不可控，則可控的價值創(chuàng)造空間必須更聚焦于“質”上。

中信智庫《人工智能十大發(fā)展趨勢》認為，“未來一個模型的好壞，80%由數(shù)據(jù)質量決定。”

從長遠視角看，大模型的競爭并不是要比誰跑得更快，而是比誰走得更遠，這就需要大模型真實的應用效果，也就需要通過各種方式提升數(shù)據(jù)質量，來鍛造大模型發(fā)展的“內(nèi)功”。

在數(shù)據(jù)的計劃、獲取、存儲、共享、維護、應用等環(huán)節(jié)，都需要針對性的數(shù)據(jù)管理、治理，最終提升數(shù)據(jù)質量。這是一個系統(tǒng)性工程，也為市面上的基礎設施服務商們帶來了機會。

例如新華三的綠洲平臺就以場景需求為導向，打造了一個圍繞數(shù)據(jù)采集、存儲、管理和應用的全棧數(shù)據(jù)平臺。

通過內(nèi)置AI算法，綠洲平臺大大提升了數(shù)據(jù)標記能力，讓數(shù)據(jù)治理、數(shù)據(jù)開發(fā)等過去很繁雜的流程工作變得極為簡單，而知識圖譜構建能力則幫助數(shù)據(jù)躍升為知識，從而能夠更好地被業(yè)務場景所使用。

事實上，數(shù)據(jù)深加工帶來高質量數(shù)據(jù)訓練一直是前沿大模型的核心競爭力所在，OpenAI一貫公開其訓練過程及算法，但對數(shù)據(jù)如何處理緘口不言。

回過頭來看，數(shù)據(jù)的“要素化”與“資產(chǎn)化”正在讓百行百業(yè)再次審視數(shù)據(jù)的價值，在數(shù)據(jù)越來越作為一種新型生產(chǎn)力要素的時代，大模型的本質可以視作一種挖掘數(shù)據(jù)要素價值的工具，而工具不決定價值，只決定效率。

大模型終將走入底層成為一種普遍的后端能力，技術本身越來越無法成為護城河，而數(shù)據(jù)則代表了企業(yè)在前端與客戶/用戶的連接程度，數(shù)據(jù)要素的價值釋放將成為企業(yè)真正的“護城河”。

所有的數(shù)據(jù)類平臺提升數(shù)據(jù)質量的過程，就是在幫助企業(yè)進一步挖掘數(shù)據(jù)要素價值、沉淀數(shù)據(jù)資產(chǎn)，真正打造企業(yè)的“護城河”。

算法“收斂化”，殊途同歸下企業(yè)需聚焦訓練效率提升

算法是大模型的能力核心，但長期來看，算法能力卻終將“收斂”。

目前的大模型算法基本上都基于Transformer架構，該架構解決了過去RNN架構難以并行化等核心缺陷，是基因“優(yōu)勝劣汰”的結果，BERT、GPT、T5、GLM等都其“衍生品”。

所以，算法生來都幾乎有著相同的“基因”。

而在開發(fā)框架層面，伴隨著開源生態(tài)建設，國外的TensorFlow、Pytorch，國內(nèi)的MindSpore等幾個主流框架逐步成為共同的選擇。

這意味著，算法的后天的“成長環(huán)境”也逐步趨同。

先天+后天，算法創(chuàng)新當下看起來百花齊放，但在未來其價值創(chuàng)新的空間將逐步收窄，企業(yè)能夠通過努力獲得的相對優(yōu)勢將越來越少。

甚至，在Llama 2掀起的開源浪潮下，算法創(chuàng)新的價值被進一步壓縮。

因此，從長期來看，企業(yè)最“可控”的價值創(chuàng)造將側重到訓練效率而非算法創(chuàng)新上——同樣的能力與潛力，PK更快速地訓練迭代。

很多廠商提供的開發(fā)工具鏈都在直接推進訓練效率，而一些原本旨在提供算力服務的平臺也實現(xiàn)了等價的功能。

例如，傲飛算力平臺支持斷點自動接續(xù)無感知訓練，其原本目的在于降低參數(shù)迭代期間的GPU資源等待、提升資源利用效率，但客觀上也直接帶來訓練效率的提升，讓算法加速迭代，先把潛力跑出來。

畢竟，加速算法訓練，就是在提升算力資源利用效率。

行業(yè)規(guī)則“沉淀化”：長期主義仍需回歸到正確的價值觀

大模型熱潮中，人人都會不自覺追求技術與商業(yè)價值“上限”，但大模型“下限”問題也日益突出，例如數(shù)據(jù)隱私、數(shù)據(jù)安全、知識產(chǎn)權、技術濫用等。

從企業(yè)的視角看，行業(yè)規(guī)則建立迫在眉睫，但其形成過程同樣存在著不由企業(yè)決定的“客觀因素”。

關于行業(yè)發(fā)展的一些法律法規(guī)，監(jiān)管部門在逐步沉淀，例如國家網(wǎng)信辦聯(lián)合多部門公布的《生成式人工智能服務管理暫行辦法》，企業(yè)要做的是等待并盡力配合與落實。

關于行業(yè)統(tǒng)一共識，也需要一個個沉淀，例如，目前已經(jīng)有從業(yè)者提議行業(yè)協(xié)作開發(fā)統(tǒng)一、可信的框架，在隱私保護、模型效用和訓練效率之間取得平衡，企業(yè)要做的是積極響應、積極參與。

但在一些規(guī)則上，企業(yè)能夠、也必須充分發(fā)揮“可控”的價值創(chuàng)造能力。

例如，大模型數(shù)據(jù)安全“容錯率低”，企業(yè)必須加大投入。

很多基礎設施廠商都提供了相關的服務，例如新華三的私域大模型百業(yè)靈犀以內(nèi)置安全限制提示詞和出入內(nèi)容過濾攔截對所有場景下大模型生成內(nèi)容進行安全性限制，針對所有出入流量和內(nèi)容進行安全審計和敏感信息攔截。

當然，最直觀反應大模型倫理、體現(xiàn)“下限”的是場景應用的選擇問題。

科研、制造、醫(yī)藥、法律……大模型已經(jīng)走向諸多能帶來社會正向價值的場景。但是，諸如偽造視頻進行詐騙等“場景應用”也已經(jīng)出現(xiàn)，基于強力的大模型技術有著更強的欺騙性。

技術是刀，大模型是一把更鋒利的刀，它的作用和價值由使用的人決定。

說到底，企業(yè)需要構建正確的價值觀，將大模型能力導向數(shù)字經(jīng)濟的正向價值上，才能守住“下限”、實現(xiàn)大模型的長期健康發(fā)展。

結語

大模型賽道上，企業(yè)必須在“可控”的價值創(chuàng)造空間上發(fā)力，才能不斷在各個維度獲得更多相對競爭優(yōu)勢與發(fā)展可能性。

企業(yè)也必須以此為標準選擇基礎設施服務、大模型服務的廠商，尤其是在多個維度都能滿足需要的廠商。

可以說，大模型給了這個時代全新的增量價值方向，只有幫助企業(yè)實現(xiàn)對“可控”價值創(chuàng)造的把握，才能讓企業(yè)在這個全新方向更有著力點。

*本文圖片均來源于網(wǎng)絡

#智能相對論 Focusing on智能新產(chǎn)業(yè)新服務，這是智能的服務NO.245 深度解讀

此內(nèi)容為【智能相對論】原創(chuàng)，

僅代表個人觀點，未經(jīng)授權，任何人不得以任何方式使用，包括轉載、摘編、復制或建立鏡像。

部分圖片來自網(wǎng)絡，且未核實版權歸屬，不作為商業(yè)用途，如有侵犯，請作者與我們聯(lián)系。

•AI產(chǎn)業(yè)新媒體;

•澎湃新聞科技榜單月度top5;

•文章長期“霸占”鈦媒體熱門文章排行榜TOP10;

•著有《人工智能十萬個為什么》

•【重點關注領域】智能家電（含白電、黑電、智能手機、無人機等AIoT設備）、智能駕駛、AI+醫(yī)療、機器人、物聯(lián)網(wǎng)、AI+金融、AI+教育、AR/VR、云計算、開發(fā)者以及背后的芯片、算法等。

申請創(chuàng)業(yè)報道，分享創(chuàng)業(yè)好點子。點擊此處，共同探討創(chuàng)業(yè)新機遇！

相關標簽: 大模型

中農(nóng)網(wǎng)旗下沐甜科技首發(fā)白糖AI大模型內(nèi)測，助推產(chǎn)業(yè)智能可持續(xù)發(fā)展

擁抱AI，賦能白糖產(chǎn)業(yè)創(chuàng)新發(fā)展隨著新一輪科技革命和產(chǎn)業(yè)變革深入發(fā)展，行業(yè)數(shù)字化轉型進入深水區(qū)，人工智能產(chǎn)業(yè)規(guī)?？焖僭鲩L。大模型的出現(xiàn)，將躍升人工智能供給能力，更好應對行業(yè)數(shù)智化升級面臨的挑戰(zhàn)，帶來新發(fā)展機遇。2023年，隨著OpenAI公司大模型ChatGPT4.0的發(fā)布，今年科技領域乃至各行各業(yè)的

標簽：

大模型
“跌跌不休”：大模型怎么不香了？

“跌跌不休”：大模型怎么不香了？

標簽：

大模型
大模型“淘金”的創(chuàng)業(yè)者，陣痛比紅利來的還早？

根據(jù)北京市經(jīng)信局公布的數(shù)據(jù)，截止到2023年10月初，國內(nèi)公開的AI大模型數(shù)量已經(jīng)達到238個。盡管學術界對大模型的參數(shù)量并沒有明確的標準，許多10億級參數(shù)的模型并不能和GPT4相提并論，國內(nèi)大模型的爆發(fā)式增長，無疑揭示了一個既定事實：和每一次風口出現(xiàn)時一樣，總有人一窩蜂地涌入，試圖在新一輪的創(chuàng)業(yè)潮

標簽：

大模型

創(chuàng)業(yè)者
大模型應用瘋狂加速，洗牌卻在靜悄悄進行了

隨著未來不斷有新的企業(yè)通過備案，“大模型+”的應用拐點正在到來。

標簽：

大模型
大模型深挖數(shù)據(jù)要素價值：算法、算力之后，存儲載體價值凸顯

存儲之輪，如何推動大模型加速前進？

標簽：

大模型

“創(chuàng)造市場”與“算法進化”，中美AI競速的岔路口

“人工智能的商業(yè)模式，是要創(chuàng)造一個市場，而非一個算法”。這是世界AI泰斗MichaelI.Jordan的觀點。而當前的全球AI市場，占據(jù)主導地位的中美雙方，卻也走出了兩條截然不同的技術路徑，前者執(zhí)著于前沿技術的探索，后者則發(fā)力應用優(yōu)化和商業(yè)化落地。南轅北轍的兩個方向，或許已經(jīng)無法直接進行排位先后、優(yōu)

標簽：

ai智能
智能體進化發(fā)展了一年，現(xiàn)在的RPA Agent迭代到什么程度了？

智能體進化發(fā)展了一年，現(xiàn)在的RPAAgent迭代到什么程度了？從實在智能最新發(fā)布的實在Agent7.0，看RPAAgent的迭代升級抓取豆瓣信息、自己制作PPT，這款AIAgent真的實現(xiàn)了流程全自動化AIAgent構建到執(zhí)行全自動化，持續(xù)進化RPAAgent再次降低智能體應用門檻實在智能重磅發(fā)布實
崔大寶：大模型降溫背后的難點、卡點、節(jié)點

崔大寶｜節(jié)點財經(jīng)創(chuàng)始人進入2024年，大模型似乎有熄火之勢：資本市場，與之關聯(lián)的概念炒不動了，英偉達股價動輒暴跌重挫，引發(fā)“泡沫戳破”的擔憂；消費市場，BATH們的推新活動少了，產(chǎn)品更新迭代的速度慢了，民眾的關注度降了……熱鬧的大概只剩下兩場酣仗：自5月15日字節(jié)跳動宣布“以厘計費”，打響國內(nèi)大模型

標簽：

大模型
這一屆“出道”的數(shù)字人，已經(jīng)拿捧上了“鐵飯碗”

文|智能相對論作者|陳泊丞好消息！你心心念念的事業(yè)單位發(fā)錄取公告了！壞消息！他們沒錄你，錄了個數(shù)字人。圖片來源網(wǎng)絡隨著數(shù)字人技術的突破，越來越多的傳統(tǒng)企業(yè)和機構開始用上了“數(shù)字員工”。甚至很多中國人心心念念的“鐵飯碗”，也被這些數(shù)字人給捧上了。數(shù)字人捧上了“鐵飯碗”簡單翻看一下全國各地事業(yè)單位的“錄

標簽：

數(shù)字人
來到IPO關口，地平線離“三分天下”還有多遠？

黑芝麻智能敲鐘后，港交所門口又有一些智駕芯片企業(yè)引發(fā)關注。據(jù)悉，近日地平線已通過中國證監(jiān)會IPO備案，擬發(fā)行不超過11.5億股境外上市普通股并在香港聯(lián)合交易所上市，預計籌集約5億美元資金。從天眼查可以了解到，該公司成立于2015年，是一家乘用車高級輔助駕駛（ADAS）和高階自動駕駛（AD）解決方案供
對標GPT-4o，科大訊飛正以大模型重塑語音產(chǎn)業(yè)

大模型的創(chuàng)新與未來

標簽：

科大訊飛

機器人大會引領產(chǎn)業(yè)動向，卓翼飛思繪制無人系統(tǒng)教科研新藍圖

8月21日，萬眾矚目的2024世界機器人大會暨博覽會在北京亦創(chuàng)國際會展中心盛大開幕。這場為期5天，集“展覽”“論壇”“賽事”于一體的機器人盛會，反映了當下機器人領域的繁榮生態(tài)。據(jù)官方統(tǒng)計數(shù)據(jù)，今年現(xiàn)場逛展觀眾高達25萬人次，比去年增加25%。機器人行業(yè)有多火?看看2024世界機器人大會火爆程度便可知
卓翼智能：超大載重高烈度環(huán)境特種智能系留無人平臺的應用與未來

瞄準場景需求，打造國內(nèi)領先的自主可控、高質量超大載重高烈度環(huán)境特種智能系留無人平臺。卓翼智能亮相HICOOL峰會以科技實力榮摘創(chuàng)業(yè)大賽一等獎這個比賽5年培育出16家“獨角獸”HICOOL2024全球創(chuàng)業(yè)者峰會暨創(chuàng)業(yè)大賽已于8月25日在北京圓滿落下帷幕，大賽共吸引了124個國家和地區(qū)的7406個創(chuàng)業(yè)項
60萬獎金召喚AI創(chuàng)新者，2024無錫國際人工智能創(chuàng)新應用大賽火熱進行中！

人工智能是新一輪科技革命和產(chǎn)業(yè)變革的重要驅動力量。無錫市作為中國的科技創(chuàng)新中心之一，正通過構建人工智能"算力+算法+數(shù)據(jù)"三要素齊備的產(chǎn)業(yè)生態(tài)，為產(chǎn)業(yè)技術創(chuàng)新應用提供強大支撐，通過“AI+”行動推動人工智能與多個產(chǎn)業(yè)交叉融合，實現(xiàn)技術落地和產(chǎn)業(yè)化，加速形成新質生產(chǎn)力，打造具有國際競爭力的產(chǎn)業(yè)創(chuàng)新智造
“云+AI”驅動操作系統(tǒng)創(chuàng)新升級，龍蜥堅持可持續(xù)發(fā)展路線

近日，2024龍蜥操作系統(tǒng)大會（OpenAnolisConference）在北京圓滿召開，此次大會由中國計算機學會開源發(fā)展委員會、中關村科學城委員會、海淀區(qū)委網(wǎng)信辦、中國開源軟件推進聯(lián)盟指導，龍蜥社區(qū)主辦，阿里云、浪潮信息、Intel、中興通訊、Arm、中科方德等24家理事單位共同承辦，主題為“進化

加載更多

南通颐猩文化传播有限公司

大模型冷思考：企業(yè)“可控”價值創(chuàng)造空間還有多少？

相關文章

中農(nóng)網(wǎng)旗下沐甜科技首發(fā)白糖AI大模型內(nèi)測，助推產(chǎn)業(yè)智能可持續(xù)發(fā)展

“跌跌不休”：大模型怎么不香了？

大模型“淘金”的創(chuàng)業(yè)者，陣痛比紅利來的還早？

大模型應用瘋狂加速，洗牌卻在靜悄悄進行了

大模型深挖數(shù)據(jù)要素價值：算法、算力之后，存儲載體價值凸顯

“創(chuàng)造市場”與“算法進化”，中美AI競速的岔路口

智能體進化發(fā)展了一年，現(xiàn)在的RPA Agent迭代到什么程度了？

崔大寶：大模型降溫背后的難點、卡點、節(jié)點

這一屆“出道”的數(shù)字人，已經(jīng)拿捧上了“鐵飯碗”

來到IPO關口，地平線離“三分天下”還有多遠？

對標GPT-4o，科大訊飛正以大模型重塑語音產(chǎn)業(yè)

機器人大會引領產(chǎn)業(yè)動向，卓翼飛思繪制無人系統(tǒng)教科研新藍圖

卓翼智能：超大載重高烈度環(huán)境特種智能系留無人平臺的應用與未來

60萬獎金召喚AI創(chuàng)新者，2024無錫國際人工智能創(chuàng)新應用大賽火熱進行中！

“云+AI”驅動操作系統(tǒng)創(chuàng)新升級，龍蜥堅持可持續(xù)發(fā)展路線

熱門排行

編輯推薦