南通颐猩文化传播有限公司

  1. 創(chuàng)業(yè)頭條
  2. 前沿領(lǐng)域
  3. AI智能
  4. 正文

誰該成為大模型成長的“養(yǎng)料”?

 2024-08-09 17:31  來源:A5專欄  我來投稿 撤稿糾錯

  域名預(yù)訂/競價,好“米”不錯過

有關(guān)“AI將要取代人工”的言論甚囂塵上,且不再局限于科技幻想,而是真實地走進了現(xiàn)實世界。

先是蘿卜快跑落地,導(dǎo)致大批網(wǎng)約車司機不滿,隨后,番茄小說上線“AI作者”一日同更三本書讓網(wǎng)文作者如臨大敵。

接著,與番茄小說同屬于字節(jié)跳動的“豆包”被爆出正全網(wǎng)搜索小說素材,以便“喂養(yǎng)”番茄的AI作者。更有意思的是,這出風(fēng)波波及到了在線文檔領(lǐng)域。據(jù)悉,有網(wǎng)友在社交平臺表示,稱豆包的搜羅范圍不僅在網(wǎng)文界,手還伸向了在線文檔內(nèi)作者尚未發(fā)布的內(nèi)容。

其中,WPS首當(dāng)其沖。

WPS官方為此不得不緊急辟謠。但除了WPS,幾乎所有在線文檔APP都遭受了一番審查,包括石墨、騰訊文檔、印象筆記、墨客、橙瓜……最終很多人發(fā)現(xiàn),當(dāng)AI風(fēng)口來襲,網(wǎng)絡(luò)世界哪里都不安全。

這也不算空穴來風(fēng)。去年,WPS就被爆出在用戶協(xié)議里增添了AI訓(xùn)練條例,盡管這兩年官方一直在據(jù)理力爭地辟謠,但很多用戶還是不肯給予信任,“羅生門”大戲就此上演。

用戶在擔(dān)心自己辛苦創(chuàng)作的內(nèi)容,成了他人的嫁衣,而AI背后的資本則一心想當(dāng)“普羅米修斯”,為大模型到處搜集“火種”。

在線文檔,集體奔向AI

這些年,在線文檔面臨了太多壓力:諸如研發(fā)停滯、用戶流失、同行內(nèi)卷、廣告營收疲軟…

在線文檔遇到創(chuàng)新乏力已是不爭的事實,WPS作為行業(yè)代表,也難逃這一困境。在入局AI之前,WPS最高調(diào)的一次革新還在2018年,當(dāng)年,騰訊文檔橫空出世,讓W(xué)PS一時倍感焦灼,在前者上線三個月后,后者宣布升級。

尤其增加了多人協(xié)作功能,WPS還一度把這部分單獨拿了出來。但時至今日,云協(xié)同早已遍地皆是,飛書、釘釘、企微這類企業(yè)APP、石墨這類在線文檔玩家,甚至各種云辦公文檔小程序都能做到。

值得一提的是,前幾年外部環(huán)境造就了一波線上辦公熱,也間接火了一大批在線文檔APP,其中,印象筆記、石墨文檔這類小眾玩家人氣激增。數(shù)據(jù)顯示,2020年線上辦公爆發(fā)初期,印象筆記的C端用戶使用量翻了四五倍,石墨文檔的新增用戶量和企業(yè)注冊數(shù)增長了約6倍。

同年,騰訊文檔宣布月活突破1.6億后,內(nèi)卷開始成為行業(yè)生態(tài),整個行業(yè)也開始陷入了漫長的瓶頸期。

直到大模型的爆發(fā),情況開始有所轉(zhuǎn)變。

2023年財報顯示,WPS Office國內(nèi)個人辦公服務(wù)訂閱營收到達了26.5億,同比增長近30%,月活設(shè)備數(shù)高達5.98億。

在線文檔發(fā)力AI已經(jīng)成為不可避免的一個趨勢。艾媒咨詢數(shù)據(jù)顯示,隨著大語言模型和AIGC的規(guī)模化落地應(yīng)用,AIGC+協(xié)同辦公場景將有效帶動行業(yè)增長,2023年協(xié)同辦公市場規(guī)模預(yù)計達330.1億元

AI成了在線文檔們穩(wěn)固市場地位,留住用戶的重要手段。而WPS入局AI的心情則更為急切。畢竟在ChatGPT的火爆出圈后,在線辦公市場算是最方便落地的場景之一,隔壁微軟在OpenAI的GPT-4剛發(fā)布之時,就結(jié)合大語言模型LLM上線了Microsoft 365。

一直以來,WPS Office都與微軟Office針鋒相對。公開資料顯示,微軟Office和WPS Office在國內(nèi)市場Windows平臺的平均市場覆蓋率分別為81.5%和68.7%。微軟Office在PC端領(lǐng)先一步,后者在移動端則更有優(yōu)勢。

不可否認,微軟對AI的布局強烈刺激了WPS,可需要注意的是,開始關(guān)注AI的絕不止WPS一家。從國內(nèi)企業(yè)來看,百度有智能辦公平臺如流,釘釘更是背靠通義千問,印象筆記發(fā)布“印象AI”,飛書發(fā)布“My AI”……

巨頭們想利用AI更上一層樓,那些資金不足以入局AI的小眾玩家,也開始在曲線救國,選擇與大廠合作,這也是本次“豆包盜文”引發(fā)在線文檔圈集體淪陷的由來。

總而言之,在線文檔正熱情奔向AI,不管誰先勝出,要承擔(dān)“喂養(yǎng)”任務(wù)的用戶都成了最無辜的人,當(dāng)他們輪流奔走在不同的平臺上,試圖繞開這一步時,竟悲哀的發(fā)現(xiàn),自己似乎早已無路可逃。

大模型訓(xùn)練背后的“原罪”

據(jù)悉,百度的文心一言已服務(wù)8.5萬家企業(yè)客戶,阿里的通義千問已服務(wù)了9萬家企業(yè)客戶,截至2024年5月15日,字節(jié)的豆包總下載量超過1億,雙端月活破2600萬……

當(dāng)大模型炙手可熱,AI訓(xùn)練自然被外界所關(guān)注。公開資料顯示,大模型訓(xùn)練步驟一般分為五步:數(shù)據(jù)收集和處理、模型設(shè)計與測試、模型訓(xùn)練、評估和優(yōu)化以及模型部署與維護。

這其中,第一步至關(guān)重要。也正是這一步,造就了如豆包、WPS AI此類的諸多爭議。

大模型訓(xùn)練與進化的基礎(chǔ)是數(shù)據(jù),但在AI發(fā)展進程中,數(shù)據(jù)來源是否合規(guī)成了這個賽道未來有無持續(xù)性的前提,否則,版權(quán)、隱私等疑云便會紛至沓來。在AI觸怒網(wǎng)文作者之前,畫手圈就已經(jīng)有了先例。

去年年底,小紅書AI繪畫模型Trik被國內(nèi)幾位畫師聯(lián)手起訴,理由是Trik未經(jīng)授權(quán)使用了畫師的原創(chuàng)作品作為訓(xùn)練數(shù)據(jù),生成了與原作高度相似的圖片,侵犯了創(chuàng)作者的合法權(quán)益。360創(chuàng)始人周鴻祎也因涉及“AI盜圖”被全網(wǎng)群嘲。

海外也是一樣,有報道顯示,有1.6萬名英國藝術(shù)家聯(lián)名,對OpenAI和其他人工智能公司發(fā)起集體訴訟;甚至就連NYT也向法院起訴OpenAI和微軟侵犯版權(quán)。

在科技進步的歷史征程里,我們享受技術(shù)成果之前,似乎總要付出一些“隱形”成本。但這個成本應(yīng)該由誰來承擔(dān)則值得探討。

事實上,大模型訓(xùn)練之所以將觸手伸向普通群體,歸根到底還是因為企業(yè)發(fā)展大模型的成本居高不下,投入實用后又遲遲無法達到可觀的收益。當(dāng)前OpenAI、Midjourney、文心一言、訊飛星火大模型雖然均已開啟付費模式,然而,大模型企業(yè)想要進入盈利階段仍然還有一段距離要走。

以頭部的OpenAI為例,調(diào)查顯示,雖然其在今年前兩個季度的收入不錯,年度經(jīng)常收入增長到了34億美元,但由于構(gòu)建和運行模型的成本高昂,虧損狀態(tài)始終沒能改善;ChatGPT會員付費收入達到50%以上,但偏向企業(yè)和開發(fā)者端的API收入占比僅為15%左右。

國內(nèi)這邊,Kimi目前的獲客成本還在12元以上、WPS AI總結(jié)一個萬字文檔、輸出千字摘要,仍舊需要2.64元……可行業(yè)內(nèi)的價格戰(zhàn)卻突然開始了。此前,GPT-4o mini正式上線,每100萬Token的輸入/輸出分別是15美分/60美分。

在這樣的背景下,大模型界呈現(xiàn)精彩的“眾生相”:被侵權(quán)的用戶義憤填膺、成本與營收不對稱的企業(yè)騎虎難下,而資本則開始生出退場的心思。來覓PEVC數(shù)據(jù)顯示,2024年一季度,人工智能領(lǐng)域合計發(fā)生融資案例198起,同比減少20.80%。

在過往的歷史經(jīng)驗里,當(dāng)技術(shù)進步與倫理道德產(chǎn)生沖突,科技發(fā)展總會被視為某一方面的“原罪”,但應(yīng)該背負原罪真的是科技嗎?

創(chuàng)新與制約同存

關(guān)于AI能否取代人類,這個問題最早誕生于科幻片年代,隨著大模型掀起全球科技狂潮,在戲劇化之外,似乎也增添了幾分可能性。蘿卜快跑惹起一眾司機抗YI、網(wǎng)文作者聯(lián)名上shu抵制番茄,都成了現(xiàn)代科技文明史上的一次開端。

7月6日,2024世界人工智能大會在上海落下帷幕,金融、教育、醫(yī)療成為重點應(yīng)用落地方向。實際上,在ChatGPT 發(fā)布的時候,海外就有人專門統(tǒng)計過“哪些工作更有可能被 AI 替代”。

一位博主在Upwork(全球最大的自由職業(yè)平臺)統(tǒng)計了從ChatGPT 發(fā)布前一個月到 2024 年 2 月 14 日的一些自由職業(yè)工作數(shù)據(jù)。調(diào)查發(fā)現(xiàn),受ChatGPT 的影響,Upwork 上波及最大的幾個圈子是寫作、翻譯、客服服務(wù)。其中,翻譯淪為被AI取代的重災(zāi)區(qū),工作數(shù)量下降了19%,時薪也下降了20%。

但在這些支持人工智能搶人類“飯碗”的數(shù)據(jù)表象背后,卻也存在著相反的趨勢:從宏觀角度來看,不少工作因為ChatGPT 的出現(xiàn)反而更多了。

統(tǒng)計顯示,尤其是可以用大模型為基礎(chǔ)的創(chuàng)作型工作,吃到了AI的第一波“紅利”。在Upwork 上,ChatGPT 發(fā)布之后,視頻編輯/制作工作數(shù)量增加了 39%,平面設(shè)計工作增加了 8%,網(wǎng)頁設(shè)計工作增加了 10%。軟件開發(fā)工作也有所增加,后端開發(fā)工作增加了 6%,前端/網(wǎng)頁開發(fā)工作增加了 4%。

科技的雙面性就此凸顯,AI并不是人人喊打,起碼在保障用戶基本利益的前提下,落地到具體生活里的好處遠遠大于弊端。國內(nèi)也是如此。例如在2023年,閱文的起點國際出海的網(wǎng)文作品里,有20%是AI來翻譯的。

當(dāng)然,AI應(yīng)用導(dǎo)致的爭議性問題從來沒有消失。

在網(wǎng)文作者與畫手質(zhì)疑版權(quán)外,學(xué)術(shù)界的大模型論文熱也在擊穿該領(lǐng)域的落地意義。以“中華醫(yī)學(xué)雜志”為例,從去年七月,該刊發(fā)現(xiàn)AI生成的論文數(shù)據(jù)每月都在上升,一度超過了50%。

目前,《中華醫(yī)學(xué)雜志》已發(fā)布AIGC技術(shù)使用的有關(guān)規(guī)定,輕者退稿或撤稿;情節(jié)嚴重者,將列入作者學(xué)術(shù)失信名單。

從這些案例中,我們不難看出,已經(jīng)有行業(yè)意識到AI應(yīng)用要基于一些必要的規(guī)則下施行。之所以我們面對各類在線文檔AI化而草木皆兵,本質(zhì)是因為當(dāng)前的AI規(guī)范還沒到位。

為此,官方出臺的相關(guān)政策也越來越多,國內(nèi)有《生成式人工智能服務(wù)管理暫行辦法》、國際方面,歐洲議會在今年3月份通過了《人工智能法案》等等……而如何保證在不扼殺創(chuàng)新的同時,又合理的培養(yǎng)大模型、使用大模型,正成為整個行業(yè)的新節(jié)點。

種種跡象顯示,大模型的出現(xiàn),是人類科技文明豐碑上不可磨滅的一個符號,同時,也是一份沉重的責(zé)任,需要更多人去主動承擔(dān)。

至于誰該成為大模型成長的“養(yǎng)料”,肯定不能只讓普通用戶成為唯一的代價。

道總有理,曾用名歪道道,互聯(lián)網(wǎng)與科技圈新媒體。同名微信公眾號:道總有理(daotmt)。本文為原創(chuàng)文章,謝絕未保留作者相關(guān)信息的任何形式的轉(zhuǎn)載。

申請創(chuàng)業(yè)報道,分享創(chuàng)業(yè)好點子。點擊此處,共同探討創(chuàng)業(yè)新機遇!

相關(guān)標(biāo)簽
大模型

相關(guān)文章

  • 百川智能,摘下“大模型皇冠上的明珠”?

    隨著AI產(chǎn)業(yè)化和產(chǎn)業(yè)AI化成為業(yè)界共識,大模型的“新賽季”來了。2024年是國產(chǎn)大模型全面商業(yè)化的元年,各地人工智能產(chǎn)業(yè)發(fā)展的政策密集出臺。同時,在2024世界人工智能大會(WAIC2024)上,各大AI廠商紛紛表示要讓大模型落地應(yīng)用場景。不過,對于大模型商業(yè)化的路線,科技巨頭和大模型初創(chuàng)公司之間存

    標(biāo)簽:
    大模型
  • 最后一公里不解決,大模型開閉源都一文不值

    對所有大模型而言,其真正考驗如同科大訊飛創(chuàng)始人劉慶峰所說,在最后一公里的應(yīng)用和商業(yè)化落地上。作者|Cindy編輯|楊銘恐怕誰也不會想到,百模大戰(zhàn)進入商業(yè)化下半場,圍繞大模型大規(guī)模、曠日持久的戰(zhàn)爭,竟是開源和閉源路線的交鋒。最近,在2024世界人工智能大會(WAIC)上,劉慶峰、李彥宏、王堅、朱嘯虎、

    標(biāo)簽:
    大模型
  • 對于“百模大戰(zhàn)”,幾乎所有大佬的口風(fēng)都180 °大轉(zhuǎn)變了?

    文|智能相對論作者|陳泊丞在2024世界人工智能大會暨人工智能全球治理高級別會議產(chǎn)業(yè)發(fā)展主論壇上,百度創(chuàng)始人、董事長兼首席執(zhí)行官李彥宏談了些對于AI大模型的看法,語驚四座。他先是指出,“百模大戰(zhàn)造成了社會資源的巨大浪費,尤其是算力的浪費。但同時也使得我們追趕世界上最先進基礎(chǔ)模型的能力得到了建立?!倍?/p>

    標(biāo)簽:
    大模型
  • 飛書、釘釘、企業(yè)微信的大模型“三國殺”

    飛書、釘釘、企業(yè)微信的大模型“三國殺”

  • 蘋果AI的國產(chǎn)大模型之爭,沒有懸念

    文|智能相對論作者|陳泊丞蘋果終于公布了最新的AI進程。一個月前,正如此前預(yù)期的那樣,人工智能是今年WWDC發(fā)布會的焦點。全程105分鐘的主題演講,就有40多分鐘用于介紹蘋果的AI成果。蘋果似乎還有意玩了一把“諧音梗”,重新定義AI為“AppleIntelligence”。但不管怎么說,此次蘋果AI

    標(biāo)簽:
    大模型
  • “創(chuàng)造市場”與“算法進化”,中美AI競速的岔路口

    “人工智能的商業(yè)模式,是要創(chuàng)造一個市場,而非一個算法”。這是世界AI泰斗MichaelI.Jordan的觀點。而當(dāng)前的全球AI市場,占據(jù)主導(dǎo)地位的中美雙方,卻也走出了兩條截然不同的技術(shù)路徑,前者執(zhí)著于前沿技術(shù)的探索,后者則發(fā)力應(yīng)用優(yōu)化和商業(yè)化落地。南轅北轍的兩個方向,或許已經(jīng)無法直接進行排位先后、優(yōu)

    標(biāo)簽:
    ai智能
  • 智能體進化發(fā)展了一年,現(xiàn)在的RPA Agent迭代到什么程度了?

    智能體進化發(fā)展了一年,現(xiàn)在的RPAAgent迭代到什么程度了?從實在智能最新發(fā)布的實在Agent7.0,看RPAAgent的迭代升級抓取豆瓣信息、自己制作PPT,這款A(yù)IAgent真的實現(xiàn)了流程全自動化AIAgent構(gòu)建到執(zhí)行全自動化,持續(xù)進化RPAAgent再次降低智能體應(yīng)用門檻實在智能重磅發(fā)布實

  • 崔大寶:大模型降溫背后的難點、卡點、節(jié)點

    崔大寶|節(jié)點財經(jīng)創(chuàng)始人進入2024年,大模型似乎有熄火之勢:資本市場,與之關(guān)聯(lián)的概念炒不動了,英偉達股價動輒暴跌重挫,引發(fā)“泡沫戳破”的擔(dān)憂;消費市場,BATH們的推新活動少了,產(chǎn)品更新迭代的速度慢了,民眾的關(guān)注度降了……熱鬧的大概只剩下兩場酣仗:自5月15日字節(jié)跳動宣布“以厘計費”,打響國內(nèi)大模型

    標(biāo)簽:
    大模型
  • 這一屆“出道”的數(shù)字人,已經(jīng)拿捧上了“鐵飯碗”

    文|智能相對論作者|陳泊丞好消息!你心心念念的事業(yè)單位發(fā)錄取公告了!壞消息!他們沒錄你,錄了個數(shù)字人。圖片來源網(wǎng)絡(luò)隨著數(shù)字人技術(shù)的突破,越來越多的傳統(tǒng)企業(yè)和機構(gòu)開始用上了“數(shù)字員工”。甚至很多中國人心心念念的“鐵飯碗”,也被這些數(shù)字人給捧上了。數(shù)字人捧上了“鐵飯碗”簡單翻看一下全國各地事業(yè)單位的“錄

    標(biāo)簽:
    數(shù)字人
  • 來到IPO關(guān)口,地平線離“三分天下”還有多遠?

    黑芝麻智能敲鐘后,港交所門口又有一些智駕芯片企業(yè)引發(fā)關(guān)注。據(jù)悉,近日地平線已通過中國證監(jiān)會IPO備案,擬發(fā)行不超過11.5億股境外上市普通股并在香港聯(lián)合交易所上市,預(yù)計籌集約5億美元資金。從天眼查可以了解到,該公司成立于2015年,是一家乘用車高級輔助駕駛(ADAS)和高階自動駕駛(AD)解決方案供

  • 機器人大會引領(lǐng)產(chǎn)業(yè)動向,卓翼飛思繪制無人系統(tǒng)教科研新藍圖

    8月21日,萬眾矚目的2024世界機器人大會暨博覽會在北京亦創(chuàng)國際會展中心盛大開幕。這場為期5天,集“展覽”“論壇”“賽事”于一體的機器人盛會,反映了當(dāng)下機器人領(lǐng)域的繁榮生態(tài)。據(jù)官方統(tǒng)計數(shù)據(jù),今年現(xiàn)場逛展觀眾高達25萬人次,比去年增加25%。機器人行業(yè)有多火?看看2024世界機器人大會火爆程度便可知

  • 卓翼智能:超大載重高烈度環(huán)境特種智能系留無人平臺的應(yīng)用與未來

    瞄準場景需求,打造國內(nèi)領(lǐng)先的自主可控、高質(zhì)量超大載重高烈度環(huán)境特種智能系留無人平臺。卓翼智能亮相HICOOL峰會以科技實力榮摘創(chuàng)業(yè)大賽一等獎這個比賽5年培育出16家“獨角獸”HICOOL2024全球創(chuàng)業(yè)者峰會暨創(chuàng)業(yè)大賽已于8月25日在北京圓滿落下帷幕,大賽共吸引了124個國家和地區(qū)的7406個創(chuàng)業(yè)項

  • 60萬獎金召喚AI創(chuàng)新者,2024無錫國際人工智能創(chuàng)新應(yīng)用大賽火熱進行中!

    人工智能是新一輪科技革命和產(chǎn)業(yè)變革的重要驅(qū)動力量。無錫市作為中國的科技創(chuàng)新中心之一,正通過構(gòu)建人工智能"算力+算法+數(shù)據(jù)"三要素齊備的產(chǎn)業(yè)生態(tài),為產(chǎn)業(yè)技術(shù)創(chuàng)新應(yīng)用提供強大支撐,通過“AI+”行動推動人工智能與多個產(chǎn)業(yè)交叉融合,實現(xiàn)技術(shù)落地和產(chǎn)業(yè)化,加速形成新質(zhì)生產(chǎn)力,打造具有國際競爭力的產(chǎn)業(yè)創(chuàng)新智造

  • “云+AI”驅(qū)動操作系統(tǒng)創(chuàng)新升級,龍蜥堅持可持續(xù)發(fā)展路線

    近日,2024龍蜥操作系統(tǒng)大會(OpenAnolisConference)在北京圓滿召開,此次大會由中國計算機學(xué)會開源發(fā)展委員會、中關(guān)村科學(xué)城委員會、海淀區(qū)委網(wǎng)信辦、中國開源軟件推進聯(lián)盟指導(dǎo),龍蜥社區(qū)主辦,阿里云、浪潮信息、Intel、中興通訊、Arm、中科方德等24家理事單位共同承辦,主題為“進化