南通颐猩文化传播有限公司

  1. 創(chuàng)業(yè)頭條
  2. 前沿領(lǐng)域
  3. AI智能
  4. 正文

OpenAI Sora畫(huà)的餅,AI行業(yè)集體給它圓了......嗎?

 2024-08-26 10:58  來(lái)源:A5專(zhuān)欄  我來(lái)投稿 撤稿糾錯(cuò)

  域名預(yù)訂/競(jìng)價(jià),好“米”不錯(cuò)過(guò)

AI文生視頻領(lǐng)域,幾乎只剩Sora還是個(gè)期貨了。

最近兩個(gè)月,國(guó)內(nèi)外的AI-generated Video應(yīng)用持續(xù)爆發(fā),中國(guó)的快手、字節(jié)、智譜AI、生數(shù)科技、愛(ài)詩(shī)科技,海外的谷歌、Luma、Runway,格局如八仙過(guò)海。

雖然不同平臺(tái)水平差異依舊存在,但整體可用性已經(jīng)大大提高,而且風(fēng)格化特征也比較全面。唯一的缺憾是,在融入工作流方面,AI視頻工具們的水平還是差了一點(diǎn)。Sora畫(huà)的餅,要交給這些后來(lái)者去圓了。

放棄期貨,文生視頻應(yīng)用爆發(fā)

業(yè)界民間都把視頻視為AI應(yīng)用落地的重點(diǎn)領(lǐng)域。英偉達(dá)CEO黃仁勛在7月30日的全球頂級(jí)計(jì)算機(jī)圖形學(xué)會(huì)議SIGGRAPH 2024上邀請(qǐng)了Meta的CEO扎克伯格進(jìn)行對(duì)話(huà),雙方都認(rèn)可視頻能力會(huì)是AI大模型的進(jìn)化方向。

出身于英偉達(dá)研究小組的Luma AI首席科學(xué)家宋佳銘,在與a16z合伙人Anjney Midha對(duì)談時(shí)說(shuō),視頻關(guān)聯(lián)著3D世界,從學(xué)習(xí)角度看,視頻數(shù)據(jù)使模型更好地理解和推理3D世界。所以,實(shí)時(shí)高質(zhì)量的視頻生成,最終會(huì)推動(dòng)具身AI的發(fā)展。

視頻就是這樣一座“橋”,而現(xiàn)在大量的AI公司正在試圖搶先通過(guò)它,尤其是OpenAI讓Sora變成了外界用不到的期貨,給了其他平臺(tái)進(jìn)一步發(fā)展的空間。

(整理自公開(kāi)信息)

(圖源:天眼查)

超長(zhǎng)戰(zhàn)線背后是這些公司的試探。一部分是關(guān)于商業(yè)模式,另一部分是關(guān)于技術(shù)應(yīng)用前景。

可靈、即夢(mèng)、Vidu等都推出了會(huì)員訂閱模式,在C端進(jìn)行應(yīng)用普及化嘗試。愛(ài)詩(shī)科技創(chuàng)始人王長(zhǎng)虎此前在接受財(cái)新采訪時(shí)表示:“愛(ài)詩(shī)目前的策略以2C(面向消費(fèi)者)為主,廣泛收集國(guó)內(nèi)外用戶(hù)反饋,以更好地基于用戶(hù)體驗(yàn)迭代底層模型。”至于更遠(yuǎn)的應(yīng)用,現(xiàn)在來(lái)談則為時(shí)尚早,主要是因?yàn)镃端的收費(fèi)模式無(wú)法承擔(dān)成本。

Luma AI采取了To C的產(chǎn)品形態(tài),不過(guò)它原本專(zhuān)注于3D領(lǐng)域,進(jìn)入視頻生成領(lǐng)域是為了探索3D生成與重建的更多可能性,以視頻驅(qū)動(dòng)3D發(fā)展。這在產(chǎn)業(yè)領(lǐng)域有更多的應(yīng)用前景,例如批量制造電影需要的三維素材等。

最重要的是,Luma AI的期望不是售賣(mài)技術(shù)或者素材,而是建立類(lèi)似TikTok這樣的平臺(tái),也就是一個(gè)基于3D的生態(tài)系統(tǒng)。王長(zhǎng)虎也在和極客公園創(chuàng)始人張鵬對(duì)話(huà)時(shí)表示,愛(ài)詩(shī)科技也瞄準(zhǔn)的是“AIGC時(shí)代的平臺(tái)性機(jī)會(huì)”,但平臺(tái)的形態(tài)暫時(shí)無(wú)法預(yù)測(cè),因?yàn)锳I產(chǎn)業(yè)不會(huì)以復(fù)制現(xiàn)在已有的平臺(tái)的方式成長(zhǎng)。

不僅如此,目前讓AI-generated Video進(jìn)入完整工作流的應(yīng)用已經(jīng)在成形。開(kāi)源視頻編輯工具Clapper最近熱度上升,它的特色就是集合各類(lèi)AI技術(shù),用prompt的方式調(diào)動(dòng)AI Agent生成和迭代故事,直接跳過(guò)了手工編輯文件的過(guò)程。

(圖源:機(jī)器之心)

由此可見(jiàn),AI-generated Video的進(jìn)化速度遠(yuǎn)比我們想象得要快。目前,行業(yè)的重點(diǎn)無(wú)疑在于生成速度和生成效率兩個(gè)方面。但是,大模型并不提供完全確定的商業(yè)模式方向,這更多取決于團(tuán)隊(duì)的選擇。而在這個(gè)過(guò)程中,除了商業(yè)化之外,AI公司還要思考怎么避免陷入合規(guī)困境、成本困境。所以,把文生視頻變得成熟并不容易,現(xiàn)在僅僅相當(dāng)于ChatGPT剛剛問(wèn)世的階段。

AI-generated Video的“硬傷”和突破口

a16z之前就發(fā)表過(guò)觀點(diǎn),巨頭在從科研成果到商業(yè)產(chǎn)品的轉(zhuǎn)化中需要更關(guān)注法律安全、版權(quán)等問(wèn)題,所以往往效率會(huì)慢。我們不去考慮Sora是不是因?yàn)檫@個(gè)原因始終不露面,單看行業(yè)都要面對(duì)的相關(guān)問(wèn)題,邏輯其實(shí)是一樣的。

1.商業(yè)化的“落差”,目前的AI-generated Video很難滿(mǎn)足甲方們的需求

彭博社曾報(bào)道,OpenAI一直試圖向好萊塢推薦Sora,但并不成功。用Sora制作的第一則商業(yè)化廣告是6月公開(kāi)的玩具反斗城廣告。然而,這則視頻不但用了一些舊素材,公開(kāi)新聞稿也沒(méi)有說(shuō)完全由AI生成。

導(dǎo)演Nik Kleverov還在一條已經(jīng)刪除的動(dòng)態(tài)里表示,制作這些鏡頭的創(chuàng)意機(jī)構(gòu)Native Foreign提供了大約十幾個(gè)工作人員參與工作,Sora支持了80%到85%的流程。這對(duì)需要高效低成本的AI-generated Video來(lái)說(shuō)算不上什么好消息。

2.訓(xùn)練成本、高質(zhì)量數(shù)據(jù)集難以滿(mǎn)足

視頻的本質(zhì)可以視為一系列圖像,圖像有很多公開(kāi)的數(shù)據(jù)集,但是視頻沒(méi)有。OpenAI遇到過(guò)違規(guī)使用YouTube視頻進(jìn)行訓(xùn)練的指控,英偉達(dá)最近被媒體曝光從Netflix和YouTube收集了大量數(shù)據(jù),用來(lái)訓(xùn)練自己的Cosmos項(xiàng)目,用于支持其AI產(chǎn)品往現(xiàn)實(shí)世界發(fā)展。它每天可以下載相當(dāng)于80年的視頻內(nèi)容。

這體現(xiàn)了兩個(gè)關(guān)鍵點(diǎn):一是黃仁勛和Luma的觀點(diǎn)類(lèi)似,AI視頻的發(fā)展確實(shí)對(duì)AI進(jìn)入3D世界意義重大,英偉達(dá)也是這樣做的:文本——圖像——視頻——三維模型——現(xiàn)實(shí)世界。二是視頻數(shù)據(jù)集是個(gè)大問(wèn)題,除了版權(quán)問(wèn)題,這些視頻數(shù)據(jù)還缺乏標(biāo)簽,斯坦福大學(xué)教授Stefano Ermon說(shuō),現(xiàn)階段缺乏篩選和過(guò)濾好視頻的方法,而且篩選后還要考慮它們的標(biāo)簽和描述。

3.AI資產(chǎn)泡沫的問(wèn)題,AI必須為用戶(hù)解決重要復(fù)雜的問(wèn)題才能有價(jià)值,但現(xiàn)在它的發(fā)展成效,遠(yuǎn)遠(yuǎn)不能和互聯(lián)網(wǎng)等技術(shù)當(dāng)年初生時(shí)的情況相比

Benchmark合伙人Michael Eisenberg在最近的一期訪談中,引用了其好友Atreides Management創(chuàng)始人Gavin Baker關(guān)于大模型發(fā)展的觀點(diǎn):“基礎(chǔ)模型是歷史上貶值最快的資產(chǎn)。”

他所舉的例子來(lái)自Seeking Alpha的創(chuàng)始人,類(lèi)似金融領(lǐng)域這種每分鐘都會(huì)進(jìn)行業(yè)務(wù)和數(shù)據(jù)更新的高頻領(lǐng)域,訓(xùn)練出來(lái)的模型只能完成寫(xiě)報(bào)告之類(lèi)的常規(guī)工作,但無(wú)法應(yīng)對(duì)數(shù)據(jù)的高速刷新,滿(mǎn)足金融預(yù)測(cè)未來(lái)的需求。

而且,其他技術(shù)的發(fā)展是確定性的,互聯(lián)網(wǎng)發(fā)展早期雖然泡沫巨大,但已經(jīng)體現(xiàn)了應(yīng)用路徑;而AI渾身都是不確定性。互聯(lián)網(wǎng)發(fā)展的邊際成本幾乎約等于0(或者說(shuō)其中不少都分擔(dān)給了運(yùn)營(yíng)商和用戶(hù)),然而AI成長(zhǎng)的邊際成本涉及大量固定資產(chǎn),現(xiàn)在都由創(chuàng)業(yè)者自己承擔(dān),而且越投入邊際改善效應(yīng)越弱。大量的早期投入,很可能是一個(gè)陷阱。

技術(shù)革命之后必須伴隨產(chǎn)業(yè)革命,產(chǎn)業(yè)革命則需要現(xiàn)象級(jí)產(chǎn)品的引領(lǐng)。AI更需要的是一個(gè)成功的場(chǎng)景。目前看來(lái),AI-generated Video還沒(méi)有拿到這類(lèi)成果的起色。

Perplexity的創(chuàng)始人Arin對(duì)此提供了另外一個(gè)觀點(diǎn),那就是基礎(chǔ)模型的價(jià)值本質(zhì)映射著背后團(tuán)隊(duì)的價(jià)值,即Sora之于OpenAI,文心大模型之于百度。不是Sora能革了視頻的命,只是外界相信由OpenAI領(lǐng)導(dǎo)的Sora具備這樣的可能性而已。當(dāng)Sora沒(méi)能提供符合我們預(yù)期的突破時(shí),誰(shuí)能在這個(gè)領(lǐng)域擔(dān)起大任呢?

由此出發(fā),關(guān)鍵或許在于誰(shuí)能先把AI-generated Video真正融入到某一個(gè)商業(yè)系統(tǒng)的工作流中去,就像Clapper對(duì)視頻制作的探索一樣。而這就是一個(gè)更大的問(wèn)題了,因?yàn)樗婕暗胶推渌I(lǐng)域的融合——氣象、城市、影視、汽車(chē)、制造業(yè)。也許Sora會(huì)在今年的某天拿出一個(gè)更具體的成果,也許是其他的創(chuàng)業(yè)公司顛覆了我們對(duì)AI視頻的認(rèn)知。

來(lái)源:松果財(cái)經(jīng)

申請(qǐng)創(chuàng)業(yè)報(bào)道,分享創(chuàng)業(yè)好點(diǎn)子。點(diǎn)擊此處,共同探討創(chuàng)業(yè)新機(jī)遇!

相關(guān)標(biāo)簽
ai智能

相關(guān)文章

  • 科技泡沫論中,中國(guó)AI初創(chuàng)企業(yè)如何煉成“吸金大法”?

    作為這一輪全球AI科技周期的風(fēng)向標(biāo)企業(yè),自2023年初截至今年6月31日,英偉達(dá)股價(jià)翻了近7.5倍。然而,自6月創(chuàng)下了歷史高點(diǎn)后,截至當(dāng)?shù)貢r(shí)間8月12日收盤(pán),其股價(jià)回撤幅度約20%。同時(shí),這一時(shí)期,英偉達(dá)多位高管也在持續(xù)拋售公司股份。據(jù)統(tǒng)計(jì),在6月13日至8月9日期間,CEO黃仁勛已累計(jì)套現(xiàn)超5.5

    標(biāo)簽:
    ai智能
  • AI時(shí)代的“另類(lèi)博弈”,調(diào)薪只是大廠變革的開(kāi)始

    大廠員工們的喜大普奔時(shí)刻,騰訊宣布“漲薪”了。具體內(nèi)容:一是將服務(wù)獎(jiǎng),即「十三薪」,均攤到每月月薪中,折算后每月漲薪8%;二是將“易居”計(jì)劃的年度房補(bǔ),納入月薪中。兩項(xiàng)調(diào)整給新老員工的月薪帶來(lái)了不小的變化。今年,裁員潮的陰影一直籠罩全球,但包括騰訊在內(nèi)的國(guó)內(nèi)互聯(lián)網(wǎng)大廠卻開(kāi)始了一波“反向操作”,這背后

    標(biāo)簽:
    ai智能
  • 超預(yù)期的業(yè)績(jī)?cè)鲩L(zhǎng)未能“沸騰”股價(jià),谷歌的AI戰(zhàn)事升級(jí)?

    近日,谷歌母公司Alphabet在美股盤(pán)后公布了第二季度財(cái)報(bào),其中,總營(yíng)收847億美元,同比增長(zhǎng)14%,高于分析師普遍預(yù)期的842億美元

    標(biāo)簽:
    ai智能
  • 現(xiàn)階段的AI落地,只是一場(chǎng)大模型廠商的“賣(mài)家秀”?

    商業(yè)化愿景下,AI應(yīng)用元年已經(jīng)到來(lái)。2024年以來(lái),諸多已布局AI大模型技術(shù)的科技公司都開(kāi)始加速推出AI應(yīng)用產(chǎn)品。比如,今年7月16日,騰訊旗下大模型應(yīng)用“騰訊元寶”推出“3D角色夢(mèng)工廠”玩法,成為首個(gè)擁有打印級(jí)3D生成能力的通用大模型App。無(wú)獨(dú)有偶,百度也推出了一款名為“文小言”的AI數(shù)字人社交

    標(biāo)簽:
    ai智能
  • 掉隊(duì)的百度,突然用AI應(yīng)用重新殺回?

    文|智能相對(duì)論作者|葉遠(yuǎn)風(fēng)松弛感,是這屆奧運(yùn)會(huì)開(kāi)幕式給很多人留下的直觀感受。而讓用戶(hù)觀看奧運(yùn)的過(guò)程也獲得松弛感,同樣是各路APP在奧運(yùn)季努力的方向。從各種大型賽事報(bào)道來(lái)看,一般來(lái)說(shuō),APP們往往致力于整合信息、形成專(zhuān)題頁(yè)面,方便用戶(hù)一站式瀏覽,從容選擇、查看。但“智能相對(duì)論”觀察到,一些嘗試推動(dòng)用戶(hù)

    標(biāo)簽:
    ai智能
  • “創(chuàng)造市場(chǎng)”與“算法進(jìn)化”,中美AI競(jìng)速的岔路口

    “人工智能的商業(yè)模式,是要?jiǎng)?chuàng)造一個(gè)市場(chǎng),而非一個(gè)算法”。這是世界AI泰斗MichaelI.Jordan的觀點(diǎn)。而當(dāng)前的全球AI市場(chǎng),占據(jù)主導(dǎo)地位的中美雙方,卻也走出了兩條截然不同的技術(shù)路徑,前者執(zhí)著于前沿技術(shù)的探索,后者則發(fā)力應(yīng)用優(yōu)化和商業(yè)化落地。南轅北轍的兩個(gè)方向,或許已經(jīng)無(wú)法直接進(jìn)行排位先后、優(yōu)

    標(biāo)簽:
    ai智能
  • 智能體進(jìn)化發(fā)展了一年,現(xiàn)在的RPA Agent迭代到什么程度了?

    智能體進(jìn)化發(fā)展了一年,現(xiàn)在的RPAAgent迭代到什么程度了?從實(shí)在智能最新發(fā)布的實(shí)在Agent7.0,看RPAAgent的迭代升級(jí)抓取豆瓣信息、自己制作PPT,這款A(yù)IAgent真的實(shí)現(xiàn)了流程全自動(dòng)化AIAgent構(gòu)建到執(zhí)行全自動(dòng)化,持續(xù)進(jìn)化RPAAgent再次降低智能體應(yīng)用門(mén)檻實(shí)在智能重磅發(fā)布實(shí)

  • 崔大寶:大模型降溫背后的難點(diǎn)、卡點(diǎn)、節(jié)點(diǎn)

    崔大寶|節(jié)點(diǎn)財(cái)經(jīng)創(chuàng)始人進(jìn)入2024年,大模型似乎有熄火之勢(shì):資本市場(chǎng),與之關(guān)聯(lián)的概念炒不動(dòng)了,英偉達(dá)股價(jià)動(dòng)輒暴跌重挫,引發(fā)“泡沫戳破”的擔(dān)憂(yōu);消費(fèi)市場(chǎng),BATH們的推新活動(dòng)少了,產(chǎn)品更新迭代的速度慢了,民眾的關(guān)注度降了……熱鬧的大概只剩下兩場(chǎng)酣仗:自5月15日字節(jié)跳動(dòng)宣布“以厘計(jì)費(fèi)”,打響國(guó)內(nèi)大模型

    標(biāo)簽:
    大模型
  • 這一屆“出道”的數(shù)字人,已經(jīng)拿捧上了“鐵飯碗”

    文|智能相對(duì)論作者|陳泊丞好消息!你心心念念的事業(yè)單位發(fā)錄取公告了!壞消息!他們沒(méi)錄你,錄了個(gè)數(shù)字人。圖片來(lái)源網(wǎng)絡(luò)隨著數(shù)字人技術(shù)的突破,越來(lái)越多的傳統(tǒng)企業(yè)和機(jī)構(gòu)開(kāi)始用上了“數(shù)字員工”。甚至很多中國(guó)人心心念念的“鐵飯碗”,也被這些數(shù)字人給捧上了。數(shù)字人捧上了“鐵飯碗”簡(jiǎn)單翻看一下全國(guó)各地事業(yè)單位的“錄

    標(biāo)簽:
    數(shù)字人
  • 來(lái)到IPO關(guān)口,地平線離“三分天下”還有多遠(yuǎn)?

    黑芝麻智能敲鐘后,港交所門(mén)口又有一些智駕芯片企業(yè)引發(fā)關(guān)注。據(jù)悉,近日地平線已通過(guò)中國(guó)證監(jiān)會(huì)IPO備案,擬發(fā)行不超過(guò)11.5億股境外上市普通股并在香港聯(lián)合交易所上市,預(yù)計(jì)籌集約5億美元資金。從天眼查可以了解到,該公司成立于2015年,是一家乘用車(chē)高級(jí)輔助駕駛(ADAS)和高階自動(dòng)駕駛(AD)解決方案供

  • 機(jī)器人大會(huì)引領(lǐng)產(chǎn)業(yè)動(dòng)向,卓翼飛思繪制無(wú)人系統(tǒng)教科研新藍(lán)圖

    8月21日,萬(wàn)眾矚目的2024世界機(jī)器人大會(huì)暨博覽會(huì)在北京亦創(chuàng)國(guó)際會(huì)展中心盛大開(kāi)幕。這場(chǎng)為期5天,集“展覽”“論壇”“賽事”于一體的機(jī)器人盛會(huì),反映了當(dāng)下機(jī)器人領(lǐng)域的繁榮生態(tài)。據(jù)官方統(tǒng)計(jì)數(shù)據(jù),今年現(xiàn)場(chǎng)逛展觀眾高達(dá)25萬(wàn)人次,比去年增加25%。機(jī)器人行業(yè)有多火?看看2024世界機(jī)器人大會(huì)火爆程度便可知

  • 卓翼智能:超大載重高烈度環(huán)境特種智能系留無(wú)人平臺(tái)的應(yīng)用與未來(lái)

    瞄準(zhǔn)場(chǎng)景需求,打造國(guó)內(nèi)領(lǐng)先的自主可控、高質(zhì)量超大載重高烈度環(huán)境特種智能系留無(wú)人平臺(tái)。卓翼智能亮相HICOOL峰會(huì)以科技實(shí)力榮摘?jiǎng)?chuàng)業(yè)大賽一等獎(jiǎng)這個(gè)比賽5年培育出16家“獨(dú)角獸”HICOOL2024全球創(chuàng)業(yè)者峰會(huì)暨創(chuàng)業(yè)大賽已于8月25日在北京圓滿(mǎn)落下帷幕,大賽共吸引了124個(gè)國(guó)家和地區(qū)的7406個(gè)創(chuàng)業(yè)項(xiàng)

  • 60萬(wàn)獎(jiǎng)金召喚AI創(chuàng)新者,2024無(wú)錫國(guó)際人工智能創(chuàng)新應(yīng)用大賽火熱進(jìn)行中!

    人工智能是新一輪科技革命和產(chǎn)業(yè)變革的重要驅(qū)動(dòng)力量。無(wú)錫市作為中國(guó)的科技創(chuàng)新中心之一,正通過(guò)構(gòu)建人工智能"算力+算法+數(shù)據(jù)"三要素齊備的產(chǎn)業(yè)生態(tài),為產(chǎn)業(yè)技術(shù)創(chuàng)新應(yīng)用提供強(qiáng)大支撐,通過(guò)“AI+”行動(dòng)推動(dòng)人工智能與多個(gè)產(chǎn)業(yè)交叉融合,實(shí)現(xiàn)技術(shù)落地和產(chǎn)業(yè)化,加速形成新質(zhì)生產(chǎn)力,打造具有國(guó)際競(jìng)爭(zhēng)力的產(chǎn)業(yè)創(chuàng)新智造

  • “云+AI”驅(qū)動(dòng)操作系統(tǒng)創(chuàng)新升級(jí),龍蜥堅(jiān)持可持續(xù)發(fā)展路線

    近日,2024龍蜥操作系統(tǒng)大會(huì)(OpenAnolisConference)在北京圓滿(mǎn)召開(kāi),此次大會(huì)由中國(guó)計(jì)算機(jī)學(xué)會(huì)開(kāi)源發(fā)展委員會(huì)、中關(guān)村科學(xué)城委員會(huì)、海淀區(qū)委網(wǎng)信辦、中國(guó)開(kāi)源軟件推進(jìn)聯(lián)盟指導(dǎo),龍蜥社區(qū)主辦,阿里云、浪潮信息、Intel、中興通訊、Arm、中科方德等24家理事單位共同承辦,主題為“進(jìn)化