這段標(biāo)題可以理解為:
"核心人物:" Lovart 陳冕 (Lovart Chen Mian)
"核心觀點/事件:" Sora 證明巨頭無邊界 (Sora demonstrates that giants have no boundaries)
"延伸觀點/建議:" AI 創(chuàng)業(yè)者需要提前描繪未來 (AI entrepreneurs need to envision the future in advance)
"平臺/形式:" 晚點聊 (LatePoint Chat - 一個知名的商業(yè)/科技訪談節(jié)目或欄目)
"總結(jié)來說,標(biāo)題的核心意思是:" 通過 Sora 這個案例(可能指某個具體的技術(shù)突破、產(chǎn)品或事件),Lovart 陳冕認(rèn)為大型科技公司(巨頭)的界限正在變得模糊,并以此提醒 AI 領(lǐng)域的創(chuàng)業(yè)者們,要想成功,必須具備前瞻性,提前構(gòu)想和規(guī)劃未來的發(fā)展方向。
這通常反映了當(dāng)前科技行業(yè),特別是 AI 領(lǐng)域的趨勢和挑戰(zhàn)。
相關(guān)內(nèi)容:

“事實證明,不焦慮的人做不好 AI 應(yīng)用?!?/p>
文丨程曼祺
“明年可能是 to C 應(yīng)用的元年。”9 月 28 日,Lovart 創(chuàng)始人陳冕告訴我們。
第二天,“元年” 被加速——OpenAI 發(fā)布 Sora app,幾天后超越 ChatGPT 和 Gemini,登上美區(qū) App Store 下載總榜第一。
Sora app 打開了消費類 AI 超級應(yīng)用的可能性。過去 2 年多里,從聊天機(jī)器人到 AI 搜索、深度研究、再到智能體,數(shù)輪增長最快的 AI 應(yīng)用都集中在生產(chǎn)端。
今年 5 月開始內(nèi)測、7 月正式開放上線的 Lovart 也是一個服務(wù)設(shè)計生產(chǎn)場景的垂類 Agent。
截至目前,Lovart 獲得了約 20 萬日活用戶,年化預(yù)估收入超越 3000 萬美元。但陳冕仍覺得這不夠快。在 Sora app 發(fā)布前,他已在思考接下來的 to C 機(jī)會:
模型成本在不斷降低,這讓 to C 更可行。to P(生產(chǎn)者)產(chǎn)品也讓更多人能創(chuàng)作 AI 內(nèi)容了——那最終內(nèi)容消費是否也會發(fā)生變化?
只是,Sora 讓一切又加速了。
我們確實要考慮如何更快 go big。因為在這個時代,每一個巨頭都比想象中更厲害,更沒有邊界。
配合新野心,山姆·奧特曼(Sam Altman)已在瘋狂鋪設(shè)算力和能源設(shè)施。9 月底,OpenAI 宣布與英偉達(dá)合作新數(shù)據(jù)中心,總耗電量將達(dá) 10 吉瓦(GW),超過夏日高峰時的紐約市。此外還有總計 17 吉瓦的其他項目正在推進(jìn)。
本篇訪談的第一部分發(fā)生在 Sora 發(fā)布后,產(chǎn)品經(jīng)理出身的陳冕分享了他對 Sora 的體驗和觀察:
我意識到這是一個社交產(chǎn)品,它可能比 “AI 抖音” 還要大。
訪談第二部分,我們復(fù)盤了 4 個月來 Lovart 的實踐;以及 2023 年以來,陳冕摸索的 AI 應(yīng)用創(chuàng)業(yè)破局之路:
AI 應(yīng)用怎么做增長?就是提前描繪未來,然后等它發(fā)生。
垂直應(yīng)用公司本質(zhì)在做兩件事:特殊的交互,和特殊的上下文。
因為頻繁換工作,陳冕過去被認(rèn)為沒有耐性,而這次開始創(chuàng)業(yè)后,他經(jīng)歷過公司瀕臨倒閉,也在最困難時拒絕過收購意向。一些投資人和同行評價他很有韌性。
現(xiàn)在的韌性來自信念,信念又來自認(rèn)知。我不是為了創(chuàng)業(yè)而創(chuàng)業(yè),是為了贏而創(chuàng)業(yè)。
山還在、我們也能到達(dá),那為什么不能努力往那兒走呢?
Sora app 發(fā)布:“每一個巨頭都比想象中更厲害,更沒有邊界”
“我想到了 to C 是下一個機(jī)會,但沒想到就猝不及防地在這個假期突然發(fā)生了?!?/strong>
晚點:我們上次聊剛好是 Sora app 發(fā)布前夕,現(xiàn)在 Sora 出現(xiàn),行業(yè)又有了大變化。
陳冕:對,變化總會比你想象的時間更早一點。幾天前,我說明年是消費類 AI to C 應(yīng)用的元年,這個判斷沒變;但沒想到,關(guān)鍵的 timing 就猝不及防地在這個假期發(fā)生了。
我之前判斷巨頭的速度不會那么快,但顯然錯了。OpenAI 比想象中更激進(jìn),它不只追求 AGI,也追求最牛的產(chǎn)品。
晚點:Sora app 上線后,你從凌晨 3 點開始連玩了 4 小時,你看到了什么?
陳冕:我真的被驚到了。這種感覺我至今只體驗過 3 次,前兩次是抖音和 ChatGPT,第三次就是 Sora app。我意識到這是一個社交產(chǎn)品,它可能比 “AI 抖音” 還要大。
晚點:怎么在使用中獲得這種感知的?
陳冕:一開始我本來對 Sora 沒有預(yù)期,因為它上線很突然。我使用的第一感受是順滑,很快就完成了前幾個作品。比如我讓 ChatGPT 寫了一個 “無間道” 天臺對決的腳本,然后用 Sora 的 cameo(出境秀)功能讓我和 Sam Altman “合拍”,那是我第一次打開聲音——Sora 2 是一個音畫同出的模型——當(dāng)時我就感覺,新世界的大門被打開了!
編者注:cameo 的玩法是,用戶在 Sora 界面里拍攝自己的面部(類似人臉識別步驟),念數(shù)字,生成 AI 形象和音色,然后選擇授權(quán)范圍。這樣你自己或被授權(quán)的其他人就可以在生成視頻時讓你 “出鏡” 合拍。Sam Altman 向所有用戶開放了 cameo,所以它一度刷屏 Sora。
這條視頻有鏡頭語言,有敘事;音畫同步很好,音色很像我本人;人物一致性也很好。而且這一切不需要抽卡,一次就能成功。
更重要的是社交——最開始除了和 Sam 合拍,我不知道干嘛,因為其他人我都不認(rèn)識;所以我就給同事分享碼,拉大家一起玩;這時我驚覺,這不就是社交嗎?這是一個特別大的 aha moment。
更多人后,我再去刷信息流,又體驗了 Sora 的另一個關(guān)鍵機(jī)制——Remix(重新創(chuàng)作)。Remix 核心解決的是共創(chuàng)。這是我自己思考過的問題,就是怎么更簡單地讓用戶接力共創(chuàng),這是激發(fā)更多 AI 內(nèi)容的關(guān)鍵。Sora 在 Remix 上做了滑動交互,很順滑。我認(rèn)為最優(yōu)秀的交互不會超出點擊和滑動,其它都太復(fù)雜了。
總體來說,Sora 的關(guān)鍵鏈路都設(shè)計得很好,完成度挺高。
晚點:比 Sora app 早 4 天,Meta 也在 “Meta AI”app 里上線了 AI 短視頻功能 Vibes,但幾乎沒什么聲量。
陳冕:單純的 AI 生成短視頻產(chǎn)品早就有了,這次的核心還是社交。OpenAI 自己也說,如果沒有 cameo,就不會有這款產(chǎn)品。
晚點:你覺得 Sora 的模型有甩開其它公司嗎?Google Veo3 此前已能實現(xiàn)音畫同出。
陳冕:妙就妙在,它在模型能力最適合的時候,做了它最適合的產(chǎn)品形態(tài)。
晚點:一家中等體量的 AI 創(chuàng)業(yè)公司有可能率先做出 cameo 這樣的新交互,從而引爆市場嗎?
陳冕:首先,Sora 不只是產(chǎn)品創(chuàng)新,它的模型也是 SOTA(State of the Art,業(yè)界最優(yōu))水平。只有掌握頂尖模型,同時它的文化、組織還能孕育產(chǎn)品創(chuàng)新的公司才能做出 Sora。
第二,如果一家中型公司真做出了 Sora,我覺得也能火,但接下來會面臨巨大挑戰(zhàn)。首先是人臉信息的隱私、監(jiān)管問題,其次是成本,Sora 已到了蘋果總榜第三,卻一分錢沒收,視頻生成是很貴的。更現(xiàn)實的是,一旦它火了,巨頭馬上會跟進(jìn)。巨頭有流量、有資金,中小公司根本扛不住。所以 AI 社交這注定是巨頭戰(zhàn)場。
晚點:你認(rèn)為 Sora 未來可能是個多大的產(chǎn)品?
陳冕:它有可能是一個虛擬世界的微信。未來人類的社交可能分成兩個世界——“虛假的真實” 和 “真實的虛假”。哪種對人更有吸引力還未可知,很可能兩個世界會同時存在,爭奪我們的時間。如果把它看作社交產(chǎn)品,這可能是一個數(shù)十億級用戶的機(jī)會。
晚點:這會怎么影響 AI 領(lǐng)域大小公司的動作?
陳冕:這是一場所有模型巨頭都輸不起的仗。無論你認(rèn)為 Sora 成為超級應(yīng)用的概率是 10% 還是 20%,錯過的代價都太高,而贏下的意義又太大。所以想抓住這個時代最頂尖超級應(yīng)用的公司,和現(xiàn)在已擁有超級應(yīng)用的巨頭,都不會放過這個機(jī)會。
晚點:社交有網(wǎng)絡(luò)效應(yīng),有先發(fā)優(yōu)勢和時間窗,你認(rèn)為留給其他人的時間還有多久?
陳冕:可能就 3 到 6 個月。
晚點:Sora 對創(chuàng)業(yè)公司的影響是什么?
陳冕:好的一面是,Sora 會給 AI to C 帶來資本涌入和注意力,所有創(chuàng)業(yè)公司都可以好好思考一下 to C。但同時,我們確實要考慮如何更快 go big。因為在這個時代,每一個巨頭都比想象中更厲害,更沒有邊界。
晚點:你把 OpenAI 算作巨頭,它其實既有巨頭級的資源;又有一個新公司的銳氣和饑渴——團(tuán)隊扁平,同時尚未獲得一個能帶來穩(wěn)定利潤的業(yè)務(wù)。
陳冕:這就是為什么要盡快 go big,資本正在以史無前例的速度聚集。人類歷史上從未有 OpenAI 這樣,在推出第一個主力產(chǎn)品后,短短幾年內(nèi)估值就超過 5000 億美元的公司。一切都在被加速,市場極度樂觀,能投的都在往這個方向砸錢。
晚點:這種樂觀中有什么風(fēng)險嗎?
陳冕:增長速度的錯配。因為太樂觀,人們對無法被加速的事也抱有過高期待,當(dāng)預(yù)期落空,就會沮喪和懷疑。典型的就是建設(shè)算力和能源設(shè)施都需要時間。在基礎(chǔ)設(shè)施更完備前,Super App 短期的成本會很高。如果應(yīng)用發(fā)展和算力建設(shè)周期有較大錯配,甚至可能帶來短暫的泡沫破裂。而且算力越緊張,資源越會向頭部集中。我們非常希望基建和能源設(shè)施能更快完善,不要被物理底層卡住。
晚點:除了算力和能源基建,你還看到了什么無法被加速的事?
陳冕:人心。用戶習(xí)慣的改變需要時間。再往下,真實與虛擬的邊界會越來越模糊,我們怎么接受?能多快接受?當(dāng)然新事物都是在爭議中前行的,人心不會變得那么快,但也一直在變。
“不是服務(wù)所有人,而是服務(wù)有創(chuàng)作欲的人”
20 萬活躍用戶、3000 萬美元年化預(yù)估收入。
晚點:5 月 Lovart 剛開始內(nèi)測后,你就去了舊金山。當(dāng)時你提到,要在未來幾個月努力做到 “幾千萬 ARR”,現(xiàn)在實現(xiàn)得怎么樣了?
陳冕:Lovart 目前的年化預(yù)估收入已超過 3000 萬美元。截止 9 月底,我們?nèi)栈钣脩舻搅?15 萬到 20 萬,在 7 月 beta(內(nèi)測)結(jié)束前,每天是 1 萬到 2 萬,beta 放開后迅速到了 8 萬到 10 萬;Nano Banana 后,Lovart 更好用了,用戶又上了一個臺階,到了約 20 萬。所以我們不是先爆、再微跌,而是一步一個臺階往上漲。這是我挺開心的一點。
晚點:這些用戶是怎么分布的?
陳冕:1/3 在美國,美國也是 Lovart 目前用戶數(shù)量和收入最多的市場。
晚點:3000 萬美元的預(yù)測年度訂閱收入能覆蓋服務(wù)成本嗎?
陳冕:不行,現(xiàn)在的 Agent 都不行,因為 API 很貴,而且我們有一定免費額度,免費到付費的轉(zhuǎn)化需要時間。但我對 Agent 的長期商業(yè)模式毫不困惑,token 一定會更便宜,就和電與上網(wǎng)流量一樣,都是早期貴,普及后會很便宜。訂閱至少會是一個基礎(chǔ)的商業(yè)模式,未來還可能發(fā)展出按思考時間收費的方式。
晚點:Lovart 團(tuán)隊去北美后,為什么還沒有接受全球化機(jī)構(gòu)的投資?
陳冕:我們未來肯定會考慮全球化資金,但 5 月 Lovart 上線那會兒,我們剛敲定融資。當(dāng)時去北美的更優(yōu)先級工作是搭建團(tuán)隊和離全球用戶更近。
晚點:直接接觸美國用戶后,看到了什么?
陳冕:在灣區(qū),我最常被問的問題是,我的熱情和愿景是什么?很多人會問我們,這個產(chǎn)品它到底是給所有人用的,還是給專業(yè)人士?
現(xiàn)在答案更清楚了:因為我做這家公司的愿景,就是希望把創(chuàng)作能力平權(quán),釋放更多人的想象力。AI 時代,能做、想做設(shè)計的廣義設(shè)計師和創(chuàng)作者的數(shù)量在變多。所以我們現(xiàn)在的定位是:“for everyone who wants to create”,不是服務(wù)所有人,而是服務(wù)所有有創(chuàng)作欲的人。
對非專業(yè)人士,Lovart 像一個 AI 創(chuàng)作工作室,能幫你把創(chuàng)意落地。一個典型場景是北美的一些中小商家,比如咖啡店主,他想做自己的全套視覺物料,包含 logo、包裝、菜單等等,如果去找設(shè)計師來做會很貴,現(xiàn)在 AI 可以讓它更普惠。我們也在美國接觸了很多專業(yè)設(shè)計師,他們追求自我表達(dá),不會用 AI 直接出結(jié)果,而是更多把 Lovart 當(dāng)作靈感助手,讓它出底稿,自己再完善。所以不論是專業(yè)設(shè)計師、半專業(yè)創(chuàng)作者還是普通用戶,只要有創(chuàng)作需求,都能用 Lovart 來做設(shè)計。
“AI 應(yīng)用公司怎么做增長?提前描繪未來,然后等它發(fā)生”
“垂直應(yīng)用公司本質(zhì)在做兩件事:特殊的交互,和特殊的上下文”
晚點:2023 年創(chuàng)業(yè)之初,你曾把 AI 應(yīng)用的創(chuàng)業(yè)機(jī)會劃分為 5 個方向:生產(chǎn)端是 Office 和 Adobe,消費端是搜索、社交和泛娛樂。這個判斷現(xiàn)在有更新嗎?
陳冕:目前沒有超出這個框架?,F(xiàn)在所有大體量的 To C 和 To P(生產(chǎn)者)產(chǎn)品,基本都是 Office 類的生產(chǎn)工具和 Adobe 類的視覺創(chuàng)作工具。
Coding 可以看作是新時代的 Office 。編程語言是 LLM(大語言模型)的原生語言。處理文字、信息、代碼,都是 LLM 的內(nèi)生能力。但所有這類應(yīng)用創(chuàng)業(yè)都面臨一個挑戰(zhàn):如何與大模型廠商拉開差異?
另一類是 “Adobe 系”,圍繞多模態(tài)模型展開。它離大模型的主軸有一定距離,既能利用大模型的能力,但又能在自己的場景下做出差異化。所以最開始我們選擇從這個角度來切入。
晚點:這種距離還成立嗎?OpenAI、Google 等核心模型公司都在更多投入多模態(tài)。
陳冕:有距離,不是指巨頭不做多模態(tài)。再往下,追求 AGI 也會經(jīng)過多模態(tài)和世界模型等環(huán)節(jié)。但模型巨頭的最主軸仍是語言,是構(gòu)建 “通用智能”,是造一個高智商的通用人。我們作為垂類產(chǎn)品,則是在通用人的基礎(chǔ)上,造一個設(shè)計師或創(chuàng)作者,它需要更多行業(yè)經(jīng)驗和數(shù)據(jù)。
應(yīng)用公司的生存空間,正是在于你既能用好這個 “通用人” 的能力,又不要去做一個通用人就能做好的事。
晚點:這個思路怎么體現(xiàn)在你們的產(chǎn)品設(shè)計上?
陳冕:垂類應(yīng)用公司本質(zhì)是在用產(chǎn)品表達(dá)兩件事:一是這個行業(yè)里的特殊工作方式,它決定了人機(jī)交互方式和產(chǎn)品界面;二是一個行業(yè)中要積累的經(jīng)驗和數(shù)據(jù),它決定了怎么給 context(上下文)。
比如為什么我們要做 ChatCanvas 功能?就是因為在交互上,你和設(shè)計師溝通時,絕不會只對著他的臉說話,而是必須對著一個桌面或畫布,上面擺滿圖片等素材。設(shè)計的溝通離不開視覺對齊。
如果你和一個人說話時只需要看他的臉,這就是 Chatbot 要處理的通用場景;如果你必須對著視覺素材,那就是 ChatCanvas 的場景。
晚點:ChatCanvas 這種交互方式好像挺自然的。為什么 Lovart 之前沒人做出來?
陳冕:因為在模型能力到之前,大多數(shù)人不會做這個事。今年有幾個密集進(jìn)化:GPT-4o 更新 Image-1(4o 系列的文生圖模型),在指令跟隨、一致性、文字生成能力上都大幅提升,然后是 Google 的 Nano Banana,包括字節(jié)的 Seeddream 4.0,能力持續(xù)上臺階。這些變化太快了,所以大部分人還沒來得及做。
晚點:而你們提前預(yù)判了模型的提升,提前做了準(zhǔn)備?
陳冕:對。AI 應(yīng)用公司怎么做增長?其實就是提前描繪未來,然后等它發(fā)生。
應(yīng)用公司自己不掌握模型創(chuàng)新,所以要預(yù)判它的演化,先設(shè)計出模型到下一階段后可能出現(xiàn)的交互方式,等模型 ready 的那一刻,你就瘋狂 show 出來。
Lovart 本身就是這樣一個提前構(gòu)建,原定五一上線,上線前 GPT-4o 發(fā)布了 Image-1,我們特別開心,等 Nano Banana 出來后,就更開心了。
晚點:具體來說,你們要在產(chǎn)品、工程上做什么,才能接住不斷提升的模型能力?
陳冕:第一是密切跟進(jìn)模型迭代。還是以 ChatCanvas 為例,我們最早設(shè)計這個交互時,連 GPT-Image-1 都還沒發(fā)。這時的模型理解不了復(fù)雜的多輪指令、一致性差、編輯能力弱,很難實現(xiàn) “指哪兒改哪兒” 的體驗。但如果你密切跟蹤模型迭代,和模型團(tuán)隊交流,就會發(fā)現(xiàn)他們正集中攻克這些問題。一些紅極一時的做法,比如 ControlNet,反而在模型提升后就不常用了。(編者注:ControlNet 是是一種神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),通過添加額外條件來控制擴(kuò)散模型的圖像生成過程。)
第二,我們有一個明確假設(shè)——模型在變強(qiáng),但短期是更像人,還沒超越人。所以 Lovart 的設(shè)計哲學(xué)就是 “還原人與人的溝通”。我們怎么和真人設(shè)計師溝通,就怎么和 Agent 來溝通,以此評判交互是否合理。我賭 ASI(超級人工智能)還沒那么快到來。
晚點:ChatCanvas 等交互創(chuàng)新之外,你們也在 Lovart 里更新了視頻生成能力,設(shè)計群體有這個需求嗎?
陳冕:做視頻的人大部分都會做圖,因為視頻往往是從分鏡稿開始的。所以一個做圖的公司大概率會延伸到視頻,因為你很多用戶的下游場景就是視頻。
晚點:做 3D 也是這個邏輯?
陳冕:3D 不太一樣。短期內(nèi),我們的重點還是圖和視頻。因為現(xiàn)在的主流設(shè)備主要展示平面視覺內(nèi)容,3D 內(nèi)容的消費還沒起來,生產(chǎn)需求也就沒那么多。
晚點:除了這些已經(jīng)上線的功能,你還看到了哪些未被滿足的需求?
陳冕:設(shè)計師還需要更多 context。比如要為《晚點》做一套品牌設(shè)計,就需要理解《晚點》的歷史、調(diào)性、受眾、過往視覺風(fēng)格和你們的喜好。
我們把設(shè)計的 context 抽象成兩類:
- Reference(參考):包括私有和公共兩種。私有 reference 是品牌過往的風(fēng)格素材;公共 reference 是流行趨勢,比如宮崎駿或多巴胺風(fēng)格。
- Preference(偏好):來自長期合作中對客戶審美的積累,比如有人喜歡極簡,有人偏愛插畫。AI 設(shè)計師要通過多輪交互發(fā)掘并記住這些偏好。
本質(zhì)上,未來的 AI 設(shè)計師要能持續(xù)吸收、學(xué)習(xí)這些上下文,最終給出更滿足你需求的產(chǎn)出。
晚點:“給設(shè)計更多 context”,落到產(chǎn)品上是什么樣的?
陳冕:我們正在做一個 context 模塊:通過多輪對話補(bǔ)齊上下文,沉淀長期的素材庫,記住用戶偏好。
首先是在 prompt 過程中,我們做了一個小模型,它會追問用戶,補(bǔ)充更多 context,比如品牌歷史、過去的物料等等,我們也支持直接甩個鏈接,理解其中的多模態(tài)信息,比如通過官網(wǎng)理解風(fēng)格。
以上過程做的多了之后,就會慢慢沉淀一個用戶自己的素材庫,在未來調(diào)用中,Lovart 就可以從 reference 和 preference 庫上調(diào)相關(guān)風(fēng)格,和用戶確認(rèn)、快速達(dá)成共識。
晚點:大模型現(xiàn)在對審美和風(fēng)格的判斷能到什么水平?
陳冕:肯定沒有人那么好,但在很多場景已經(jīng)夠用。比如它看到《晚點》的風(fēng)格,不會覺得這是娛樂媒體。多模態(tài)模型的理解和識別能力都在快速變強(qiáng),這還是在 “提前準(zhǔn)備,提前描繪未來”。
晚點:怎么能做到持續(xù)提前描繪未來呢?或者說怎么提高成功率?
陳冕:核心就兩點,離用戶更近,離技術(shù)更近。真正的難點是取舍:你見到用戶后,一定會發(fā)現(xiàn)一些需求,模型還滿足不了,那這個點你做不做?要不要用傳統(tǒng)方式做?
比如我們做全球化市場時發(fā)現(xiàn),現(xiàn)在除了英文和中文,圖像模型在生成其他語種時的效果都不好。那一個很有意義的討論就是,應(yīng)該用哪種方式加文字?
- 用模型直接生成文字:美學(xué)風(fēng)格更一致,但現(xiàn)在容易翻車,可控性不好。
- 用傳統(tǒng)方式,拖一個文本框加文字:好用、可控,但美學(xué)不一致,更大的風(fēng)險是,如果模型很快迭代了,這些 “補(bǔ)丁” 可能就白做了。
這類問題沒有簡單答案。從用戶體驗角度,如果模型短期內(nèi)解決不了一個剛需,那用別的方式頂上可能是對的。但如果模型馬上有大進(jìn)展,又可能摧毀掉過去的努力。
晚點:你自己離技術(shù)更近的方法是什么?你創(chuàng)業(yè)前的工作經(jīng)驗更多是在產(chǎn)品和商業(yè)化上。
陳冕:最有效的方法是技術(shù)同學(xué)讀論文,再講給我聽。我常用 “人” 的比喻來理解大模型:pre-train(預(yù)訓(xùn)練)像培養(yǎng) “合格的人”,post-train(后訓(xùn)練)是給他 “入行經(jīng)驗”,reasoning(推理)是 “思考與決策”,RL 是人在實踐中學(xué)習(xí)。
所以,作為一個產(chǎn)品經(jīng)理,我的優(yōu)勢是在并沒有那么懂技術(shù)的情況下,能用產(chǎn)品思維快速提煉、類比,把技術(shù)能力落到產(chǎn)品上。
晚點:5 月聊時,你曾擔(dān)心,多模態(tài)生成領(lǐng)域的閉源模型會甩開開源模型,這不利于應(yīng)用創(chuàng)業(yè)公司。現(xiàn)在這件事在持續(xù)發(fā)生,Veo3、Nano Banana、Sora 2 等陸續(xù)出現(xiàn)。你現(xiàn)在怎么看這個問題?
陳冕:現(xiàn)在不擔(dān)心了。開源、閉源,本質(zhì)影響兩件事:
- 一是成本。開源成本更低、更可控,但即使用閉源模型,token 價格也必然越來越低;
- 二是要不要做后訓(xùn)練。閉源沒法做后訓(xùn)練,但后來我們發(fā)現(xiàn),即便不做后訓(xùn)練,我們在上下文工程還有很多可以做的,AI 應(yīng)用公司在工程側(cè)、產(chǎn)品側(cè)的空間已經(jīng)足夠復(fù)雜了。
晚點:你有在意的競爭對手嗎?
陳冕:細(xì)到 “創(chuàng)作型 Agent” 這個品類,除了我們,其他還偏小??傮w來說,這個領(lǐng)域有潛力的公司有 3 類。一是 2023 年那批做多模態(tài)生成的,如 Krea、Higgsfield、Freepik 等,他們都可能往 Agent 轉(zhuǎn)型,Midjourney 不一定,它更偏模型。然后是 Adobe、Canva 這類垂直行業(yè)巨頭,但這類新產(chǎn)品一定要到一定收入體量,比如年收入超過 1 億美元,才對他們有意義。三是核心模型公司,我認(rèn)為它們短期內(nèi)會更專注通用 Agent 和 coding 等能力。
我覺得現(xiàn)在處在一個新變化的孕育期。To P 創(chuàng)業(yè)窗口期已接近關(guān)閉,你現(xiàn)在聽到的產(chǎn)品都是競爭后的結(jié)果。我更看好下一波 to C(消費者)應(yīng)用的機(jī)會。
晚點:所以你們何時會做 to C?
陳冕:肯定會做。我覺得明年會出現(xiàn)有意思的公司,可能是 to C 元年。圖像和視頻模型的成本都在不斷降低,Veo3 前段時間開始打 5 折,Nano Banana 也比 GPT-Image-1 便宜很多,確定性的成本下探會讓 to C 更可行。然后是 to P 過去的發(fā)展,讓更多人都能創(chuàng)作 AI 內(nèi)容了。那最終內(nèi)容消費是否也會發(fā)生變化?(編者注:以上訪談發(fā)生在 Sora app 發(fā)布之前。Sora app 其實就是一個生成式 AI 從生產(chǎn)端產(chǎn)品到消費端產(chǎn)品的變化。)
“事實證明,不焦慮的人做不好 AI 應(yīng)用”
“往往在你覺得短期有點兒高估它(技術(shù)進(jìn)展)時,過兩天你又發(fā)現(xiàn)低估了它?!?/strong>
晚點:Lovart 5 月內(nèi)測的目標(biāo)之一,就是要做第一個上線的垂類 Agent。這之后你們一直保持很快的更新節(jié)奏。這種緊迫來自哪兒?
陳冕:一切都在被加速,timing 在 AI 時代更重要了。過去抓住一個成功業(yè)務(wù)形態(tài),可以吃 10 年,現(xiàn)在也許只能活兩年。每一波新產(chǎn)品和新體驗的構(gòu)建窗口期都很有限,不能快速做出產(chǎn)品、獲取用戶,這一波就錯過了。但下一波也不遠(yuǎn),錯過也別太著急,要提前想下一波。
所以一個公司現(xiàn)在想持續(xù)成功,就不能像移動互聯(lián)網(wǎng)那樣抓住一個 PMF 后就慢下來。你想想,如果 Manus 沒有在第一個產(chǎn)品后做出 Manus,我們沒有很快做出 Lovart,公司狀況會完全不同。
人們的情緒也不斷在 “不過如此” 和 “FOMO(害怕錯過)要死” 間來回?fù)u擺。既怕技術(shù)不發(fā)展了,又怕技術(shù)發(fā)展太快。
整個情緒、業(yè)務(wù)、產(chǎn)品、融資和經(jīng)營節(jié)奏,都面臨很大挑戰(zhàn)。但這也是好事,說明技術(shù)真的發(fā)展很快。往往在你覺得短期高估它時,過兩天你又發(fā)現(xiàn)低估了它。
晚點:從 2023 年創(chuàng)業(yè)以來,你們錯過了什么比較重要的時間窗口嗎?
陳冕:幾乎沒錯過重大的。一共是這樣幾波,一是 23 年創(chuàng)業(yè)時,現(xiàn)在我也沒后悔,我們沒有一上來就做全球市場。因為當(dāng)時 Midjourney、Stable Diffusion、Leonardo 等文生圖應(yīng)用都出來了,搶 “全球版圖” 已晚,我們在中國市場跑得最快。第二波就是 Agent,我們做了 Lovart。第三波抓得準(zhǔn)不準(zhǔn)?就看我們 to C 做得怎樣。
晚點:沒錯過重大窗口的原因是什么?
陳冕:我很焦慮,團(tuán)隊也很焦慮。但如果真想做好 AI 創(chuàng)業(yè),你需要和焦慮共處。核心是要搭建一個高頻迭代的組織:能不斷理解新技術(shù);能明確快速變化中,一些事沒辦法做得很深,所以必須選擇杠桿最大的事,優(yōu)先做。
晚點:這可能會帶來頻繁的方向和團(tuán)隊調(diào)整,還有混亂,你覺得這是個問題嗎?
陳冕:確實有人抱怨今天這樣、明天那樣,但這在現(xiàn)在不能避免,除非技術(shù)放緩。一定有一些人更喜歡優(yōu)化確定性的事物。但現(xiàn)在常常是沒來得及優(yōu)化,技術(shù)又變了,這對心態(tài)和組織是個考驗。
晚點:核心團(tuán)隊里,你很焦慮,其他人呢?
陳冕:沒有人是淡定的。從 reasoning、強(qiáng)化學(xué)習(xí)到 Agent 潮,再到大家發(fā)現(xiàn)做上下文工程有很多空間,一共就半年多。你想自己慢慢搞,就很有可能跟不上。事實證明,不焦慮,做不了 AI 應(yīng)用。
晚點:近期你最焦慮的事是什么?
陳冕:最近我們在做的 context 模塊,我認(rèn)為方向是對的,但是不是我們還不夠快?
晚點:實際上 context 模塊什么時候會上線?
陳冕:應(yīng)該在 10 月底。
“過去他們說我沒耐性,現(xiàn)在他們說我有韌性”
晚點:你們公司在 23 年底到 24 年初曾瀕臨倒閉,最后還是挺過來了。一些投資人和同行認(rèn)為你已經(jīng)被驗證的特質(zhì)之一是韌性。
陳冕:這事兒好好玩,我沒創(chuàng)業(yè)時換過很多次工作,大家覺得我沒耐性。創(chuàng)業(yè)后,對我的評價是有韌性。
我創(chuàng)業(yè)這次確實更有韌性了,但我不是個盲目堅持的人。過去頻繁跳槽,是因為認(rèn)知不夠,那十年逐漸積累很多樣本后,現(xiàn)在的韌性來自信念,信念又來自認(rèn)知。
我有幾條大假設(shè):AI 是不是還在快速發(fā)展?AI 是不是會取代所有虛構(gòu)內(nèi)容的創(chuàng)作?如果是,我們沒理由不繼續(xù)。
晚點:最困難時,你們獲得過收購邀約,團(tuán)隊里有人想接受,但你拒絕了。你當(dāng)時是怎么想的?
陳冕:先澄清一下,那不是完整的收購邀約,是有幾個收購意向,我都擋掉了。和團(tuán)隊溝通前,我已經(jīng)決定拒絕。回頭看,我可以有更好的溝通方式,這也是我作為 CEO 的成長:如果自己相信,就要把信念堅定傳遞給團(tuán)隊,我沒想過賣。
這也不是一個感性決策,而是一個理性判斷:我不是為了創(chuàng)業(yè)而創(chuàng)業(yè),是為了贏而創(chuàng)業(yè)。當(dāng)時我認(rèn)為,山還在、我們也能到達(dá),那為什么不能努力往那兒走呢?
晚點:你什么時候發(fā)現(xiàn)創(chuàng)業(yè)比你最開始想象的更殘酷?
陳冕:我到現(xiàn)在都不覺得創(chuàng)業(yè)很殘酷。它焦慮、痛苦,但同時很快樂、很爽。有人說過:當(dāng)你做一件你熱愛、也很痛苦卻又很爽的事,那可能就是你的 “天命”。
這有點像極限運(yùn)動,它確實危險。但在過程中,你不能總想著危險,否則就真掛了,你得專注解決眼前每一件事。
它也有點像魂類游戲:小怪兩刀把你放倒,BOSS 更是一刀秒,可一旦摸到那條 “正確路徑”,也能戰(zhàn)勝原本強(qiáng)大的對手。挫敗感拉滿、正反饋也拉滿。我覺得這是創(chuàng)業(yè)的魅力,是我熱愛這件事的原因。
晚點:你的投資人之一,明勢合伙人夏令說你是 “遇強(qiáng)則強(qiáng)” 的創(chuàng)始人。
陳冕:是有點這樣,我們遇到過 3 次比較大的挑戰(zhàn):
- 第一次是找第一個產(chǎn)品的 PMF,我覺得我先看到了 PMF,后來被驗證,我很快樂。
- 第二次是差點倒閉。我覺得這怎么會倒閉?不會的!然后沒倒閉,更加快樂。
- 第三次是怎么做出 Lovart——在明確知道上一代產(chǎn)品不是未來時,怎么盡快做出下一代產(chǎn)品,怎么用想象力描繪未來,而且我們居然第一個做到了,更加快樂。
每一次都是最焦慮、最痛苦的時候;但每一次跨越,我的成就感都越來越大。當(dāng)然再往下,你可能還會承受更大的痛苦。但痛苦和快樂是并生的。
晚點:你害怕自己身上的什么特性嗎?
陳冕:害怕自己迭代速度不夠快。至于要不要焦慮這件事,其實需要取舍。如果技術(shù)發(fā)展放緩,我們要沉下心做精細(xì)化,穩(wěn)一點;如果仍在加速,就必須擁抱新東西,用極致的焦慮逼自己保持高敏感、快吸收、快決策。
晚點:你說焦慮需要 “取舍”,但一般認(rèn)為焦慮是一種情緒,挺難被控制。難道你有一個開關(guān),可以去打開和關(guān)閉焦慮嗎?
陳冕:我可以用一些方式屏蔽它。比如你應(yīng)該接收多少外部信息?至少在目前,我覺得還是要保持高頻信息接觸。以及我要在冷靜下來時,去處理情緒,我覺得這個我是可以控制的。
晚點:你好像是在用底層的理性控制上層的感性表達(dá)?
陳冕:對。一些人會覺得我超級感性,能量很高、非常嗨。但本質(zhì)上我是個感性的理性者。因為 AI 真的沒法計劃,我越來越依賴各種信息給我的 feeling,以及靈感涌現(xiàn)。但做決策還是理性,比如團(tuán)隊上也是,迭代很快,合適的人留下,不合適的及時調(diào)整。
晚點:我看到你最近的 “感性” 一面,是分享了 TI14 Dota 2 的比賽結(jié)局,Extreme 戰(zhàn)隊輸了,你說:“青春總有遺憾”。
陳冕:對,他們跨越六年、輸了三次。每次都是在 2 比 2 時輸?shù)糇詈笠痪?。我是一個 Dota 老玩家,所以有些感傷。這也是一種投射,他們也是為了自己的喜歡的事在努力奮斗,有非常多波瀾起伏,也有非常多遺憾。但是如果不去做,就沒有青春。青春就是奮斗的過程。
晚點:你現(xiàn)在還能感覺到青春在心中涌動嗎?
陳冕:現(xiàn)在就是我的青春。過去在學(xué)校、在各家公司的工作,都是為了現(xiàn)在。這是我真正第一次自由的、全情的、瘋狂的想做成一件事情。
題圖來源:Lovart

微信掃一掃打賞
支付寶掃一掃打賞