Skip to content Skip to sidebar Skip to footer

2026 AI 影片生成器大比拼 Round 2:Sora 2、Wan 2.5、即夢

上一回,我們比較了西方市場最熱門的三款 AI 影片生成器——Sora 2、Veo 3 和 Kling AI。但由於 Sora 2 和 Veo 3 在香港需要 VPN 才能使用,不少讀者敲碗要求我們測試一些中國內地的 AI 工具。於是,我們決定再來一場正面對決!

這次,我們挑選了兩款在內地使用率極高的 AI 影片生成器——阿里巴巴 (Alibaba) 的 Wan 2.5 和字節跳動 (ByteDance) 的即夢,並讓它們與 Sora 2 進行一場硬碰硬的較量。

Sora 2、Wan 2.5和即夢是甚麼來頭?

在看結果之前,先快速了解一下這三位選手。

  • Sora 2:OpenAI 於 2025 年推出的影片生成模型,以強大的物理模擬能力、長鏡頭連貫性以及電影級敘事能力聞名。它擅長製作動態自然、畫面細緻且高度逼真的片段。
  • Wan 2.5:阿里巴巴於 2025 年 9 月推出的升級版模型 (通義萬相系列)。它主打高解像度輸出、精準的動作捕捉,以及透過阿里雲提供的企業級工作流。
  • 即夢:字節跳動於 2025 年中發佈,專為短片創作者而設。它生成的片段節奏明快、視覺吸睛,並特別強調人物角色的美感——非常適合抖音這類平台。

實測環節

與上次測試一樣,我們設計了三個不同複雜度的指令 (Prompt),並要求三款工具使用完全相同的中文指令生成影片。這樣我們才能在公平的條件下,比較它們的強項與弱點。

測試 1:切檸檬 (自由發揮與物理測試)

一名家庭主婦在廚房切檸檬

指令:一個簡單的場景,讓模型自由發揮。切生果也是測試 AI 是否理解物理常識的可靠方法。

結果:我們原本對 Wan 2.5 寄予厚望,畢竟它是最新的模型,但結果卻令人大跌眼鏡。不僅檸檬切開的方式不合常理,家庭主婦的造型也顯得非常「過時」—— 看起來像是 2024 年那種早期的 AI 畫質。

即夢的表現較好。雖然切檸檬的動作仍不算完全自然,但人物的真實感超出了我們的預期。皮膚和頭髮帶有一些自然的瑕疵,反而讓她看起來更像真人。如果在手機螢幕上快速滑過,普通觀眾甚至可能以為這是真人拍攝的。

Sora 2 繼續展現統治力。動作流暢度、物理效果和人物真實感都極具說服力。更厲害的是,它加入了一點故事元素,將單純的切檸檬動作變成了一個「製作氣泡檸檬水」的場景。這種額外的創意層次,正是 Sora 2 遙遙領先的地方。

排名:Sora 2 > 即夢 > Wan 2.5

測試 2:沖咖啡 (液體與蒸汽測試)

特寫鏡頭,金屬質感的咖啡機在暖調環境光下運作。沖煮頭緩緩落下,細緻的蒸氣飄散。深色的濃縮咖啡從金色濾嘴穩定流出,形成絲滑的深褐色拉絲,落入白色陶瓷杯中。鏡頭微微推近,光線映照出油脂豐厚的crema細節。背景柔焦、色彩溫潤,整體呈現安靜、專注、極致質感的瞬間。

指令:這個指令測試 AI 生成影片中最難搞的兩個元素:液體流動和蒸汽。

結果:Sora 2 再次交出了最準確的成績。沖煮頭、手柄和咖啡油脂看起來都非常逼真且渲染得當。唯一的小瑕疵是最後滴落的幾滴濃縮咖啡,看起來略顯生硬。

即夢的成品還算不錯,但有幾個明顯的問題。手柄的比例看起來過大,而且模型竟然無端端在杯中加入了拉花。不過,它的蒸汽效果出奇地好。

Wan 2.5 的亮點在於緩慢而流暢的運鏡,很有質感。可惜的是,咖啡機的金屬感太強,看起來假假的。最大的敗筆是——杯子一開始就是滿的,儘管咖啡不停滴落,杯子卻永遠不會溢出來(物理邏輯完全下線)。

排名:Sora 2 > 即夢 > Wan 2.5

測試 3:抹玻璃 (複雜材質與反光測試)

明亮早晨室內光線下,一名家庭主婦站在落地玻璃窗前(臉部不需特寫,以自然日常姿態呈現)。她握著透明噴瓶朝玻璃窗表面均勻噴灑清潔液(噴霧化成細緻氣霧,微小水珠在玻璃表面迅速散開,形成薄薄的水膜)。鏡頭切至更近距離,玻璃表面反射著室內柔光(可看到水珠滑落的軌跡、細微光線折射)。她以乾淨的白色超細纖維布開始擦拭(布料微微蓬鬆、邊緣略有纖維細節),手部動作輕柔且有節奏。擦拭時玻璃上的霧面區逐漸變得透亮(清晰反射出外面的藍天與庭院輪廓)。最後畫面呈現光滑無痕的玻璃表面(表面反光自然、乾淨無水痕),整體氛圍溫暖、清潔、日常生活質感。

指令:這是最複雜的指令,結合了液體、玻璃、反光、質地、超細纖維布的細節、光影以及簡短的敘事。玻璃和水漬反光向來是 AI 影片的噩夢。

結果: 三款模型在處理玻璃表面和反光方面都表現得出奇地好。

在前兩輪表現掙扎的 Wan 2.5 在這裡上演了大翻身。噴霧效果、水流、反光以及抹擦的動作都非常有說服力。

即夢的影片則變成了搞笑片。噴霧的水珠大得離譜,角色的清潔動作極其誇張,而且她不知為何雙手各拿著一支清潔劑,完全令人摸不著頭腦。

Sora 2 優雅地處理了整個場景。就像切檸檬的測試一樣,它不僅理解物理邏輯,還加入了一種自然的敘事感。如果說 Wan 2.5 的版本像是一段隨意的家庭錄像,那麼 Sora 2 的成品看起來就像是一支專業的產品廣告。

排名:Sora 2 = Wan 2.5 > 即夢

總結

Sora 2 毫無疑問是本次比拼的總冠軍。在三個測試中,它始終如一地展現了最真實的物理效果、最強的視覺邏輯和最成熟的敘事能力。

Wan 2.5 展現了一些潛力,特別是在處理玻璃和反光方面。但在簡單的動作和物件互動上仍有待加強。即夢生成的人物非常自然,但穩定性不足,且經常出現不合邏輯或過於誇張的行為。

對於正在尋找目前市面上最可靠、最高質素 AI 影片生成器的香港創作者來說,Sora 2 依然是首選。話雖如此,Wan 2.5 和即夢都在極速進化中,考慮到內地 AI 生態系統的發展速度,這兩款工具絕對值得我們持續關注。

關於我們:JoJo Ventures

我們是立足於香港的專業影片製作公司,深耕影視技術多年,專精於結合 CGI(電腦合成影像)與 AI 技術,為品牌打造極具視覺衝擊力的影像內容。在 AI 浪潮下,我們協助企業打破傳統製作的限制,以更高效率、更具創意的方式說好品牌故事。

我們的實力深受業界認可,合作客戶涵蓋各領域的大型企業,包括:

  • 輝瑞 (Pfizer)
  • Bosch
  • Siemens
  • 惠康 (Wellcome)
  • 余仁生 (Eu Yan Sang)
  • 莎莎 (SaSa)

不論是高品質的廣告影片、企業形象宣傳,還是前衛的 AI 影像實驗,JoJo Ventures 都能為您提供專業的解決方案。

準備好迎接 2026 年的 AI 新時代嗎? 歡迎與我們聯絡,共同探討 AI 影片的可能性:

📧 電郵:business@jojo.ventures
📱 WhatsApp:+852 9853 7469