OpenAI最新火力展示 純文字指令竟能生成逼真遠古長毛象
創造聊天機器人ChatGPT和圖像生成器DALL-E的科技公司OpenAI表示,公司正在測試一款由文本轉為影片的模型Sora,能讓用戶透過簡單的指令創造出逼真的影片。
法新社報導,這間獲微軟(Microsoft)支持的公司指出,這個新平台目前正在進行測試,不過釋出了幾段OpenAI稱已經可行的影片,附上生成影片的文字輸入指令。
OpenAI在部落格貼文中表示:「Sora能生成長達1分鐘的影片,同時維持視覺品質,並符合用戶的指令。」
OpenAI還說,這款模型也能從既有的靜態圖片生成影片。
OpenAI執行長阿特曼(Sam Altman)在社群媒體X上表示,公司在測試階段「向數量有限的創作者提供存取權限」。
Prompt: “Animated scene features a close-up of a short fluffy monster kneeling beside a melting red candle. the art style is 3d and realistic, with a focus on lighting and texture. the mood of the painting is one of wonder and curiosity, as the monster gazes at the flame with… pic.twitter.com/aLMgJPI0y6
— OpenAI (@OpenAI) February 15, 2024
他也邀請用戶在X上提出指令建議,幾分鐘後在這個平台上張貼頗具說服力的影片生成結果,其中包括兩隻黃金獵犬在山上開串流Podcast、老奶奶在廚房教烹飪、動物在海上騎腳踏車,以及珠光寶氣的動物園等。
還有另一支影片顯示「半鴨半龍的生物飛馳在美麗的暮色中,背上騎著一隻身著探險裝備的倉鼠」。
Prompt: “Several giant wooly mammoths approach treading through a snowy meadow, their long wooly fur lightly blows in the wind as they walk, snow covered trees and dramatic snow capped mountains in the distance, mid afternoon light with wispy clouds and a sun high in the distance… pic.twitter.com/Um5CWI18nS
— OpenAI (@OpenAI) February 15, 2024
不過這間總部位於舊金山的新創公司警告說,「目前的模型存有弱點」,像是左右不分,或未能在整段影片中維持視覺連貫性。
OpenAI聲明指出,安全性會是一大關鍵,還說Sora會面臨對抗性資安測試,也就是所謂的紅隊演練(red-teaming),期間特定用戶會試圖讓平台失靈,產生不恰當的內容或出毛病。
OpenAI指出:「我們會接洽全球政策制定者、教育家和藝術家,以瞭解他們的顧慮,並找出這種新技術的正面使用案例。」
臉書母公司Meta、谷歌(Google)和Runway AI也在研發文本轉文影片人工智慧(AI)技術,已經公布類似的工作樣本。
影音來源:YouTube NBC News
FB留言