sora是什么?一款劃時(shí)代的視頻智造軟件 二維碼
134
OpenAI,是一家位于美國舊金山的人工智能研究公司,現(xiàn)由營利性公司OpenAI LP及非營利性母公司OpenAI Inc組成。核心宗旨在于“創(chuàng)建造福全人類的安全通用人工智能(AGI)”。使命是建立安全有益的AGL,確保通用人工智能造福全人類。OpenAI以大模型為核心開創(chuàng)了AI領(lǐng)域的新一輪創(chuàng)新范式,成為引領(lǐng)通用人工智能領(lǐng)軍企業(yè)。 OpenAI最早為非營利組織,于2015年底由包括薩姆·奧爾特曼(Sam Altman)、彼得·泰爾(Peter Thiel)、里德·霍夫曼(Reid Hoffman)和埃隆·馬斯克(Elon Musk)等創(chuàng)辦。2016年,發(fā)布首個(gè)產(chǎn)品,即一款開源強(qiáng)化學(xué)習(xí)工具包——OpenAI Gym和Universe。隨著2018年埃隆·馬斯克的退出以及大模型對(duì)資金超乎預(yù)期的需求,2019年3月,OpenAI從非營利性轉(zhuǎn)變?yōu)椤胺忭敗钡臓I利性。同年7月,微軟與OpenAI合作,注資10億美元,共同研發(fā)新的Azure AI超算技術(shù)。2021年,設(shè)立初創(chuàng)企業(yè)基金,擬投資1億美元支持AI初創(chuàng)公司。2022年11月,OpenAI全新聊天機(jī)器人模型ChatGPT問世,給AIGC的應(yīng)用帶來了更多的希望,產(chǎn)品上線僅5天用戶數(shù)量突破100萬。2024年2月,文生視頻大模型Sora問世,在全球內(nèi)容創(chuàng)作行業(yè)卷起新的風(fēng)暴,成為人工智能發(fā)展進(jìn)程中的“里程碑”,使OpenAI估值不到10個(gè)月增加近兩倍,或達(dá)800億美元。 2023年,公司收入突破16億美元。微軟是最大的投資者,擁有OpenAI股份49%。OpenAI躋身全球TOP50網(wǎng)站,位列福布斯《2023云計(jì)算100強(qiáng)榜單》榜首。以企業(yè)估值7100 億列2024年·胡潤全球獨(dú)角獸榜第3。 作為 OpenAI 推出的全新視頻AI編輯軟件,Sora 最近受到了許多用戶的關(guān)注。 sora官網(wǎng):https://openai.com/sora 2024年2月16日,OpenAI在其官網(wǎng)上面正式宣布推出文本生成視頻的大模型 Sora。 Sora能夠根據(jù)簡單的文本描述,生成高達(dá)60秒的高質(zhì)量視頻,使得視頻創(chuàng)作變得前所未有的簡單和高效。Sora的應(yīng)用范圍非常廣泛,從教育教學(xué)、產(chǎn)品演示到內(nèi)容營銷等,都可以通過Sora來實(shí)現(xiàn)高質(zhì)量的視頻內(nèi)容創(chuàng)作。 一、Sora 是什么 那么,Sora 到底是什么呢?官方給出的釋義:Creating video from text(從文本創(chuàng)建視頻)。Sora是一個(gè)智能的視頻編輯生成應(yīng)用軟件,可以幫助用戶更加方便的輕松生成各類視頻。它是 OpenAI發(fā)布的首個(gè)文本生成視頻模型“Sora”,該模型通過接收文本指令,即可生成長達(dá)60秒的短視頻。 二、Sora 的優(yōu)勢和不足 2.1 現(xiàn)實(shí)世界擬真 教人工智能理解和模擬運(yùn)動(dòng)中的物理世界,目標(biāo)是訓(xùn)練模型,幫助人們解決需要現(xiàn)實(shí)世界交互的問題。 讓機(jī)器能夠像人類一樣,對(duì)世界產(chǎn)生一個(gè)全面而準(zhǔn)確的認(rèn)知。這一特性使得AI視頻生成更流暢、更符合邏輯。 這個(gè)可以看文章后面官網(wǎng)的視頻,基本上看不出來是AI制作的,很逼真。 2.2 長視頻能力 Sora 可以生成長達(dá)一分鐘的視頻,同時(shí)保持視覺質(zhì)量并遵守用戶的提示。 這個(gè)能力應(yīng)該是當(dāng)前所有文本生成視頻模型所不具備的,在 Sora 沒出來之前,文本生成視頻領(lǐng)域的大哥應(yīng)該是 Runway,但是Runway也只能生成4秒長的視頻,用戶可以將其最多延長至16秒,是AI生成視頻在2023年所能達(dá)到的最長時(shí)長紀(jì)錄。 為啥生成視頻難?視頻一秒目前大概是16幀左右,兩秒就要生成32張圖片,而且圖片之間還要有連貫的邏輯。 2.3 多角色、更細(xì)節(jié)、更準(zhǔn)確 Sora 能夠生成具有多個(gè)角色、特定類型的運(yùn)動(dòng)以及主題和背景的準(zhǔn)確細(xì)節(jié)的復(fù)雜場景。 該模型不僅了解用戶在提示中要求的內(nèi)容,還了解這些東西在物理世界中的存在方式。 2.4 情感豐富、多鏡頭 Sora 模型對(duì)語言有深刻的理解,使其能夠準(zhǔn)確地解釋提示并生成表達(dá)生動(dòng)情感的引人注目的角色。 Sora 還可以在單個(gè)生成的視頻中創(chuàng)建多個(gè)鏡頭,以準(zhǔn)確保留角色和視覺風(fēng)格。 2.5 復(fù)雜場景難模擬、空間細(xì)節(jié)容易混淆——弱點(diǎn) Sora 目前難以準(zhǔn)確模擬復(fù)雜場景的物理特性,并且可能無法理解因果關(guān)系的具體實(shí)例。例如,一個(gè)人可能會(huì)咬一口餅干,但之后,餅干可能沒有咬痕。 Sora 模型還可能混淆提示的空間細(xì)節(jié),例如,左右混淆,并且可能難以精確描述隨時(shí)間推移發(fā)生的事件,例如遵循特定的相機(jī)軌跡。 2.6 檢測誤導(dǎo)內(nèi)容 Sora 團(tuán)隊(duì)還在構(gòu)建工具來幫助檢測誤導(dǎo)性內(nèi)容,例如檢測分類器,可以判斷視頻何時(shí)由 Sora 生成。 文本分類器將檢查并拒絕違反我們使用政策的文本輸入提示,例如那些請求極端暴力、色情內(nèi)容、仇恨圖像、名人肖像或他人 IP 的提示。 還開發(fā)了強(qiáng)大的圖像分類器,用于查看生成的每個(gè)視頻的幀數(shù),以幫助確保在向用戶顯示視頻之前,這些視頻符合我們的使用政策。 其實(shí)這是所有AIGC工具的通病,這個(gè)也是合規(guī)的重要評(píng)判標(biāo)準(zhǔn)之一。 三、Sora怎么使用 3.1、使用Sora前的準(zhǔn)備工作 在開始之前,確保您已經(jīng)擁有了OpenAI賬目,并獲得了Sora的訪問權(quán)限。準(zhǔn)備好您想要轉(zhuǎn)化成視頻的文本描述,記住越詳細(xì)越好。 3.2、Sora使用步驟之文本描述 登錄您的OpenAI賬戶,找到Sora的使用界面。在指定區(qū)域輸入您的文本描述,可以是一個(gè)故事概述、場景描述或是具體的動(dòng)作指令。 3.3、Sora使用步驟之生成視頻 完成文本描述和自定義設(shè)置后,點(diǎn)擊“生成視頻”按鈕。Sora將開始處理您的請求,這可能需要幾分鐘時(shí)間。完成后,您可以預(yù)覽生成的視頻。 需要注意的是,截止2024年2月16日,OpenAI只向部分專業(yè)用戶開放了Sora的訪問權(quán)限。普通用戶只能觀看其發(fā)布的演示視頻。
文章分類:
行業(yè)資訊
以信載商,良心建站。遨游始終秉承“一次建站、終身維護(hù)”的宗旨,竭誠為客戶提供最優(yōu)質(zhì)的互聯(lián)網(wǎng)服務(wù)。遨游建站率先植入seo優(yōu)化理念,讓你的網(wǎng)頁更利于搜索引擎抓取,關(guān)鍵詞排名更靠前。可仿站、可定制。無論是傳統(tǒng)型企業(yè)官網(wǎng)、集團(tuán)型品牌官網(wǎng),還是營銷型網(wǎng)站、電商型網(wǎng)站、定制型網(wǎng)站、特殊行業(yè)網(wǎng)站(醫(yī)療、教育),全部搞定。 公司:網(wǎng)站建設(shè)_小程序設(shè)計(jì)_競價(jià)托管代運(yùn)營公司;郵箱:1013601535@qq.com 手機(jī):17073547034;QQ: 1013601535 在線留言咨詢,24小時(shí)內(nèi)回復(fù)
我想咨詢 *
企業(yè)名稱
手機(jī)號(hào)碼 *
您的姓名
所在城市 提交 |
網(wǎng)站建設(shè)問題
熱門標(biāo)簽
最新發(fā)布 |