歡迎來(lái)到合肥浪訊網(wǎng)絡(luò)科技有限公司官網(wǎng)
  咨詢服務(wù)熱線:400-099-8848

人工智能繪畫(huà),驚喜伴著爭(zhēng)議

發(fā)布時(shí)間:2023-03-25 文章來(lái)源:本站  瀏覽次數(shù):2066

Midjourney生成的圖片“一只和汽車(chē)賽跑的貓”

Midjourney生成的圖片“香港街道上的出租車(chē)”


Midjourney生成的圖片“中國(guó)情侶”

一幅由人工智能(AI)生成的“中國(guó)情侶”圖片近期在國(guó)內(nèi)外社交媒體上被普遍轉(zhuǎn)發(fā),其逼真的視覺(jué)效果令不少網(wǎng)友感慨:“AI曾經(jīng)不遜于人類(lèi)畫(huà)師了。”這幅作品由AI圖片生成工具M(jìn)idjourney新推出的V5版本生成,該工具是近期繼GPT-4后又一遭到關(guān)注的AI產(chǎn)品。

在承受記者采訪時(shí),多名人工智能與互聯(lián)網(wǎng)業(yè)內(nèi)人士以為,Midjourney V5版本代表了目前生成式AI的前沿程度,其生成的圖像在某些范疇曾經(jīng)得到商用,經(jīng)過(guò)繼續(xù)學(xué)習(xí)和技術(shù)迭代,估計(jì)其才能能夠進(jìn)一步加強(qiáng)。不過(guò),上述人士也提到,Midjourney以及生成式AI由于經(jīng)過(guò)公開(kāi)數(shù)據(jù)停止鍛煉,其生成的作品在版權(quán)等問(wèn)題上存在較大爭(zhēng)議。

“中國(guó)情侶圖片”是如何出圈的

由美國(guó)一家工作室開(kāi)發(fā)的Midjourney于去年3月初次亮相,在當(dāng)年8 月迭代至V3版本并開(kāi)端引發(fā)一定的關(guān)注,而今年更新的V5版本讓Midjourney及其作品勝利“出圈”,代表作是上述的“中國(guó)情侶”圖片。

在這張圖片中,一對(duì)年輕中國(guó)情侶衣著夾克和牛仔褲坐在樓頂,背景是上世紀(jì)90年代的中國(guó)城市。由于在光影、人物細(xì)節(jié)、氣氛感等方面的出色描寫(xiě),這張圖片以至被一些網(wǎng)友以為是一張真實(shí)拍攝的老照片,而非AI生成的圖片。

據(jù)外媒報(bào)道,自上線以來(lái),Midjourney在圖像細(xì)節(jié)上不斷在不停進(jìn)步。Midjourney官方表示,V5版本的圖像質(zhì)量更高、輸出更多樣化、有更普遍的作風(fēng)、支持無(wú)縫紋理、有更寬的縱橫比、有更好的圖像提示以及更寬的動(dòng)態(tài)范圍等。

此外,該版本還大幅優(yōu)化了此前無(wú)法精確生成人物手部的問(wèn)題。一名運(yùn)用過(guò)Midjourney的畫(huà)師通知記者,在此前版本中,Midjourney對(duì)手部描寫(xiě)有很多問(wèn)題,例如手指數(shù)量錯(cuò)誤或形態(tài)扭曲,這也是此前分辨圖片能否為AI生成的主要判別根據(jù)。不過(guò),Midjourney V5版本在這方面有了明顯提升,固然仍能察看到手部不自然的狀況。

在V5版本之前,Midjourney已得到一系列應(yīng)用。去年9月,一幅名為《太空歌劇院》的作品取得了美國(guó)科羅拉多州博覽會(huì)藝術(shù)競(jìng)賽的金獎(jiǎng),這幅作品就是由Midjourney完成的。去年6月,英國(guó)雜志《經(jīng)濟(jì)學(xué)人》曾運(yùn)用Midjourney設(shè)計(jì)過(guò)一期封面,以照應(yīng)“AI新前沿”的封面故事主題。

記者近日也體驗(yàn)了Midjourney,該技術(shù)目前主要在通訊軟件Discord上以與“Midjourney bot”對(duì)話的方式運(yùn)用。經(jīng)過(guò)輸入提示詞的方式,記者能夠讓Midjourney bot生成相應(yīng)的圖片,提示詞能夠設(shè)定很多,還能夠請(qǐng)求分辨率、能否寫(xiě)實(shí)作風(fēng)等。通常Midjourney bot會(huì)在1分鐘左右生成4張圖片,用戶還能夠請(qǐng)求重重生成。

在運(yùn)用過(guò)程中,記者發(fā)現(xiàn)Midjourney的另一個(gè)問(wèn)題:用戶只能經(jīng)過(guò)提示詞來(lái)提出請(qǐng)求,但無(wú)法對(duì)圖片生成過(guò)程停止控制或修正,圖片生成更像是一個(gè)“黑盒”。因而,用戶需求不時(shí)改換或調(diào)整提示詞,讓生成的圖片更契合需求。創(chuàng)作出《太空歌劇院》的杰森·艾倫就曾對(duì)外媒透露,他總共生成了900多張圖片才選擇出稱(chēng)心的作品。

背后是什么技術(shù)

業(yè)內(nèi)人士通知記者,Midjourney是一種大模型生成式AI。2015年,谷歌公司的一名研討員創(chuàng)立了首個(gè)用于藝術(shù)創(chuàng)作的機(jī)器學(xué)習(xí)應(yīng)用 DeepDream。爾后,AI圖像生成開(kāi)端走進(jìn)群眾視野中。

一家知名跨國(guó)企業(yè)的AI算法工程師李濤通知記者,基于擴(kuò)散模型,Midjourney打造了本人的閉源模型,經(jīng)過(guò)抓取大量公開(kāi)數(shù)據(jù)停止鍛煉。與此同時(shí),Midjourney也不時(shí)搜集用戶反應(yīng)數(shù)據(jù)并對(duì)模型停止迭代,終構(gòu)成目前的成果。

擴(kuò)散模型屬于一種無(wú)監(jiān)視生成模型。計(jì)算機(jī)視覺(jué)處置開(kāi)源軟件庫(kù)OpenCV擔(dān)任人馬利克在承受外媒采訪時(shí)曾表示,擴(kuò)散模型應(yīng)用從文本數(shù)據(jù)中取得的學(xué)問(wèn)來(lái)了解單詞匯合在一同的語(yǔ)義,并與真實(shí)世界聯(lián)絡(luò)起來(lái),這使AI可以在不依賴(lài)特定數(shù)據(jù)集的狀況下生成更復(fù)雜和多變的圖像。馬利克以為,擴(kuò)散模型是生成式AI的嚴(yán)重進(jìn)步,由于它們不依賴(lài)監(jiān)視學(xué)習(xí)。經(jīng)過(guò)應(yīng)用從無(wú)監(jiān)視學(xué)習(xí)中取得的學(xué)問(wèn),這些模型能夠生成復(fù)雜多樣的圖像,而無(wú)須手動(dòng)標(biāo)志數(shù)據(jù),從而使其愈加靈敏。

一段時(shí)間以來(lái),不少公司均推出了AI圖片生成模型或相關(guān)產(chǎn)品。近日,微軟Bing宣布接入OpenAI的AI繪畫(huà)模型DALL·E,上線了AI生勝利能,Adobe也為旗下的Firefly模型新增了AI繪圖產(chǎn)品。

“再無(wú)法置信本人的眼睛”

雖然憑仗強(qiáng)大的圖片生勝利能,Midjourney曾經(jīng)取得上千萬(wàn)用戶,但它也遭到大量的批判與質(zhì)疑,首當(dāng)其沖的就是版權(quán)問(wèn)題。

美國(guó)《福布斯》雜志網(wǎng)站稱(chēng),與一切AI圖片生成工具一樣,Midjourney從互聯(lián)網(wǎng)上搜集了大量圖像停止鍛煉,使其可以創(chuàng)作出看似全新的藝術(shù)作品,這引發(fā)了人類(lèi)發(fā)明者的不滿。目前,曾經(jīng)有不少機(jī)構(gòu)和個(gè)人對(duì)Midjourney發(fā)起起訴,指控該公司涉嫌普遍地進(jìn)犯版權(quán)。

另?yè)?jù)媒體報(bào)道,美國(guó)版權(quán)局近日宣布,Midjourney等生成的AI圖像不受版權(quán)維護(hù)。在闡明文件中,美國(guó)版權(quán)局以為,經(jīng)過(guò)Midjourney等平臺(tái)自動(dòng)生成的作品,在整個(gè)創(chuàng)作過(guò)程中完整由機(jī)器人自動(dòng)完成,并且鍛煉的數(shù)據(jù)是基于人類(lèi)創(chuàng)作的作品,因而不受版權(quán)法維護(hù)。

上海申倫律師事務(wù)所律師夏海龍對(duì)記者表示,AI生成工具給人類(lèi)的版權(quán)法帶來(lái)宏大沖擊。一方面,相較海量的AI生成作品,即便其中存在侵權(quán)狀況,權(quán)益人也很難及時(shí)發(fā)現(xiàn);另一方面,在AIGC(人工智能生成內(nèi)容)時(shí)期,冗長(zhǎng)、昂貴的司法程序招致對(duì)版權(quán)維護(hù)也會(huì)越來(lái)越力不從心。人類(lèi)的版權(quán)法以及著作權(quán)維護(hù)機(jī)構(gòu)恐怕不得不作出嚴(yán)重調(diào)整。

除版權(quán)問(wèn)題外,越來(lái)越逼真的AI生成內(nèi)容也讓人擔(dān)憂這些圖片、視頻可能會(huì)被用作非法用處,例如用AI生成的圖片停止狡詐。美國(guó)前總統(tǒng)特朗普日前宣布,他將于21日被拘捕。隨后,大量經(jīng)過(guò)AI生成的“特朗普被捕”圖片在社交媒體上傳播,誤導(dǎo)了一局部網(wǎng)友。

印度News18新聞網(wǎng)則提到,近期有網(wǎng)友經(jīng)過(guò)AI生成了一張美國(guó)前總統(tǒng)奧巴馬與德國(guó)前總理默克爾在海邊一同吃冰激凌的圖片,這讓人們愈加擔(dān)憂將來(lái)會(huì)呈現(xiàn)怎樣的深度造假。該網(wǎng)站征引網(wǎng)友的評(píng)論稱(chēng),“這種技術(shù)正變得越來(lái)越可怕。技術(shù)越來(lái)越完善,目前的AI能夠創(chuàng)立簡(jiǎn)直圓滿的名人聲音或圖片,我們可能很快再無(wú)法置信本人的耳朵和眼睛。”此外,也有家長(zhǎng)向記者表達(dá)了AI生成不當(dāng)圖片對(duì)兒童影響的擔(dān)憂。

互聯(lián)網(wǎng)專(zhuān)家郭濤對(duì)記者表示,當(dāng)前AIGC技術(shù)尚處于早期探究階段,相關(guān)法律法規(guī)、規(guī)范體系和倫理標(biāo)準(zhǔn)等還不健全,存在數(shù)據(jù)平安風(fēng)險(xiǎn)、著作權(quán)侵權(quán)風(fēng)險(xiǎn)、深度偽造風(fēng)險(xiǎn)、商業(yè)機(jī)密泄露風(fēng)險(xiǎn)、違法信息傳播風(fēng)險(xiǎn)等問(wèn)題。有關(guān)部門(mén)需求盡快樹(shù)立健全相關(guān)法律法規(guī)和規(guī)范體系,增強(qiáng)內(nèi)容檢查及內(nèi)容過(guò)濾,推進(jìn)行業(yè)安康可持續(xù)開(kāi)展。

上一條:第四范式類(lèi)GPT產(chǎn)品“式...

下一條:打兩性“擦邊球”的聊天機(jī)...