人工智能繪畫(huà)，驚喜伴著爭(zhēng)議

發(fā)布時(shí)間：2023-03-25 文章來(lái)源：本站瀏覽次數(shù)：2066

Midjourney生成的圖片“一只和汽車(chē)賽跑的貓”

Midjourney生成的圖片“香港街道上的出租車(chē)”

Midjourney生成的圖片“中國(guó)情侶”

一幅由人工智能（AI）生成的“中國(guó)情侶”圖片近期在國(guó)內(nèi)外社交媒體上被普遍轉(zhuǎn)發(fā)，其逼真的視覺(jué)效果令不少網(wǎng)友感慨：“AI曾經(jīng)不遜于人類(lèi)畫(huà)師了。”這幅作品由AI圖片生成工具M(jìn)idjourney新推出的V5版本生成，該工具是近期繼GPT-4后又一遭到關(guān)注的AI產(chǎn)品。

在承受記者采訪時(shí)，多名人工智能與互聯(lián)網(wǎng)業(yè)內(nèi)人士以為，Midjourney V5版本代表了目前生成式AI的前沿程度，其生成的圖像在某些范疇曾經(jīng)得到商用，經(jīng)過(guò)繼續(xù)學(xué)習(xí)和技術(shù)迭代，估計(jì)其才能能夠進(jìn)一步加強(qiáng)。不過(guò)，上述人士也提到，Midjourney以及生成式AI由于經(jīng)過(guò)公開(kāi)數(shù)據(jù)停止鍛煉，其生成的作品在版權(quán)等問(wèn)題上存在較大爭(zhēng)議。

“中國(guó)情侶圖片”是如何出圈的

由美國(guó)一家工作室開(kāi)發(fā)的Midjourney于去年3月初次亮相，在當(dāng)年8 月迭代至V3版本并開(kāi)端引發(fā)一定的關(guān)注，而今年更新的V5版本讓Midjourney及其作品勝利“出圈”，代表作是上述的“中國(guó)情侶”圖片。

在這張圖片中，一對(duì)年輕中國(guó)情侶衣著夾克和牛仔褲坐在樓頂，背景是上世紀(jì)90年代的中國(guó)城市。由于在光影、人物細(xì)節(jié)、氣氛感等方面的出色描寫(xiě)，這張圖片以至被一些網(wǎng)友以為是一張真實(shí)拍攝的老照片，而非AI生成的圖片。

據(jù)外媒報(bào)道，自上線以來(lái)，Midjourney在圖像細(xì)節(jié)上不斷在不停進(jìn)步。Midjourney官方表示，V5版本的圖像質(zhì)量更高、輸出更多樣化、有更普遍的作風(fēng)、支持無(wú)縫紋理、有更寬的縱橫比、有更好的圖像提示以及更寬的動(dòng)態(tài)范圍等。

此外，該版本還大幅優(yōu)化了此前無(wú)法精確生成人物手部的問(wèn)題。一名運(yùn)用過(guò)Midjourney的畫(huà)師通知記者，在此前版本中，Midjourney對(duì)手部描寫(xiě)有很多問(wèn)題，例如手指數(shù)量錯(cuò)誤或形態(tài)扭曲，這也是此前分辨圖片能否為AI生成的主要判別根據(jù)。不過(guò)，Midjourney V5版本在這方面有了明顯提升，固然仍能察看到手部不自然的狀況。

在V5版本之前，Midjourney已得到一系列應(yīng)用。去年9月，一幅名為《太空歌劇院》的作品取得了美國(guó)科羅拉多州博覽會(huì)藝術(shù)競(jìng)賽的金獎(jiǎng)，這幅作品就是由Midjourney完成的。去年6月，英國(guó)雜志《經(jīng)濟(jì)學(xué)人》曾運(yùn)用Midjourney設(shè)計(jì)過(guò)一期封面，以照應(yīng)“AI新前沿”的封面故事主題。

記者近日也體驗(yàn)了Midjourney，該技術(shù)目前主要在通訊軟件Discord上以與“Midjourney bot”對(duì)話的方式運(yùn)用。經(jīng)過(guò)輸入提示詞的方式，記者能夠讓Midjourney bot生成相應(yīng)的圖片，提示詞能夠設(shè)定很多，還能夠請(qǐng)求分辨率、能否寫(xiě)實(shí)作風(fēng)等。通常Midjourney bot會(huì)在1分鐘左右生成4張圖片，用戶還能夠請(qǐng)求重重生成。

在運(yùn)用過(guò)程中，記者發(fā)現(xiàn)Midjourney的另一個(gè)問(wèn)題：用戶只能經(jīng)過(guò)提示詞來(lái)提出請(qǐng)求，但無(wú)法對(duì)圖片生成過(guò)程停止控制或修正，圖片生成更像是一個(gè)“黑盒”。因而，用戶需求不時(shí)改換或調(diào)整提示詞，讓生成的圖片更契合需求。創(chuàng)作出《太空歌劇院》的杰森·艾倫就曾對(duì)外媒透露，他總共生成了900多張圖片才選擇出稱(chēng)心的作品。

背后是什么技術(shù)

業(yè)內(nèi)人士通知記者，Midjourney是一種大模型生成式AI。2015年，谷歌公司的一名研討員創(chuàng)立了首個(gè)用于藝術(shù)創(chuàng)作的機(jī)器學(xué)習(xí)應(yīng)用 DeepDream。爾后，AI圖像生成開(kāi)端走進(jìn)群眾視野中。

一家知名跨國(guó)企業(yè)的AI算法工程師李濤通知記者，基于擴(kuò)散模型，Midjourney打造了本人的閉源模型，經(jīng)過(guò)抓取大量公開(kāi)數(shù)據(jù)停止鍛煉。與此同時(shí)，Midjourney也不時(shí)搜集用戶反應(yīng)數(shù)據(jù)并對(duì)模型停止迭代，終構(gòu)成目前的成果。

擴(kuò)散模型屬于一種無(wú)監(jiān)視生成模型。計(jì)算機(jī)視覺(jué)處置開(kāi)源軟件庫(kù)OpenCV擔(dān)任人馬利克在承受外媒采訪時(shí)曾表示，擴(kuò)散模型應(yīng)用從文本數(shù)據(jù)中取得的學(xué)問(wèn)來(lái)了解單詞匯合在一同的語(yǔ)義，并與真實(shí)世界聯(lián)絡(luò)起來(lái)，這使AI可以在不依賴(lài)特定數(shù)據(jù)集的狀況下生成更復(fù)雜和多變的圖像。馬利克以為，擴(kuò)散模型是生成式AI的嚴(yán)重進(jìn)步，由于它們不依賴(lài)監(jiān)視學(xué)習(xí)。經(jīng)過(guò)應(yīng)用從無(wú)監(jiān)視學(xué)習(xí)中取得的學(xué)問(wèn)，這些模型能夠生成復(fù)雜多樣的圖像，而無(wú)須手動(dòng)標(biāo)志數(shù)據(jù)，從而使其愈加靈敏。

一段時(shí)間以來(lái)，不少公司均推出了AI圖片生成模型或相關(guān)產(chǎn)品。近日，微軟Bing宣布接入OpenAI的AI繪畫(huà)模型DALL·E，上線了AI生勝利能，Adobe也為旗下的Firefly模型新增了AI繪圖產(chǎn)品。

“再無(wú)法置信本人的眼睛”

雖然憑仗強(qiáng)大的圖片生勝利能，Midjourney曾經(jīng)取得上千萬(wàn)用戶，但它也遭到大量的批判與質(zhì)疑，首當(dāng)其沖的就是版權(quán)問(wèn)題。

美國(guó)《福布斯》雜志網(wǎng)站稱(chēng)，與一切AI圖片生成工具一樣，Midjourney從互聯(lián)網(wǎng)上搜集了大量圖像停止鍛煉，使其可以創(chuàng)作出看似全新的藝術(shù)作品，這引發(fā)了人類(lèi)發(fā)明者的不滿。目前，曾經(jīng)有不少機(jī)構(gòu)和個(gè)人對(duì)Midjourney發(fā)起起訴，指控該公司涉嫌普遍地進(jìn)犯版權(quán)。

另?yè)?jù)媒體報(bào)道，美國(guó)版權(quán)局近日宣布，Midjourney等生成的AI圖像不受版權(quán)維護(hù)。在闡明文件中，美國(guó)版權(quán)局以為，經(jīng)過(guò)Midjourney等平臺(tái)自動(dòng)生成的作品，在整個(gè)創(chuàng)作過(guò)程中完整由機(jī)器人自動(dòng)完成，并且鍛煉的數(shù)據(jù)是基于人類(lèi)創(chuàng)作的作品，因而不受版權(quán)法維護(hù)。

上海申倫律師事務(wù)所律師夏海龍對(duì)記者表示，AI生成工具給人類(lèi)的版權(quán)法帶來(lái)宏大沖擊。一方面，相較海量的AI生成作品，即便其中存在侵權(quán)狀況，權(quán)益人也很難及時(shí)發(fā)現(xiàn)；另一方面，在AIGC（人工智能生成內(nèi)容）時(shí)期，冗長(zhǎng)、昂貴的司法程序招致對(duì)版權(quán)維護(hù)也會(huì)越來(lái)越力不從心。人類(lèi)的版權(quán)法以及著作權(quán)維護(hù)機(jī)構(gòu)恐怕不得不作出嚴(yán)重調(diào)整。

除版權(quán)問(wèn)題外，越來(lái)越逼真的AI生成內(nèi)容也讓人擔(dān)憂這些圖片、視頻可能會(huì)被用作非法用處，例如用AI生成的圖片停止狡詐。美國(guó)前總統(tǒng)特朗普日前宣布，他將于21日被拘捕。隨后，大量經(jīng)過(guò)AI生成的“特朗普被捕”圖片在社交媒體上傳播，誤導(dǎo)了一局部網(wǎng)友。

印度News18新聞網(wǎng)則提到，近期有網(wǎng)友經(jīng)過(guò)AI生成了一張美國(guó)前總統(tǒng)奧巴馬與德國(guó)前總理默克爾在海邊一同吃冰激凌的圖片，這讓人們愈加擔(dān)憂將來(lái)會(huì)呈現(xiàn)怎樣的深度造假。該網(wǎng)站征引網(wǎng)友的評(píng)論稱(chēng)，“這種技術(shù)正變得越來(lái)越可怕。技術(shù)越來(lái)越完善，目前的AI能夠創(chuàng)立簡(jiǎn)直圓滿的名人聲音或圖片，我們可能很快再無(wú)法置信本人的耳朵和眼睛。”此外，也有家長(zhǎng)向記者表達(dá)了AI生成不當(dāng)圖片對(duì)兒童影響的擔(dān)憂。

互聯(lián)網(wǎng)專(zhuān)家郭濤對(duì)記者表示，當(dāng)前AIGC技術(shù)尚處于早期探究階段，相關(guān)法律法規(guī)、規(guī)范體系和倫理標(biāo)準(zhǔn)等還不健全，存在數(shù)據(jù)平安風(fēng)險(xiǎn)、著作權(quán)侵權(quán)風(fēng)險(xiǎn)、深度偽造風(fēng)險(xiǎn)、商業(yè)機(jī)密泄露風(fēng)險(xiǎn)、違法信息傳播風(fēng)險(xiǎn)等問(wèn)題。有關(guān)部門(mén)需求盡快樹(shù)立健全相關(guān)法律法規(guī)和規(guī)范體系，增強(qiáng)內(nèi)容檢查及內(nèi)容過(guò)濾，推進(jìn)行業(yè)安康可持續(xù)開(kāi)展。

上一條：第四范式類(lèi)GPT產(chǎn)品“式...

下一條：打兩性“擦邊球”的聊天機(jī)...