A Midjourney alapítója, David Holz az AI hatásáról a művészetre, a képzeletre és a kreatív gazdaságra

középút az egyik vezető mozgatórugója a mesterséges intelligencia (AI) feltörekvő technológiájának, hogy szöveges üzenetekből vizuális képeket hozzon létre. A San Franciscó-i székhelyű startup a közelmúltban a Colorado állambeli vásáron díjat nyert műalkotás motorjaként jelent meg, és nem valószínű, hogy ez lesz az utolsó bonyolult probléma, amellyel a mesterséges intelligencia művészete szembesül az elkövetkező években.

A Midjourney az általa létrehozott képek festői esztétikáját hangsúlyozva különbözteti meg a többiektől a térben. A platform nem próbál fotórealisztikus képeket készíteni, amelyek összetéveszthetők a fényképekkel, és David Holz vezérigazgató azt mondja, hogy őt személy szerint nagyon nyugtalanítja a mélyhamisítások és a valóságot túl közelről szimuláló egyéb munkák elképesztő minősége. Ehelyett Holz azt mondja, hogy a Midjourney-t úgy tervezték, hogy felszabadítsa a hétköznapi emberek kreativitását azáltal, hogy eszközöket ad nekik gyönyörű képek készítéséhez pusztán leírásuk révén.

A vállalat humanista, fogyasztó-orientált fókusza ellenére azonban elkerülhetetlen kérdések merülnek fel a kereskedelmi művészet és a professzionális művészek számára. Interjút készítettem Holz-cal a egy tágabb részlet a lehetséges zavarokról, amelyeket a mesterséges intelligencia művészet okozhat a képalkotás során szórakoztatáshoz, videojátékokhoz és publikáláshoz. Íme egy hosszabb részlet a beszélgetésünkből, ahol Holz több mélységet és kontextust kínál, miközben ezekkel a kérdésekkel foglalkozik, és kifejti a vállalattal, az iparággal és a technológiával kapcsolatos elképzeléseit. Az interjút a terjedelem és az érthetőség kedvéért szerkesztettük.

Rob Salkowitz, a Forbes munkatársa: Mi a szereped és a beosztásod?

David Holz, Midjourney. Én vagyok az alapító és a vezérigazgató. Általában azonban jobban szeretem, ha az alapítónak hívnak, mert a vezérigazgató nagyon üzletszerűen hangzik, mi pedig nem vagyunk túl üzletemberek. Alkalmazott kutatólaboratórium vagyunk, amely termékeket gyárt.

Mi a Midjourney küldetése?

Szeretjük azt mondani, hogy megpróbáljuk kiterjeszteni az emberi faj képzelőerejét. A cél az, hogy az embereket fantáziadúsabbá tegyük, nem pedig az ötletgazdag gépeket, ami szerintem fontos különbség.

Tudná röviden bemutatni a cég történetét a mai napig?

Körülbelül másfél éve kezdtünk el dolgozni cégünk képzelőerején. Volt néhány áttörés a diffúziós modellekben, az emberek megértették a klipet, az openAI-t, ilyesmi. Szinte mindenki, aki ebben részt vesz, San Francisco, és mindannyian rájöttünk, hogy ez komoly lesz, és különbözik sok más dologtól.

Midjourney szerint milyen előnyökkel jár ez a szöveg-kép technológia az üzleti élet és a társadalom számára?

Határozottan jobban érdekel a társadalom, mint az üzlet. Fogyasztói termék vagyunk, de jelenleg a felhasználóink ​​30-50%-a profi. A többség nem. A platformon lévő művészek azt mondják, hogy ez lehetővé teszi számukra, hogy kreatívabbak és felfedezőbbek legyenek az elején, és rövid időn belül sok ötlettel álljanak elő.

Jelenleg professzionális felhasználóink ​​a platformot használják a koncepcióalkotáshoz. A legnehezebb része [egy kereskedelmi művészeti projektnek] gyakran az elején van, amikor az érintett nem tudja, mit akar, és látnia kell néhány ötletet, amire reagálnia kell. A Midjourney segíthet az embereknek sokkal gyorsabban konvergálni a kívánt ötlethez, mivel ezeknek a fogalmaknak az ismétlése nagyon munkaigényes.

A művészek másik előnye, hogy bizalmat ad az embereknek azokon a területeken, amelyekben nem bíznak. A legtöbb művész úgy érzi, hogy a művészetnek van olyan része, amelyet nem tud jól teljesíteni. Lehetnek színek, kompozíció, hátterek. Van egy híres karaktertervezőnk, aki használja a termékünket, és az emberek azt kérdezik tőle, hogy miért használna mesterséges intelligenciát, mivel már olyan ügyes vagy. És azt mondta: „Nos, én csak a karakteres részben vagyok jó. Ez segít a többiben, a világban, a háttérben, a színsémákban.”

Körülbelül hányan használják a terméket?

Milliók használják. A discordunk több mint kétmillió. Jelenleg ez a legnagyobb aktív Discord szerver.

Lehetővé teszi a Midjourney licence a platform által generált képek kereskedelmi felhasználását?

Igen. De ha egy millió dollárnál nagyobb éves bevételű cégnél dolgozik, akkor azt kérjük, hogy vásároljon vállalati licencet.

Hogyan épült fel az adathalmaz?

Ez csak egy nagy kaparás az interneten. A közzétett nyílt adatkészleteket használjuk, és ezeken keresztül betanítjuk. És azt mondanám, hogy az emberek 100%-a ezt csinálja. Nem voltunk válogatósak. A tudomány valóban gyorsan fejlődik abban a tekintetben, hogy mennyi adatra van valójában szüksége, szemben a modell minőségével. Néhány évbe fog telni, hogy rájöjjön a dolgokra, és addigra lehet, hogy olyan modelljei lesznek, amelyeket szinte semmi nélkül edz. Senki sem tudja igazán, mit tehet.

Kérte-e élő művészek hozzájárulását, vagy még mindig szerzői jogvédelem alatt áll?

Nem. Nem igazán lehet százmillió képet szerezni és tudni, hogy honnan származnak. Jó lenne, ha a képekbe metaadatok lennének beágyazva a szerzői jog tulajdonosáról vagy ilyesmi. De ez nem egy dolog; nincs nyilvántartó. Nincs mód arra, hogy megtaláljon egy képet az interneten, majd automatikusan visszakeresse a tulajdonoshoz, majd bármit megtehessen a hitelesítés érdekében.

Leiratkozhatnak a művészek az adatképzési modellben való részvételről?

Ezt nézzük. A kihívás most az, hogy megtudjuk, mik a szabályok, és hogyan lehet kitalálni, hogy egy személy valóban egy adott mű művésze, vagy csak a nevét írja rá. Senkivel nem találkoztunk, aki ki akarta volna venni a nevét az adathalmazból.

Leiratkozhatnak a művészek arról, hogy neveket kapjanak a felszólításokban?

Nem most. Ezt nézzük. Ismét meg kell találnunk a módját a kérések hitelesítésére, amelyek bonyolultak lehetnek.

Mit mondasz azoknak a kereskedelmi művészeknek, akik attól tartanak, hogy ez tönkreteszi a megélhetésüket? Egy bizonyos ponton miért fogadna fel egy művészeti igazgató illusztrátort, hogy olyan alkotásokat készítsen, mint a koncepcióművészet, a produkciós tervezés, a hátterek – ilyenek –, amikor egyszerűen beírhatja a felszólításokat, és sokkal gyorsabban és sokkal alacsonyabb költséggel juthat hasznos eredményhez?

Még mindig sok a munka. Ez nem csak az, hogy „csinálj hátteret”. Lehet, hogy tízszer kevesebb munka, de sokkal több munka, mint amennyit egy menedzser végez.

Szerintem ennek kétféle útja van. Az egyik lehetőség az, hogy megpróbáljuk alacsonyabb áron biztosítani ugyanazt a tartalmat, mint amit az emberek fogyasztanak, igaz? A másik megoldás pedig az, hogy vadul jobb tartalmat készítünk olyan árakon, amelyeket már hajlandóak vagyunk költeni. Azt tapasztalom, hogy a legtöbb ember, ha már költi a pénzt, és választhat a vadul jobb vagy olcsóbb tartalom között, valójában vadul jobb tartalmat választ. A piac már megállapított egy árat, amelyet az emberek hajlandóak fizetni.

Úgy gondolom, hogy néhányan megpróbálják kivágni a művészeket. Megpróbálnak majd valami hasonlót olcsóbban elkészíteni, és szerintem kudarcot vallanak a piacon. Úgy gondolom, hogy a piac a magasabb minőség, a kreativitás és a sokkal kifinomultabb, változatosabb és mélyebb tartalom felé halad. És azok az emberek fognak nyerni, akik valóban képesek használni, mint a művészek, és használják az ehhez szükséges eszközöket.

Ezek a technológiák valójában sokkal mélyebb megbecsülést és műveltséget hoznak létre a vizuális közegben. Lehet, hogy valóban megvan a kereslet, túlszárnyalja azon képességét, hogy ezen a szinten termeljen, és akkor talán valóban megemeli a művészek fizetését. Furcsa lehet, de ez fog történni. A minőség és a sokszínűség iránti kereslet növekedésének üteme csodálatos és váratlan projektekhez vezet.

Diákok egy generációja végzett művészeti iskolákban, sokan közülük erősen eladósodott, és viszonylag jól fizetett állásokra számítanak a szórakoztatóiparban, a videojáték-gyártásban, a kereskedelmi művészetben stb. Hogyan befolyásolja a jövőjüket az AI szöveg-kép platformok megjelenése?

Úgy gondolom, hogy egyesek megpróbálják csökkenteni a költségeket, és vannak, akik megpróbálják kiterjeszteni ambícióikat. Úgy gondolom, hogy azok az emberek, akik kiterjesztik az ambíciókat, továbbra is ugyanazokat a fizetéseket fogják fizetni, és azok, akik megpróbálják csökkenteni a költségeket, szerintem kudarcot vallanak.

Az Ai-t általában nagymértékben használják olyan dolgokra, mint a telefonközpontok vagy a repülőtéri poggyászfeladás, valamint az olyan jellegű munkák, amelyekkel az emberek nem igazán foglalkoznak. Az értékajánlat pedig az, hogy felszabadítja az embereket kifizetődőbb, érdekesebb munkák elvégzésére. De a művészeti munka kifizetődő és érdekes. Az emberek egész életükben dolgoznak, és fejlesztik készségeiket, hogy ilyen munkákat kapjanak. Miért pont ezt a technológiát a gazdaság azon szintjén, mint egyfajta üzleti fókuszt és prioritást az általad csinált dolgokhoz?

Én személy szerint nem. A cuccaim nem hivatásos művészeknek készültek. Ha szeretik használni, az nagyszerű. A cuccaim olyan embereknek készültek, akik például egy nő van Hongkongban, és odajött hozzám, és azt mondja: „Hongkongban az egyetlen dolog, amit a szüleid soha nem akarnak, hogy legyél, az egy művész, és én most bankár vagyok. Jó bankár életet élek. De a Midjourney-val most kezdek belekóstolni abba az élménybe, hogy olyan ember vagyok, aki lenni szerettem volna.” Vagy egy fickó a kamionmegállóban, aki saját maga készíti a baseball kártyáit vad képekkel, csak szórakozásból. Ezeknek az embereknek készült, mert a legtöbb emberhez hasonlóan ők sem tehetik meg ezeket a dolgokat.

Fontos hangsúlyozni, hogy ez nem a művészetről szól. Ez a képzeletről szól. A képzelőerőt néha használják a művészethez, de gyakran nem. A Midjourney-n készített képek többségét nem használják professzionálisan. Még csak nem is osztják meg őket. Csak más célokra használják őket, ezekre a nagyon emberi szükségletekre.

Mindazonáltal az Ön terméke képalkotás, amely az összes többi tulajdonságon túlmenően kereskedelmi értékkel is bír szakmai környezetben. És ez nagyon megzavarja a gazdaságot.

Azt hiszem, ez olyan, mintha egy hajót csinálnánk, és valaki versenyezhet vele, de ez nem jelenti azt, hogy a hajó a versenyzésről szól. Ha a csónakot használja a versenyzésre, akkor talán tetszik, igen, persze. Abban a pillanatban az. De az emberi oldal valóban számít, és azt hiszem, hogy nem… Szeretnénk széppé tenni a képeket. Nem tekintjük magunkat úgy, hogy művészetet próbálunk létrehozni a dolgunk részeként. Azt akarjuk, hogy a világ fantáziadúsabb legyen. Inkább készítsünk szép dolgokat, mint csúnya dolgokat.

Úgy gondolja, hogy bármely kormányzati szervnek joghatósága vagy felhatalmazása van ennek a technológiának a szabályozására? És ha igen, szerinted kellene?

Nem tudom. A szabályozás érdekes. Egyensúlyba kell hoznod a tennivalók szabadságát és a védendő szabadságot. Nem maga a technológia a probléma. Olyan, mint a víz. A víz veszélyes lehet, megfulladhat benne. De ez is elengedhetetlen. Nem akarjuk betiltani a vizet csak azért, hogy elkerüljük a veszélyes részeket.

Nos, biztosak akarunk lenni abban, hogy a vizünk tiszta.

Igen, ez igaz.

Forrás: https://www.forbes.com/sites/robsalkowitz/2022/09/16/midjourney-founder-david-holz-on-the-impact-of-ai-on-art-imagination-and-the- kreatív gazdaság/