„Az a nézet, hogy az MI-rendszerek sosem lesznek képesek olyan valódi zenét előállítani, mint az emberek, immár sokkal inkább társadalmi kontextusban értelmezhető, semmint a technikai képességek terén” – írja a The Conversation oldalán megjelent cikkében Oliver Bown, az Új-dél-walesi Egyetem kutatója. Bown fő kutatási területét a kreatív technológiai megoldások jelentik, kutatói munkájával párhuzamosan pedig elektronikus zenével és digitális művészettel is foglalkozik. Mint a cikkben fogalmaz, a zene ChatGPT-jeként márciusban bemutatott Suno, majd a nem sokkal később megjelent Udio zeneszerző alkalmazások olyan gyors ütemű változást jelölnek ki a zene világában, amely őt magát is ledöbbenti. „Amióta kipróbáltam a Sunót és az Udiót, azon gondolkozom, hogy pontosan mi is az, amiben változást hoztak – és hogy mit jelenthetnek nemcsak abban, ahogy a profi és amatőr művészek zenét szereznek, hanem abban is, ahogy mi mindannyian fogyasztjuk a zenei termékeket” – teszi hozzá.
Megkértük az Udiót, hogy hozzon létre egy popslágert a HáziPatikáról, a Gencraft segítségével pedig borítóképet is generáltattunk hozzá. Íme az eredmény:
Bown rámutat, hogy a két új alkalmazás abban tett hatalmas előrelépést, hogy egyszerű szöveges leírások alapján képesek nemcsak dalszöveget generálni, de azt egy generatív hangmodellbe ültetve, majd zenébe integrálva koherens dalrészleteket létrehozni. Mi több, az említett integráció olyan jó minőségű, hogy a másodpercek alatt generált dalok valóban úgy hangoznak, mintha élő ember énekelte volna fel azokat. „A hatás pedig elképesztő lehet. Tudatában vagyok, hogy ez csak mesterséges intelligencia, de az ének így is képes érzelmi hatást kifejteni. Amikor a dal egy tökéletesen kivitelezett ütemvégi piruettel lép be egy új szekcióba, az agyamban éppen olyan apró szikrákat gyújt a mintafeldolgozás öröme, mintha csak egy nagyszerű bandát hallgatnék” – mondja a szakértő. Egyszersmind szerinte ez arra mutat rá, hogy az MI-nek nincs szüksége arra, hogy érzelmeket éljen át ahhoz, hogy sikeresen ki tudja azokat fejezni zeneileg, és az ember képes legyen azonosulni velük.
Akárcsak más generatív-MI-rendszerek, a Suno és az Udio is valódi emberek által létrehozott zenei művek sokaságát elemezve tanult, ami persze sok vita alapja a szellemi jogok kapcsán. Ezzel együtt ez a két alkalmazás jelölheti a mainstrem MI zenei kultúra hajnalát. Újfajta zenei élményt kínálnak, amelyet az emberek felfedezhetnek, amellyel szórakoztathatják magukat, illetve amelyet akár élvezettel hallgathatnak. A technológia Bown szerint nem művészeknek készült, hanem a zeneszerető közönségnek. Régóta ismert jelenség ugyanis a kreatív technológiák kapcsán, hogy ahogy valamit egyre könnyebben és olcsóbban lehet előállítani, egyre hétköznapibb érzelmek kifejezésére szolgál. Így aztán a kezdetben magasművészetnek számító médiumok is lassanként hétköznapivá válnak, ahogy azt például az okostelefonok elterjedésével a fotográfia kapcsán megtapasztalhattuk. Képzeljük csak el, milyen lenne valamelyik barátunkat, családtagunkat a születésnapján egy kifejezetten róla szóló dallal meglepni, amelyet minimális költséggel és erőfeszítéssel létre tudtunk hozni – nos, éppen ezt kínálja most az MI.
Ugyanakkor ennek a technológiának is akadnak korlátai. Noha az Udio úgy hirdeti magát, hogy a segítségével „bárki egy dallammal, némi dalszöveggel, vagy egy vicces ötlettel kifejezheti magát a zenében”, Bown szerint ez nem teljesen igaz. Egy rövid szöveges parancs önmagában nem elég precíz instrukció valaminek a létrehozásához, pláne, ha zenéről van szó. Inkább csak arról van szó, hogy vakon tapogatózunk, de nincs érdemi kontrollunk a készülő dalok felett. Művészi önkifejezésre tehát nem alkalmasak ezek a rendszerek a szakember szerint, és a felhasználók nem is válnak zeneszerzővé a használatukkal, hanem megmaradnak egyszerű zenefogyasztóknak. Ezzel együtt a generatív zene szerinte éppúgy megoszthatja majd a figyelmünket a zenei kultúra ma ismert formáival, ahogyan azt a hangfelvételek tették annak idején az élő zenével szemben.
Borítókép: Gencraft.com