Ali bo umetna inteligenca povzdignila popularno glasbo v nove višave?

  • 19.02.2018

Ali pa jo bo tako izpopolnila, da v njej ne bo ostalo nič od življenja?

(Foto: Noma Bar)

Jesse Engel si popravi prenosnik z žarom obsedenega dirigenta, ki drvi skozi partituro. Je visok, v srednjih tridesetih, z neurejeno brado in temnimi lasmi, ki mu bingljajo prek ramen. V oprijetih kavbojkah in s kalejdoskopskim vzorcem na beli majici je videti bolj kot basist na turneji kot pa Googlov raziskovalni znanstvenik.

Sva v petem nadstropju Googlovega urada v San Franciscu, v dobro opremljenem glasbenem studiu, da bi se poučili o projektu Magenta, odprtokodnem projektu, ki uporablja umetno inteligenco in strojno učenje za izdelavo orodij za glasbenike. Magenta ponuja kode, s katerimi se uporabniki lahko poigravajo, vključno z umetnimi nevronskimi mrežami, ki so zasnovane tako, da spominjajo na nevrone v človeških možganih, in naučene, da izvajajo različne naloge. Ponuja pa tudi skupnost za ustvarjalce in ljubitelje tehnologije, da si lahko izmenjujejo lastne eksperimente.

Ob triu glasbenih klaviatur sedi Douglas Eck, višji raziskovalni znanstvenik pri Googlu. Ta oseminštiridesetletnik, ki nekoliko spominja na študenta višjega sloja, si je leta 2015 zamislil projekt Magenta. Javnosti je bil na voljo junija 2016.

Pripravljamo se, da bomo improvizirali. Tega nismo načrtovali; Eck in Engel sta meni ter mojemu prijatelju in kolegu iz glasbene skupine Adamu Davisu želela pokazati neko programsko opremo. A zdi se, da namerava Eck ohraniti spontano vzdušje. Kako naj bi bolje razumel Magento kot tako, da nanjo zaigraš?

Sam sedim za elektronskimi bobni. Davis zgrabi za električno kitaro fender stratocaster. Eck sedi za tipkami in komaj čaka, da začne igrati. Na tereminu (elektronskem instrumentu, ki ga igraš tako, da nad njim mahaš z rokami kot čarovnik) je Kory Mathewson, poletni praktikant, ki v prostem času izvaja improvizirane komedije z roboti. To, mi Eck pove z nasmeškom, mu je pomagalo pri tem, da so ga sprejeli.

Zdaj pa ostane še zadnji član naše glasbene skupine: program z imenom A. I. Duet, ki uporablja tehnologijo Magenta. Na priklopljeno klaviaturo zaigraš melodijo in program na podlagi izbire not, ritma, sinkop in glasbe, ki jo je slišal pred tem, prepozna vzorce. Nato generira nove melodije, skoraj v slogu call and response. Različica za notranjo uporabo, ki jo uporabljamo, lahko nadzoruje naključnost odgovora glede na to, kako visoko nastaviš 'temperaturo'. Engel za zvok izbere basovsko kitaro in začne improvizirati melodije. Ko dobi odgovor, ki mu je všeč, ga 'zaklene'. Nato vzame črno kitaro gibson les paul in jam session se začne.

To, kar smo skovali, je v redu, a sem bolj prevzet nad basom, ki prihaja iz A. I. Duet. Če bi bili resnična glasbena skupina, sem prepričan, da bi program uporabili še enkrat. Glasbenikom pogosto primanjkuje svežih idej, ta program pa jih ima očitno neomejeno zalogo.

»Tako je, kot da bi bil v prostoru še en glasbenik,« pravi Davis. Tudi on preizkusi Ai. I. Duet. Ko se navadi na inštrument, začne barvati zunaj črt, kar je najinim glasbenim kolegom očitno ugajalo. (»Res komaj čakamo, da vidimo, kako si bodo ljudje s tem dali duška,« reče Engel.) Temperaturo privije do vrha in začne proizvajati manične, strašljive melodije, ki so komaj podobne tistim, ki jih je vnesel v orodje. Zaigra uspavanko Twinkle, Twinkle, Little Star, da bi videl, kaj se bo zgodilo. Pri najvišji temperaturi zveni kot zadrogirana božična pesem.

»Tehnologija je za umetnost neverjetno pomembna,« pravi Eck. »Pomisli, da brenkaš na struno na tejle izklopljeni električni kitari. Zdaj pa jo vklopiš v ta neverjetni ojačevalec. Za uspešno igranje se že zdaj veliko zanašamo na tehnologijo.«

To, kar delamo, je podobno kot izdelovanje boljše enote za učinke kitare ‒ ali pa kar same električne kitare. Takšno je vsaj upanje. Za zdaj še niso prepričani, kako bo tehnologija vplivala na glasbo, in tudi ne, ali se bo uporabljala tako, kot načrtujejo. Spomnim se na Auto-Tune, program za snemanje, katerega prvotna funkcija je bila popravljanje visokih vokalnih skladb za neizrazito pop glasbo; raperji, kot sta T-Pain in Kanye West, so program obrnili na glavo, navili njegove lastnosti do skrajnosti in ustvarili čudne nove zvoke.

Ne glede na to, kaj se zgodi s tehnologijo umetne inteligence za generiranje glasbe, Eck meni, da bodo spremembe monumentalne. »Sledili bomo glasbenikom,« pravi. »Če bo nekdo uporabil nekaj, kar počnemo, in s tem naredil nekaj izjemnega, bomo verjetno rekli, o, naredimo zdaj še kaj podobnega! «

Ko poslušam Ecka, mi je jasno, da so njegovi možgani pripravljeni za geekanje nad algoritmi, vendar ga pri izdelovanju orodij za glasbenike vseh zvrsti vodi predvsem glasbena strast. Ko ga povprašam o njegovi lastni glasbi, presenečen izvem, da svojih rosnih let ni preživel sključen nad sintetizatorje; sramežljivo mi pove o svojem brenkanju na kitaro v napol polnih kavarnah.

• • •

Združevanje umetne inteligence in glasbe ni novost, debata o pravšnjem odmerku človeškega poseganja pa tudi ne. V petdesetih letih sta avantgardna skladatelja Lejaren Hiller in Leonard Isaacson uporabila računalnik, da sta napisala Illiac Suite. Skladba je sestavljena iz statistično generiranih not, ki sledijo določenim glasbenim načelom ‒ na primer harmonični soodvisnosti ‒ glede na pravila, ki temeljijo na skladateljevem poznavanju tradicionalne glasbe.

Do nedavnega je bila glasba, ustvarjena s pomočjo umetne inteligence, omejena predvsem na akademski svet. Zdaj pa na sceno prihajajo Google, Sony, IBM in druga podjetja z velikimi raziskovalnimi projekti. Svoj delež tehnologije zahtevajo tudi start-upi, kot sta Jukedeck, ki uporablja umetno inteligenco za generiranje oglasnih jinglov in glasbe za ozadje, ter Brain.fm, ki s pomočjo umetne inteligence ustvarja funkcionalno glasbo (ki pomaga pri sproščanju, osredotočanju, spanju itd).

Različne skupine prihajajo do podobnih rezultatov, a ima vsaka svoje načrte. Google razvija orodja za glasbenike in pripravlja odprtokodne, eksperimentalne programe, ki naj bi spodbudili ustvarjalnost. Jukedeck je svoja sredstva osredotočil na preprostost uporabe in cilja predvsem na podjetja, ki želijo prihraniti pri glasbi za videe. Soustanovitelj Jukedecka Patrick Stobbs mi pove, da želi podjetje razširiti svojo bazo strank na vse, ki jih zanima ustvarjanje glasbe. Tehnologijo želi uporabiti za pomoč morebitnim glasbenikom, da bi pisali pesmi, ne da bi se morali za to naučiti igrati na inštrument.

»Tako kot je z Instagramom povsem preprosto ustvarjati odlične fotografije, mi gledamo na Jukedeck kot na ustvarjalno orodje, ki omogoča veliko več ljudem na preprost način ustvarjati glasbo, in to z večjo močjo,« pravi.

Peščica aplikacij, ki uporabljajo podobno tehnologijo umetne inteligence, se je pojavila pred skoraj desetletjem, rezultati pa so bili večinoma borni. Microsoftov Songsmith generira spremljave za skladbe a cappélla, ki spominjajo na zvoke sintetizatorja. Program je navdihnil številne smešne videe, na primer veleuspešno izvedbo Freddieja Mercuryja We Will Rock You, nastavljeno na nekaj, kar je še najbolj podobno Latin Muzak.

Od takrat se je marsikaj spremenilo, vendar se tehnologija in okus še vedno spopadata. Lani je svet dobil v pokušino, kako bo zvenela glasba umetne inteligence, ko bo prišla v bližnji prihodnosti na sceno. Producent Alex Da Kid je sodeloval z Watsonom, superračunalnikom podjetja IBM, in ustvaril privlačno čustveno balado Not Easy. Watson je uporabil pet let kulturnih podatkov, vključno z naslovi internetnih časopisov, internetnimi iskanji, povzetki filmov in vsebino družbenih medijev, da je analiziral trende in z njimi povezana čustva ljudi. Predelal je tudi več kot 26 tisoč nedavnih pop skladb, da je našel skupne teme in glasbene vzorce. Z uporabo teh podatkov je superračunalnik določil 'čustveni prstni odtis' nedavne zgodovine in glasbene komponente, ki so izzvale močne čustvene odzive poslušalcev. Alex je nato uporabil te podatke, da je izbral temo strtega srca, pa tudi glasbene fraze in lirične fragmente, ki so mu bili všeč.

Pod vodstvom gremijevega nominiranca je bil rezultat sodelovanja pesem, namenjena najširšemu poslušalstvu, kar je mogoče. Skladba Not Easy je v 48 urah dosegla četrto mesto na seznamu iTunes Hot Tracks, hkrati pa ji je uspelo, da je bila, razen zgodbe, ki stoji za njo, v trenutku pozabljena. S tem, da je poskušala izmeriti čustveno temperaturo milijonov ljudi, ji je uspelo izraziti ... popolnoma nič. Znova pride prav primerjava z Auto-Tune. V rokah tistih, ki želijo izpopolniti popularno glasbo, bi tehnologija umetne inteligence prav lahko dosegla popoln uspeh in jo zdigitalizirala do zadnje note.

Sonyjevi laboratoriji za računalništvo v Parizu, ki jih financira Evropski raziskovalni svet, so poleti leta 2012 začeli petletni raziskovalni projekt za ustvarjanje pop glasbe s pomočjo umetne inteligence. Rezultati so nekje med Not Easy in Magento. Direktor laboratorijev François Pachet, računalniški znanstvenik ter džez in pop glasbenik, se z glasbo in umetno inteligenco ukvarja od devetdesetih let prejšnjega stoletja. On in njegova ekipa sodelujejo z glasbeniki bolj neposredno kot Google, njihov cilj ‒ ustvariti inovativno glasbo, ki temelji na popu, pri čemer indie glasbeniki uporabljajo niz algoritmov z imenom Flow Machines ‒ pa daje več poudarka na rezultate.

Ena od pesmi, ustvarjenih s pomočjo programa Flow Machines, Daddys Car, je lanskega septembra obkrožila svet. Ustvarjena je bila ob sodelovanju s francoskim skladateljem Benoîtom Carréjem, zveni pa neverjetno podobno kot Beatli sredi šestdesetih let ‒ morda zato, ker so med ustvarjanjem te pesmi program Flow Machines nahranili z ekskluzivnim menijem skupine Fab Four.

»Pesem Daddys Car je bila nekakšen pastiš,« pravi Fiammetta Ghedini, vodja komunikacije v Sonyjevih laboratorijih. »To je bila vaja v slogu. Dala nam je približen občutek, kaj bi se zgodilo, če bi bili Beatli spet skupaj.«

Razumevanje 'sloga' programa Flow Machines je odvisno od podatkov ‒ to pomeni, da ga naučiš določeno glasbo, on pa predvideva izbire, za katere bi se lahko odločil nekdo, ki ustvarja v tem slogu. Z drugimi besedami, pravila glasbe razume samo na podlagi izbranega niza podatkov in omejitev, ki jih določi programer. Program je dal Carréju več beatlovskih melodij in predlogov za akorde, iz katerih naj bi skomponiral pesem.

Da bi mi pomagala razumeti umetniški potencial programa Flow Machines, me Ghedini usmeri k drugačni, manj priljubljeni pesmi, ki jo je Carré napisal s programom, in sicer Mr. Shadow. Podatkovni niz zanjo je vključeval 429 pesmi »klasičnih ameriških piscev«, med katerimi so bili Cole Porter, George Gershwin, Richard Rodgers in Vernon Duke. Pesem sem poslušal večkrat zapored. Edini opis, ki mi pride na misel, je nelagoden avantgardni pop. Sekvence akordov so zlovešče, melodija pa hkrati zasanjana in grozeča. Neki uporabnik YouTuba je komentiral: »Popolna glasba za čez nekaj desetletij, ko bodo terminatorji z Gatlingovimi strojnicami pobili ljudi.« Ne vem, ali ob pesmi uživam, a se mi zdi, da dobivam vpogled v drugačno vrsto glasbe, in si želim slišati več.

Takšen vpogled je bilo mogoče dobiti leta 2016 na koncertu v Parizu ‒ velik del si je mogoče ogledati na YouTubu ‒, na katerem je nastopilo več glasbenikov, ki so sodelovali s programom Flow Machines. Rezultati so umetniško fascinantni in edinstveni ter veliko bolj zanimivi od pesmi Alexa Da Kida. Carré si letos želi izdati album svoje glasbe, ustvarjene s pomočjo Flow Machines. Drugi glasbeniki mu bodo morda sledili.

Google z glasbeniki sodeluje v manjši meri. Eck bi raje videl, da bi se njegova orodja uporabljala za eksperimentalno glasbo, namesto za mletje uspešnih singlov kot po tekočem traku ali za proizvajanje funkcionalne glasbe za ozadje, čeprav bi to dvoje lahko predstavljalo velika trga. (Jukedeck se hitro približuje cilju, da bi ustvaril neomejeno knjižnico brezplačnih videoskladb, kar bo ugodno vplivalo na ceno produkcije, neugodno pa na položaj skladateljev.) Upa, da bo vplival na umetnostno smer glasbe, in po njegovem mnenju je najboljši način, da to dosežeš, to, da daš orodje najnaprednejšim glasbenikom, ki niso nujno všeč širšim množicam.

»Dejavno bi si morali prizadevati, da bi ustvarjali glasbo, ki ni všeč vsakomur,« mi pove Eck. Če doseže določeno občinstvo, tudi če odvrne kakšno drugo, smo zmagali. Ko ustvariš nekaj novega in norega, te vedno čaka tisti učinek novosti. Ali se bodo ljudje vrnili naslednji teden in rekli: ʻPoglej, še ena pesem tistega programa umetne inteligence. Tudi to bi rad slišal!ʼ? Tudi tu je mogoče potegniti vzporednico s pop glasbo. Tako kot velezvezde od Madonne do Beyoncé črpajo navdih z obrobja, bo tudi jutrišnja pop elita v svoje uspešnice vpletala inovacije underground glasbenikov, ki bodo ustvarjali s pomočjo umetne inteligence.

Eduardo Reck Miranda, britanski profesor, ki se s tem področjem ukvarja od sredine osemdesetih let, ima v srcu poseben prostor za čudaške špranje v glasbi, ki jih lahko osvetli umetna inteligenca.

Miranda, ki je izvorno iz Brazilije, je bil najprej skladatelj, a ga je privlačila tehnologija kot sredstvo za izvajanje glasbe. Njegovo navdušenje zanjo je nalezljivo. Pripoveduje mi o svoji skladbi Symphony of Minds Listening: zanjo je razvil program umetne inteligence, s katerim je ustvaril remix Beethovnove Simfonije št. 7, pri tem pa je uporabljal slike možganov, da bi dekonstruiral, kako ljudje poslušajo glasbo.

»Ali lahko strojem to dejansko uspe? To vprašanje smo si postavljali,« pravi, »toda po tem, ko smo se zavedli, da strojem to dejansko lahko uspe in da lahko dojamejo, kako dolgočasna je običajna glasba, se je vprašanje spremenilo: Kako lahko ti stroji naredijo nekaj uporabnega?«

Velik del tehnologije, na kateri temelji ta debata, je starejše od Mirandovih, Eckovih in Pachetovih eksperimentov. Veliko zaslug za to tehnologijo pa pripada Davidu Copu ‒ modernemu mistiku in človeku, ki odnos med umetno inteligenco in ustvarjalnimi možgani morda razume bolje kot kdo drug.

Cope je kakih 30 let delal na kalifornijski univerzi v Santa Cruzu. Zdaj je bivši profesor z mehkim glasom star 76 let in še naprej komponira glasbo in se ukvarja z drugimi vrstami umetnosti, večinoma z uporabo umetne inteligence.

Ko se vzpenjam po stopnicah Copove udobne hiše v Santa Cruzu, me opozori: »Pripravite se, da vas bo vrglo na rit.« Brez dodatnih pojasnil odpre vrata pisarne in razkrije se prostor, ki je, v neposrednem nasprotju s preostankom hiše, v popolnem neredu. S stropa visi na ducate vetrnih zvončkov. Povsod so razmetani knjige in naključni predmeti, kot da bi pravkar preživeli tornado. Sredi sobe je vadbeno kolo.

Kaos, mi pove, je nameren: omogoča mu, da pogleda katerakoli dva objekta in skuša najti odnos med njima. Tako kot je njegov program spodbuda za ustvarjanje glasbe, je nered ustvarjalna spodbuda, ki se zanaša na presenetljivo moč naključja. To pove veliko o tem, kako vse skupaj v temelju deluje.

Cope že od najstniških let piše algoritme. Napisal je približno 100 knjig, v katerih se odstavki o računalniško generirani glasbo pojavljajo že od leta 1977. Leta 1980 je začel dolgoročni projekt Experiments in Music Intelligence, ki ga je pozneje skrajšal v EMI in nato v Emmy, da bi se izognil morebitni kršitvi avtorskih pravic založbe. V devetdesetih letih je začel razvijati nov program, Emily Howell. Po navadi tega ne priznava, a človeško ime mu je dal delno zato, da bi zbodel nasprotnike, ki trdijo, da bodo stroji spravili ob službo človeške skladatelje. Ob tem si dovoli nekaj posmeha. »Stroji naredijo to, kar jim rečemo, naj naredijo,« pravi. »Ne zavedajo se sami sebe. Nimajo zavesti. Jaz umetno inteligenco definiram kot preučevanje uporabe računalnikov, da bi razumeli človeške možgane in kako delujejo. To je vse.«

Vpraša me, kaj delajo skladatelji, ko pišejo. Nisem čisto prepričan.

»Krademo,« reče. »To pomeni, da najpomembnejši del algoritma sploh ni algoritem. To je skupek glasbe. To interpretiram kot mozaik melodij, razpoloženj in slogov, ki jih glasbeniki krpajo skupaj, medtem ko ustvarjajo svoje lastno delo.« Cope se je zavedel, da morajo računalniki delovati na enak način.

Leta 1988 je ustvaril niz podatkov z uporabo stotin primerkov svoje glasbe. V približno 24 urah je Emmy ustvaril skladbo Craddle Falling, za katero Cope trdi, da je ena najboljših, kar jih je napisal. Poslušanje te skladbe in drugih Emmyjevih izborov, pravi, je dokaz za njegovo teorijo, da skladatelji kradejo: »Izpostavilo je elemente, za katere nisem vedel, da so v moji glasbi tako eksplicitni, in sicer so to odlomki skladateljev, ki name najbolj vplivajo.«

Zavem se, da je to, kar Google in Sony delata z globokim učenjem, neposredna razširitev Copovega pristopa, ki je odvisen od podatkov. Miranda se strinja, a doda, da je pristop nepopoln, kar je eden od razlogov, da je bil njegov ustvarjalni postopek vedno eksperimentalen.

»En sam program umetne inteligence ne more popolnoma utelesiti tega, kako ustvarjamo glasbo,« pravi Miranda. »Največ, kar lahko naredimo, je, da problem osredotočimo na določene vidike.«

Kar nas pripelje do še enega nejasnega vprašanja, ki velja za vse ustvarjalno generativne modele. Za glasbo, ustvarjeno z umetno inteligenco, ni meril za uspeh. Programi za prevajanje jezikov so po zaslugi tehnologije strojnega učenja v zadnjih letih dosegli gromozanski napredek. Vsi se strinjamo, kako uspešni so, ker so rezultati objektivni. A kako naj določimo vrednost glasbe, ustvarjene s pomočjo tehnologije umetne inteligence? Uspeh na glasbenih lestvicah? Veliko poslušalstva? Pozitivne kritike? Eck in njegova ekipa pri Googlu jo definirajo kot stalen interes glasbenikov. Ko bodo glasbeniki uporabljali ta orodja tudi potem, ko bo minila začetna evforija zaradi novosti, ker bodo verjeli, da so rezultati, ki jih dosegajo, dobri ‒ ne glede na mnenje poslušalstva ‒, šele takrat bo umetna inteligenca zasedla stalno mesto v širokem, natrpanem kraljestvu glasbe.

• • •

Ko zapustiva Google, se z Davisom pogovoriva o izkušnji. »Všeč mi je, da sem videl rob, kjer se začnejo stvari krhati,« pravi. »Na določenih točkah je iztirilo. Ni vedelo, kaj naj naredi z informacijami, ki jih je dobilo. To je ustvarilo resnično zanimivo glasbo.«

Jason Freidenfelds, višji vodja komunikacij pri Googlu, verjame, da bo vpliv umetne inteligence v glasbi presegel vpliv kakršnegakoli tehnološkega napredka.

»Vpliv bi bil lahko tako pomemben kot izvirni preskok od trenutka, ko so ljudje ustvarjali glasbo predvsem s svojimi telesi, do takrat, ko so začeli ustvarjati inštrumente, ki so imeli lastne značilnosti in so ustvarjali svoje zvoke,« pravi. »Umetna inteligenca bi lahko konkurirala preskoku od preprostih predmetov do zapletenih inštrumentov. Zdaj bodo inteligentni tudi sami inštrumenti. Ne bodo samo proizvajali novih zvokov, temveč tudi edinstvene ideje za nove barve ali melodije, na podlagi katerih bodo lahko glasbeniki improvizirali.«

Pozneje mi Freidenfelds pošlje dve novi klavirski skladbi, ki ju je ustvarila Magenta brez kakršnegakoli človeškega posega. Njuna kompleksnost in odtenki me šokirajo.

Številne glasbenike in ljubitelje glasbe je upravičeno strah, da bo tehnologija umetne inteligence poštene ljudi spravila ob delo, ustvarjalnost pa potisnila na najmanjši skupni imenovalec. A prav Davisovo spodbujanje k poigravanju z orodji in iskanju rež je tisto, na kar računajo inovatorji, kot so Eck, Engel, Miranda in Pachet. Računalniki ne nazadnje delajo napake, tako kot mi. In čudaški, nepopoln in nepredvidljiv človeški instinkt je tisto gonilo, ki bo umetni inteligenci dalo moč, da ponovno definira glasbo.

TEKST Aaron Carnes
ILUSTRACIJA Noma Bar

Na spletnih straneh Adria Media Ljubljana uporabljamo piškotke z namenom zagotavljanja spletne storitve, oglasnih sistemov in funkcionalnosti, ki jih brez njih ne bi mogli nuditi.

Z nadaljnjo uporabo spletnih mest soglašate z uporabo piškotkov.
Če piškotkov ne želite, jih lahko onemogočite v nastavitvah

zapri