Inteligența artificială vrea să deschidă drumul către muzică – dar e cale lungă până acolo

Ingeniozitatea programelor de inteligență artificială (IA) nu se rezumă doar la răspunsuri text, fie ele integrate în motoare de căutare sau nu. Companiile de tehnologie se întrec, de curând, să ofere programe sau aplicații IA tot mai diverse pentru a atrage investitorii și publicul, deopotrivă.

Dincolo de fascinantele imagini pe care DALL-E sau Midjourney le poate genera și chiar la fel de amuzant ca Bing Chat, inteligența artificială care poate genera muzică este noua zonă de interes pe care dezvoltatorii încearcă s-o extindă.

În momentul de față cel mai popular program IA care tranformă textul în muzică aparține companiei Voicemod. La bază, Voicemod oferă o aplicație care îți modifică vocea prin intermediul microfonului folosit.

Recent, însă, compania a oferit publicului acces la inteligența lor artificială care transformă un text în muzică.

Muzica generată prin IA este o realitate! […] Alegeți o melodie, un cântăreț și scrieți propriile versuri pentru a crea un cântec original în câteva secunde”, a scris compania într-o postare pe Twitter.

Programul poate fi accesat aici și oferă o serie de negative prestabilite (din mai multe genuri muzicale) și șapte voci cu diferite caracteristici. Singurul lucru pe care trebuie să-l faci este să introduci versurile pentru melodia pe care dorești s-o generezi.

Amuzant, dar limitat

Ca orice alt serviciu ce conține inteligență artificială, cel oferit de Voicemod vine și el la pachet cu ceva limitări. Pe lângă evidentul fapt că trebuie să alegi dintr-o serie prestabilită de melodii și voci, programul nu se descurcă foarte bine cu alte limbi în-afară de engleză.

Ca să testez asta, am preluat versurile unei melodie din trending-ul românesc de pe YouTube, le-am scris pe Voicemod, iar rezultatul a fost inteligibil. Am încercat cu diferite negative și voci, însă melodia finală nu sună a nimic ce se apropie de limbă vorbită. Un factor îl reprezintă și faptul că nu recunoaște diacriticele, deci pronunția este din start greșită.

Pe lângă aceste lipsuri tehnice, Voicemod a implementat anumite măsuri menite să combată exploatarea programului. Cuvintele considerate vulgare nu sunt acceptate, iar utilizatorii au un număr limitat de folosiri gratuite a aplicației.

Cu toate astea, programul este destul de amuzant și distractiv de folosit. De fapt, Voicemod îl și promovează în acest fel, încurajând crearea de meme-uri muzicale. Personal, cea mai bună combinație din cele testate pare a fi negativul Lazer Beam cu vocea Mary.

Mai există un alt program ce poate genera muzică din text. Se numește MusicLM și este devoltat de o echipă din cadrul Google. Momentant, MusicLM nu este disponibil publicului larg, însă mostrele oferite de Google sunt destul de impresionante. În mod evident, programul este mai complex și, aparent, poate genera muzică din orice, chiar și din descrierea unora dintre cele mai celebre picturi din lume, iar calitatea audio este foarte ridicată.

Sectorul inteligenței artificiale se schimbă, literalmente, de la o zi la alta, lucru ce presupune nu doar exemple fascinante, ci și probleme ce țin de drepturi de autor și originalitate. Într-un articol de recomandare publicat luna trecută, aminteam de nemulțumirea mai multor oameni din domeniul creativ, care se plâng că programele IA nu fac altceva decât să imite niște modele deja disponibile pentru a genera răspunsuri utilizatorilor.

Cu alte cuvinte, aceste aplicații învață din informațiile pe care le găsește pe internet. Unde se trage linia de plagiat între negativul unei melodii a lui Ed Sheeran și posibilele similarități pe care inteligența artificială le generează când este rugată să ofere o mostră de muzică pop? Nu avem un răspuns în acest sens, iar lucrurile se pot agrava mai ales că tot mai multe companii decid să folosească inteligența artificială pentru a-și ușura munca.