Süni intellekt və musiqi: Yaradıcı alət yoxsa sənətçinin əvəzçisi?

Musiqi mədəniyyətin ən qədim və eyni zamanda ən emosional ifadə vasitələrindən biridir. Musiqi insanın daxili aləmini, duyğularını, düşüncələrini əks etdirən bir dil, bir sənət formasıdır. Tarix boyu musiqi insanın yaradıcılıq təxəyyülünün məhsulu olmuş, ifaçının şəxsi hiss və düşüncələri ilə həyat tapmışdır. Amma texnologiyanın inkişafı ilə bu sahəyə yeni oyunçu daxil olur: süni intellekt. Süni intellekt alqoritmlər, böyük verilənlər bazası və statistik modellər vasitəsilə işləyən proqram təminatıdır. Son illərdə alqoritmlər cəmiyyətin bütün sahələrinə təsir göstərib və bu sahələrdən biri də musiqidir. Hazırda süni intellekt müxtəlif janrlarda musiqi yarada bilir, məşhur ifaçıların səslərini təqlid edir, hətta dinləyicinin fərdi zövqünə uyğun melodiyalar təqdim edə bilir. Bəzi proqramlar bir neçə dəqiqə içində tamamilə yeni kompozisiyalar hazırlayır və onları dərhal yaymaq mümkündür. Bu proses musiqi sənətinin gələcəyi üçün ciddi suallar doğurur. Süni intellekt sənətçiyə yardımçı vasitə kimi xidmət edəcək, yoxsa insan yaradıcılığının yerini alacaq? Yaradıcılığın emosional tərəfi alqoritmlərlə əvəz oluna bilərmi?


Qara Qarayev adına Mərkəzi İncəsənət məktəbinin nəzəriyyə şöbəsinin müəllimi, musiqişünas Pərvin Səfərli Olaylar.az-a açıqlamasında  deyib ki,bu məsələ son dövrlərdə olduqca aktualdır. Süni intellekt sahəsi keçən əsrin ortalarında yaranıb, lakin son illərdə çox geniş inkişaf edərək artıq real tətbiq mərhələsinə keçib. Bu texnologiya təkcə iş yerlərimizi deyil, ailə həyatımızı və ictimaiyyətin digər sahələrini, o cümlədən yaradıcılığı da əhatə edir:" Ancaq yaradıcılıq anlayışının öz adından da göründüyü kimi, o, ilk növbədə ruhla bağlıdır. Ruhun və intellektin vəhdətindən yüksək sənət nümunəsi yaranır. Musiqidə də süni intellektdən istifadə etmək mümkündür, lakin musiqi sənəti və musiqi peşəkarlığı tamam başqa anlayışlardır. Peşəkar qulağı heç vaxt aldatmaq mümkün deyil. Əgər sən peşəkar sənətlə məşğul olursansa, bu sənətin dərinliyi və incəliyinı hakimsənsə, burada aldanmaq mümkün deyil. İnsan faktoru-insanın düşüncəsi, fikirləri, daxili aləmi və ruhu yaradıcılığın əsasını təşkil edir. Bədii əsər insanın ruh, intellekt, dünyagörüşü, həyat təcrübəsi, hadisələri qavrama və onları yaradıcılıq süzgəcindən, bədii təfəkkür prizmasından keçirərək ortaya qoyduğu bir sənət nümunəsidir. Söhbət burada konkret olaraq sənətdən, peşəkar sənətdən gedir. Musiqi çoxşaxəli bir sənətdir: kino musiqisi var, pop musiqisi, ciddi, yüngül musiqi növləri və s. mövcuddur. Bir çox sahələrdə süni intellekt insanı əvəz edə bilər. Ancaq burada söhbət musiqi sənətindən gedir. Məsələn, kino musiqisini götürək. Kino musiqisi əsasən dekorativ xarakter daşıyır, obraz və hadisələri müşaiyət edir. Bəli, elə musiqi nümunələri yaradıla bilər ki, süjeti tamaşaçıya yüksək səviyyədə təqdim etsin. Artıq qulağımız Hollywood filmlərinin musiqisinə öyrəşib, bu xüsusda müəyyən bir model formalaşıb. Filmin musiqisi müəyyən streotip üzərində qurulur, hər bir səhnəyə özəl bir musiqi dili var və biz bu musiqi dilini başa düşüb qəbul edirik. Bu, konveyer vasitəsilə yaranan musiqidir. Lakin sizə kino musiqisini yüksək sənət nümunəsi kimi göstərən bir misal təqdim edim. Q.Qarayev rejissor Q. Kozintsevin "Don Kixot" filminə musiqi yazmışdır. Rejissor öz xatirələrində bildirir: "Mən heç vaxt filmlərimin efir nümayişinə baxmıram. Televizorda "Don Kixot" filminin növbəti dəfə nümayiş etdirirdilər. Mən durub otaqdan çıxmaq istədim, Lakin Qarayevin musiqisi məni dayanmağa məcbur etdi və mən sırf musiqiyə görə filmə tamaşa etdim" Bax, bu musiqi artıq sırf dekorativlikdən, müşaiyətdən çıxaraq fərdi bir əsər kimi təzahür edir. Təsadüfi deyil ki, Q.Qarayev filmin musiqisi əsasında simfonik qravürlər yazmış və ona simfonik həyat vermişdir.
Peşəkar sənətə gəldikdə... Musiqidə elə qanunauyğunluqlar var ki, süni intellekt onları yerinə yetirə bilmir. Bəstəkar bir ideya təqdim edir, onun musiqi forma və məzmununu təyin edir, müəyyən bir quruluş yaradır. Məsələn, klassik musiqi formaları içərisində sonata-Alleqro forması, klassik musiqi janrları arasında simfoniya janrı var ki, bunlar həyati konfliktlərin, təzahürlərin bədii modeli kimi ən tutarlı forma və məzmuna malikdirlər.  Məsələn, sonata formasında iki əsas mövzu verilir - həyatın əsasən iki müxtəlif yönümünü, əks qütbləri əks etdirən iki mövzu. Bu mövzular əsərin inkişafı zamanı qarşıdurmalara, dəyişikliklərə məruz qalır. Bu proses isə yalnız bəstəkara, yaradıcı ruha məxsus yolla aparılır. Onun həyat təcrübəsindən, dünyaya, hadisələrə baxış prizmasından keçirilərək. Burada dramaturgiya məsələsi var-ideyanın musiqi vasitəsilə dramaturji baxımdan necə təqdim olunması və həll olunması. Hər bəstəkar bunu fərqli şəkildə edir və bu fərqlilik, peşəkarlıq ortaya sənət nümunəsi qoyur.
Müasir musiqi sənətinin də öz forma və məzmunu, fərqli dramaturgiyası və musiqi dili var. Çünki nə qədər insanın yaradıcı ruhu var, bir o qədər də yeni üslub və cərəyanlar ortaya çıxır.  
Süni intellekt tərəfindən yazılmış musiqi nümunələrini dinlədikdə görürəm ki, bir mövzu qoyulur, lakin o inkişaf etmir, cüzi dəyişikliklərlə əsər sona çatır. Bəstəkar musiqisi belə olmur. Bəstəkar musiqisində mövzu dəyişir, həyat konfliktlərini əks etdirir və bizi kulminasiyaya aparır. Müxtəlif növ dramaturgiya və onun  mərhələləri var: problem qoyulur və həll edilir. Süni intellekt bunu edə bilmir. Peşəkar musiqi prosesində mövcud olan təfəkkür, yaradıcılıq və musiqi düşüncəsi süni intellektdə yoxdur. Ona görə də deyirəm ki, yaradıcı, peşəkar qulağı süni intellekt aldada bilmir. O, yalnız bəzi tərəfləri verə bilir, lakin zənginliyi təqdim edə bilmir. Bəsit nümunələr yaradır, melodiyanı məntiqsiz qurur, üslubları qarışdırır, amma bunu peşəkar səviyyədə etmir. Çünki peşəkar səviyyədə üslub qarşılaşdırmaları məsələsinə ciddi yanaşılır. Süni intellekt verilmiş proqram, modellər əsasında işləyir, yaradıcı insan isə hansı bazadan çıxacağını, hansı texniki və peşəkar mərhələlərdən keçəcəyini fərdi olaraq özü müəyyən edir və nəticədə bədii əsər ortaya çıxır. Süni intellektdə bu proses yoxdur. 
Düzdür, müxtəlif eksperimentlər aparılıb və süni intellekt musiqisi dinləyicilərə təqdim edilib. Amma zalda oturan dinləyicilər peşəkar qulağa malik deyillər. Onlar yalnız intonasiya bazasını eşidirlər, musiqinin daxili zənginliyini duya bilmirlər. Müəyyən səviyyədə aldadılırlar, amma peşəkar səviyyədə yox. Çünki əsər zahiri prosesdən ibarət deyil, onun daxili prosesi var. Bu, roman oxumağa bənzəyir: paralel xətlər, konfliktlər, personajların qarşıdurmaları. Əsərin bədii yükü və keyfiyyəti süni intellekt tərəfindən heç vaxt tam şəkildə yaradıla bilməz. Gələcəkdə nə baş verəcəyini görəcəyik, amma indiki mərhələdə musiqi baxımından süni intellekt mənim üçün qorxulu deyil. Kino, pop və yüngül xarakterli musiqi sahələrində istifadə oluna bilər, burada biznes tərəfi də böyükdür. Amma sənət sahəsində işləməyəcək. Digər tərəfdən, bu proqramların peşəkar və qeyri-peşəkar səviyyələri var. Daha çox ödəniş tələb edən proqramlar daha peşəkar tətbiqlərdir və onlardan əsasən peşəkar musiqiçilər istifadə edə bilər. Məncə, yeni texnikalar yaradıcı insanın əlinə düşəndə çox faydalı ola bilər. Yaradıcı insan bu texnikaları öz ideyalarına köməkçi kimi istifadə edə bilər. Bu vasitələrdən düzgün istifadə edərək yeni, innovativ ideyalar ortaya çıxarmaq mümkündür. Məsələn, gələcəkdə dinləyici ilə ifaçı arasında neyro-bağlantı yarana və bu bağlantı vasitəsilə musiqi əsərləri formalaşa bilər. Müasir texnologiyalar artıq insan düşüncələrini və hisslərini birbaşa musiqiyə çevirmək imkanlarını ortaya qoyur. Amma bu imkanlar yenə də yaradıcı insanın əlində olmalıdır. 
Süni intellekt indiyə qədər yaranmış musiqi bazasından, intonasiya və ifadə vasitələrindən istifadə edir. O, mövcud bazanı qarışdıraraq nəsə təqdim edir və bu, orijinal olmur. Sənət orijinallıq, individuallıq tələb edir. Bu, mənim sırf musiqişünaslıq baxışımdır. Mənim çox sevdiyim politoloq İrina Xakamarda da deyir ki, süni intellekt gələcəkdə bizi bir çox sahədə əvəz edə bilər, amma yaradıcılıq sahəsində yox. Çünki yaradıcılıq ruhu Allahın verdiyi ruhdur-unikaldır, təkrar olunmazdır.
İnsan gərək səmimi olsun. Səmimiyyət dedikdə nəyi seçdiyimiz vacibdir: canlınımı seçirik, yoxsa cansızımı? Təəssüf ki, dövr bizi canlı ilə cansız arasındakı fərqin azaldılmasına doğru aparır. Bu fərqi itirməmək lazımdır. İki nümunə təqdim olunsa- süni intellekt musiqisi və canlı insan musiqisi-ilk dəqiqələrdə fərqi anlamaq çətin ola bilər. Amma sonra insan qulağı, duyumu bu fərqi tutacaq. Hələ ki, tutacaq. Gələcəkdə texnologiya o səviyyəyə çata bilər ki, bu fərqi hiss etmək çox çətin ola bilər. İnsan isə indidən öz seçimini etməlidir: hansı amilə daha çox üstünlük vermək- insan ruhuna və intellektinəmi, onun ortaya qoyduğu məhsulamı, yoxsa cansız alətin.... Fikrimcə, müasir dövrümüzdə cəmiyyət, fərdiyyət  böyük bir seçim qarşısındadır. Əgər biz indi seçim etməsək, gələcəkdə bizim özümüzün seçimə məruz qalacağımız  labüddür. Mən texnologiyanın inkişafının əleyhinə deyiləm. Əksinə, onun bizə yeni üfüqlər aça biləcəyi fikrindəyəm. Lakin bu insan ruhunun, yaradıcılığının ziddinə, əleyhinə olmamaq şərtilə...    Arzu edirəm ki, insanlar daha çox canlı ünsiyyəti, yaradıcılığı və insan ruhunu seçsinlər".
 Süni intellekt musiqi yaradan zaman hansı əsas texnologiyalardan və məlumat bazalarından istifadə edir və bu proses insan yaradıcılığı ilə texniki baxımdan nə dərəcədə müqayisə oluna bilər? Alqoritmlərin tanınmış ifaçıların səsini və üslubunu təqlid etməsi texniki baxımdan nə qədər təhlükəsizdir və bu, gələcəkdə musiqi sənayesində hansı riskləri yarada bilər? AI mütəxəssisi, Alas Academy direktoru Natiq Məmişovin fikrincə süni intellekt musiqi yaradarkən bir neçə əsas texnologiyaya əsaslanır:"Birinci istiqamət neyron audio kodeklərdir (audio → "token" çevrilməsi). Müasir sistemlərin əksəriyyəti səsi birbaşa dalğa forması kimi emal etmir. Audio əvvəlcə "sıxılmış" diskret kodlara - tokenlərə çevrilir. Məsələn, SoundStream kimi neyron kodeklər audionu encoder/decoder və kvantlaşdırma mexanizmi ilə kodlaşdırır. 


İkinci texnologiya Transformer əsaslı "dil modeli" yanaşmasıdır. Bu mərhələdə tokenlər artıq musiqinin bir növ "əlifbası" kimi davranır. Model bu token ardıcıllığını növbəti tokeni proqnozlaşdırmaq prinsipi ilə generasiya edir. MusicGen bu yanaşmanın klassik nümunəsidir.
Üçüncü istiqamət diffusion modelləridir, xüsusən də "latent" məkanda işləyən sistemlər. Bəzi "text-to-audio" və "text-to-music" modelləri səsin latent təmsilində səs-küyü mərhələli şəkildə "təmizləyərək" audionu formalaşdırır. Stable Audio Open bu prosesi açıq şəkildə autoencoder, mətn embedding-ləri və latent-space diffusion transformer (DiT) kombinasiyası kimi təsvir edir.
Dördüncü əsas məqam şərtləndirmədir (conditioning). Model təsadüfi musiqi yaratmır, adətən mətn promptları ilə şərtlənir. Bu promptlara janr, ovqat (mood), tempo, alətlər və mövzu daxildir. Bəzi hallarda isə melodiyalar, ritm və akkordlar kimi idarəedici siqnallar da istifadə olunur.
Məlumat bazaları nədən ibarət olur?
Böyük həcmdə audio treklər + metadata: janr, tempo, alətlər, etiketlər; bəzən mətn təsviri və ya "tag"lər. Bəzi modellər Creative Commons kimi açıq lisenziyalı datasetlərə fokuslanır (məs: Stable Audio Open-un fərqli dataset yanaşması).
İnsan yaradıcılığı ilə texniki müqayisə necədir? Oxşarlıq ondan ibarətdir ki, həm insan, həm də süni intellekt dinlədiyi və öyrəndiyi nümunələrdən stil, harmoniya, ritm və forma qanunauyğunluqlarını mənimsəyir. Fərq isə ondadır ki, insan "niyə bu hissəni belə etdim?" sualına məqsəd, kontekst, emosional niyyət və şəxsi həyat təcrübəsi ilə cavab verir. Süni intellekt isə əsasən ehtimallar üzərindən "ən uyğun davam"ı qurur. Praktik nəticədə AI çox vaxt demo, prototip və ideya generatoru kimi güclü olur. "İmza" yaradıcılığı, dərin məna və kontekst uyğunluğu isə hələ də ən stabil şəkildə insanda qalır". 
Tanınmış ifaçıların səsini və üslubunu təqlid etmək nə qədər təhlükəsizdir? Natiq Məmişov bildirir ki, bu, texniki baxımdan təhlükəsiz sayılmır. Çünki səs biometrik kimlikdir:
"Səs klonlaşdırılması və impersonasiya təkcə musiqi məsələsi deyil, identifikasiya və etibar məsələsidir. Platformalar da bunu risk kimi qiymətləndirir. Məsələn, Spotify 2025-ci ildə icazəsiz səs klonu və impersonasiya ilə bağlı siyasətini sərtləşdirib və bu cür kontentin silinəcəyini açıqlayıb. Sənaye riskləri real ssenarilərlə özünü göstərir.
Bunlara impersonasiya və reputasiya zərəri daxildir: "filan artist yeni mahnı buraxdı" görüntüsü ilə saxta buraxılışlar. Digər risk royalti fırıldağı və spam selidir. Platformalara kütləvi şəkildə AI musiqisi yüklənir. Spotify son 12 ayda 75 milyon AI spam trek sildiyini açıqlayıb.
Bundan əlavə, hüquqi və etik mübahisələr mövcuddur: hansı hallarda bu, sadəcə üslub təqlididir, hansı hallarda isə səs kimliyinin oğurluğu sayılır? Bu sərhəd getdikcə daha konfliktli olur. Dinləyicinin aldadılması və "deepfake audio" ilə bağlı şəffaflıq problemi də ciddi risklər arasındadır". 
Ekspert qeyd edir ki, süni intellekt musiqi nəzəriyyəsinin qaydalarını əl ilə tətbiq etmir. O, böyük həcmdə məlumatdan statistik və struktur pattern-ləri öyrənir və onları yeni kombinasiyalarda "sample" edir:
"Bu texnologiyanın inkişafında əsas risklər nələrdir? Birinci risk hüquq və razılıq məsələsidir. Datasetlərin lisenziyası, artistlərin səsinin və tembrinin icazəsiz istifadəsi, müəlliflik hüquqları və gəlir bölgüsü bu kateqoriyaya daxildir.
İkinci risk impersonasiya, fırıldaqçılıq və dezinformasiyadır. Saxta artist buraxılışları, saxta duetlər, şantaj və reputasiya hücumları buna nümunədir. Platformaların siyasəti sərtləşdirməsi də məhz bununla bağlıdır. 
Üçüncü risk bazarın kontent seli ilə keyfiyyətsizləşməsidir. Kütləvi AI musiqi yüklənməsi dinləyici üçün axtarışı çətinləşdirir, real artistlərin görünürlüğünü azalda bilər və spam, royalti sui-istifadəsini artırır.
Dördüncü risk şəffaflıq və etiketləmə ilə bağlıdır. AI ilə yaradılan kontentin açıq şəkildə işarələnməsi, dinləyicinin aldadılmaması üçün tənzimləmələr aparılır.
Beşinci risk isə yaradıcılıq ekosisteminə təsirdir. "Səs və üslub bazarı" formalaşır- kimlik və üslub lisenziyası olan və olmayan iki paralel bazar yaranır ki, bu da sənaye daxilində gərginliyə səbəb olur".
Bu müzakirələr göstərir ki, süni intellekt musiqi sahəsində nə tam xilaskar, nə də sənətçinin birbaşa əvəzçisidir. O, insan yaradıcılığının əsasında duran ruhu, fərdi təcrübəni və daxili dramaturgiyanı daşıya bilmir, amma düzgün əllərdə güclü bir alətə çevrilə bilər. Texnologiya musiqinin istehsal formasını dəyişir, lakin onun mahiyyətini hələ ki dəyişdirə bilmir. Əsl sual süni intellektin nə qədər irəli gedəcəyi deyil, insanın bu inkişaf qarşısında nəyi qoruyacağıdır. Canlı ifanın, fərdi üslubun, səmimi emosiyanın dəyəri qorunduqca, musiqi sənət olaraq qalacaq. Əks halda, sürətlə çoxalan səslər içində ruhu olan musiqini tapmaq getdikcə çətinləşəcək. Seçim yenə də insanın öz əlindədir: alqoritmlərin qurduğu səslərimi, yoxsa insan ruhunun yaratdığı musiqinimi dinləmək?

Zeynəb Mustafazadə 

Təklifinizi, şikayətinizi bizə yazın. Sizi dinlərik. 055 634 88 31