Фуријеова музика

Анализирајући слику звучних таласа, може се закључити да су то кривудаве линије које се у одређеном временском интервалу непрекидно крећу горе–доле. Различити облици одговарају другачијим звуцима. Када из стерео уређаја музика путује према звучницима, ради се о електронској верзији звука – о таласању напона у непрекидном, аналогном виду. Помоћу магнета и електромагнета, који је у звучнику повезан с мембраном која може да се покреће (вибрира) – поново се добија звук.

image020
Да би смо музику слушали на рачунару, звук, односно музика, морају најпре да се претворе у низове бројева. Најпознатији поступак је PCM (Pulse Code Modulation), који подразумева узимање узорака (енг. sampling) висине напона звучних таласа у великом броју узастопних тренутака. Једну секунду протеклог аналогног таласа, PCM аналогно-дигитални претварач описује помоћу 44.100 бројева. У случају кампактних (чврстих) дискова, сваки напон мери се с тачношћу од 16 бита, тако да може да се забележи чак 65.536 различитих напона. То значи да је овај начин омогућио шифровање било ког аналогног звука бројевима – и да ће њихово поновно претварање у звук дати такав квалитет да га људско ухо неће разликовати од оригинала.
Oвакав поступак захтевао је велики простор за смештај података – 10 мегабајта за сваки минут снимљене стерео музике! Зато су такви музички фајлови били превелики да би се у разумном времену размењивали преко Интернета. И ту је у помоћ позван Фурије.

Fourier2

Он је открио занимљиву појединост која постоји у свету који нас окружује: сваки талас, колико год он био сложен, састоји се од врло једноставних синусних таласа. То јест, Фурије је показао да сваки, па и звучни, талас може да се преобрати у низ једноставних синусних и косинусних таласа, различитих фреквенција и амплитуда. Њему у част, тај математички поступак назван је Фуријеова трансформација. Када се оваква збирка таласа претвори у низове бројева, они лако могу да се обрађују: музички снимци могу да се сабијају или да се смањује шум на њима.

SINUSNO_TALASNO_KRETANJE
Средином шездесетих година 20. века развијен је алгоритам који је био погодан да се примени и на рачунарима. Назван је „брза Фуријеова трансформација” (fast Furier transform – FFT). Амерички инжењер Р.А. Муг (Мoog) искористио је Фуријеову математику да изгради електронске музичке синтисајзере. Осамдесетих година јапанско електронско предузеће Јамаха (Yamaha) употребило је исту математику уводећи револуцију у музичку индустрију помоћу инструмената са електронским клавијатурама. Фуријеове једначине данас живе у облику MP3 фајлова и свако ко се дивио њиховој малој величини, могао је да се увери колико је овај алгоритам моћан у сабијању података.

ft
Треба рећи да се код MP3 фајлова не ради само о њиховом сабијању, већ пре о одбацивању непотребних података – онога што наш слух ионако неће моћи да чује (има доста тога што је непотребно, а нимало не угрожава квалитет звука). МР3 је скраћеница од МПег3 или тачније МПег – Левел 3. То је индустријски стандард који је 1992. године развио немачки институт Фрауенхофер (Fraunhofer Institute for Systems and Innovation Research)
.

Fraunhofer_Institute_for_Systems_and_Innovation_Research_(ISI)

Ради се о фајловима са изванредним степеном сабијања (тај степен се креће од 8 до 12 – у зависности од врсте извора). Другим речима,  10 МБ простора, колико је потребно за смештај једног минута hi fi музике на компакт-диску, могло би да се смањи и смести на само један мегабајт  коришћењем МP3 фајла на хард диску рачунара.
Најпре, МП3 дели опсег фреквенција долазног дигиталног аудио сигнала на 32 канала, које наш слух може да разликује једне од других. Свака од тих компоненти даље се разлаже на 18 делова помоћу Фуријеове трансформације, чиме се укупно добија 576 различитих фреквенцијских канала. У сваком од њих трага се за деловима које наш слух не може да чује и они се одбацују.
Добијени сигнал сабија се Хофмановим кодирањем, техником која је блиска стручњацима за рачунарство, а која вредности које се често понављају приказује краћим шифрама (кодовима) него што су шифре за описивање вредности које се ређе појављују. На пример, било би велико траћење простора ако би се користило 141.120 бита – колико је уобичајено код дигитализованог аудио фајла – за кодирање само 1/10 секунде тишине на некој песми. Исход целе ове математике? Чак ни на најсавршенијим уређајима за репродукцију звука већина људи неће уочити никакву разлику у квалитету.

hofmanov_kod

Још бржи Фурије

У јануару 2012. године, четворо истраживача са Масачусетског института за технологију унапредила су овај, један од најважнијих алгоритама у рачунарској науци.
Нови алгоритам, назван је проређена Фуријеова трансформација (Sparse Fourier transform – SFT), низови података могу да се обрађују 10 до 100 пута брже него што је могуће са FFT. Убрзање се добија јер подаци који су нам најважнији у великој мери имају неки облик – музика није насумичан шум. Њени сигнали су „оскудни” јер заузимају само део вредности коју сигнал може да носи. Технички израз за то је да је оваква информација проређена, раштркана (sparse). Пошто SFT алгоритам није намењен да ради са свим могућим токовима података, може да искористи пречице. У теорији, алгоритам који може да рукује с проређеним сигналима знатно је ограниченији од FFT.  ,,Проређеност је свуда”, наглашава Катаби, професор електротехнике и рачунарства на Масачусетском институту за технологију . „Она је у природи, у видео сигналима, у аудио сигналима.”

sfft
Бржа трансформација значи да је довољна и мања рачунарска снага да би се обрадила иста количина података – што представља посебну погодност за мобилне мултимедијске уређаје, као што су паметни телефони, јер се на тај начин штеди енергија. Или, да са истим износом енергије инжењери могу да изведу ствари које су са FFT биле неисплативе. Познато је да костур Интернета и рутери тренутно могу да прочитају и обраде само „капи” из „реке” бита која протиче између њих. Нов алгоритам, SFT, могао би истраживачима да омогући да много детаљније проучавају проток овог саобраћаја, док милијарде битова пролећу у секунди .

 

Постави коментар