Уместо увода
Вештачка интелигенција. Савремена технологија која доноси многобројне изазове. Једно од највећих достигнућа 21. века. Технологија која нам може донети много тога доброг, заменити човека у многим сферама делатности и решити нерешиве проблеме. Све су ово фразе које се могу чути у текстовима и вестима које говоре о вештачкој интелиценцији (у даљем тексту ВИ). Поставља се питање – шта је од свега овог тачно? Колико је заправо савремена ВИ напредна? Како се она развија? Да ли постоје неки други правци развоја? Овај текст ће покушати да одговори на ова питања. Покушаћемо да изнесемо став да трендове развоја ВИ диктирају велике компаније у које спадају: Google, Meta, Microsoft, OpenAI, NVIDIA, те да оне занемарају алтернативне правце развоја ВИ и фокусирају се на оне које њима доносе највећи профит.
Кратка историја развоја ВИ – кључна открића
За почетак ћемо се осврнути на то која су то била кључна открића која су омогућила савремену ВИ. Пре свега треба се осврнути на чињеницу да се данашњи модели ВИ углавном развијају применом техника машинског учења. Оне вуку своје корене у раду Розенблата из 1958. године, када су концептуално осмишљене. Тада је осмишљен модел који ће представљати прототип данашњих неуронских мрежа, модела који се налази у основи савремених језичких модела. Но, суштина рада једног модела ВИ огледа се у његовом учењу, односно обучавању. Тај процес нам омогућава да ми нешто „научимо“ модел ВИ, без експлицитног програмирања истог (како бисмо радили у традиционалном приступу развоја софтвера).
Кључни алгоритам за обучавање модела ВИ (енг. Backpropagation) осмишљен је далеке 1970. године. Треба напоменути да је он до дан данас остао суштински исти, уз нека побољшања у области оптимизације самог алгоритма. Дакле, алгоритам који нам говори о томе како научити ВИ нешто је осмишљен пре више од 50 година. Ова чињеница нам указује на то да од тада није било неког суштинског напретка у томе како ми обучавамо саме моделе ВИ.
Осврнимо се сада на велики „бум“ ВИ (односно њене области дубоког учења) који се десио отприлике 2012. године. Тада је у оквиру једног такмичења у препознавању слика остварен велики напредак применом постојећих модела. Треба напоменути да смо до тада имали углавном развој неких нових архитектура неуронских мрежа (модела ВИ), али да сама област машинског учења (данас итекако доминантна) није постала тако перспективна. Отприлике те године стекли су се услови за почетак епохе у којој се данас налазимо – епохе коју ће карактерисати фокус на развој техника машинског учења (надаље МУ), односно њене области дубоког учења. Тај „бум“ условила су три фактора:
- Појава нових, односно већих архитектура неуронских мрежа
- Појава нових процесора (енг. GPU)
- Доступност великих количина података
Приметимо да на претходној листи нема неког револуционарног развоја који би се тицао самог начина на који ови модели уче. Као што смо поменули он је осмишљен давних дана. Заправо у том периоду није било ничега новог у академској заједници, већ су се стекли услови, махом економско-социјалне природе, да се догоди прави процват у развоју ВИ.
Следећи битан напредак десио се 2017. године, открићем трансформера. Трансформер представља посебан тип, односно модел неуронске мреже који има ту особину да добро „разуме“ контекст у ком се одређена реч појављује. То откриће ће бити основа развоја великих језичких модела. Следећи велики напредак, можда најбитнији свеукупно (објаснићемо зашто), десио се 2020. године када су откривени „закони скалирања“. Суштински речено, ово откриће нам говори следеће – ако имамо више података на располагању, више хардверских ресурса (процесора) и веће моделе (оне са више слојеве) ми ћемо нужно имати боље резултате модела. Штавише, емпиријски је утврђено да ти боље резултате можемо предвидети математичком функцијом. Овај резултат, заједно са открићем трансформера и алгоритмом за обучавање представља основу за развој великих језичких модела.
Закон скалирања и велике компаније – дует снова
Сада ћемо покушати да укажемо на то колики је значај парадигме скалирања за велике компаније које развијају моделе ВИ (махом из САД). У основи закона скалирања налазе се две ствари:
- Могућност предвиђања перформанси већих модела
- Потреба за константним инвестицијама (примарно због инфраструктуре)
Ако се сада осврнемо на претходне констатације уочавамо да је то савршен приступ у развоју једног производа. Са једне стране у могућности смо да потенцијалним инвеститорима кажемо нешто попут:“Знате, наш модел тренутно можда није најбољи, али ако уложите у нас, засигурно ћемо имати боље решење“. То, засигурно, као што смо већ напоменули, прати одређену математичку функцију (емпиријски утврђено). Са друге стране се јавља потреба за констатним проширивањем инфраструктуре великих компанија, што се углавном огледа у изградњи нових центара за анализу података (енг. Data centers).
Човек би помислио да је овакав приступ развоја ВИ нешто што је осмишљено по мери великих играча који постају све већи временом. Додатан „шлаг на торту“ представља чињеница да су највећи акционари компанија које смо навели (Meta, Google, Microsoft, OpenAI, NVIDIA) – исти. Углавном се ту спомињу добро позната имена попут Vanguard-а, BlackRock-а, Fidelity-a. Још је занимљивија следећа чињеница. NVIDIA представља компанију која је задужена за испоручивање процесoра (инфраструктуре) свим овим компанијама. Дакле када се јави потражња за бољим моделом, NVIDIA је та која профитира. Због тога и не чуди чињеница да је у септембру ове године NVIDIA инвестирала 100 милијарди долара у OpenAI компанију. Дакле, NVIDIA инвестира у OpenAI компанију која је пионир у примени парадигме скалирања, тако да када OpenAI одлучи да направи нови модел – NVIDIA профитира, а затим и OpenAI профитира. Заправо речено профитирају њихови акционари коју су, као што смо рекли – исти. И тако улазимо у зачарани круг нових инвестиција и све већих профита… Јасно је да овакав начин пословања представља сан снова сваког инвеститора – улагање у производ који ће се нужно, не можда много, али свакако показати бољим (бар у теорији која је очигледно прихваћена) представља идеалан модел пословања. Наравно да је дискутабилна чињеница да је једино што нам треба да имамо бољи модел да он буде већи, али то већ захтева разматрања о томе колико је тренутан приступ у развоју ВИ заправо ефикасан (на шта ћемо се осврнути касније у тексту).
Постоје ли алтернативни приступи?
Покушајмо да сада одговоримо на питање везано за алтернативне приступе у развоју ВИ. Један он кључних би могао бити „неуросимболички“ приступ. Које су његове одлике? Да бисмо на то питање одговорили морамо се вратити на саме почетке развоја ВИ. Историјат ВИ можемо грубо поделити на две фазе:
- Период симболичког (логичког) приступа
- Период статистичког приступа
Из наведеног је јасно да се ми налазимо у другој фази развоја ВИ, која је карактерисана применом техника МУ. Прва фаза развоја ВИ била је доминанта у току 20. века и њу је карактерисала примена егзактних, махом логички заснованих техника, док су главне области истраживања биле представљање знања и аутоматско расуђивање. Један од главних „изума“ове фазе ВИ су били експертски системи који представљају програме који одговарају на питања, односно решавају проблеме из одређене области, применом правила логичког закључивања. Битна ствар коју треба напоменути овде јесте да су се ти програми ослањали на знање експерата (дакле људи) из те области, који су пренели све релеватне информације на рачунар. Овакви системи допринели су доказивању математичких теорема 1976. и 1996. године Још један значајан успех у овој фази развоја ВИ представља рачунар (енг. Deep Blue) који је 1997. године победио Гарија Каспарова у шаховском дуелу.
Са друге стране, другу фазу историјата ВИ, као што знамо, карактерише примена статистички-заснованих техника (оних неегзактних техника). Логичан закључак који се овде намеће јесте да би најбољи приступ било комбиновати ова два приступа, како би се они међусобно допуњавали. То и јесте замисао „неуросимболичког приступа“ у развоју ВИ. Главни истраживачи на овом бољу јесу MIT као представник академског света, односно IBM као представник индустрије. Треба напоменути да они заједно сарађују на развоју ове области последњих пар година, те да свакако имају одређене резултате из исте. Овакав приступ могао би да реши неке од кључних проблема великих језичких модела као што су: поузданост, проверљивост и објашњивост одлука самих модела. Овакав приступ захтева знатно мање количине података за обучавање, што самим тим захтева мање моделе и мању инфраструктуру за рад. Овај приступ је свакако нешто што ми сматрамо најперспективнијом облашћу развоја ВИ, пре свега због тога што бисмо били у стању да успешно комбинујемо експертско (људско знање) са сложеним техникама МУ које су у стању да уоче корелације између разних типова података.
Други приступ на који ћемо се осврнути јесте учење поткрепљивањем (енг. Reinforcement learning). Овај приступ представља примену бихевиористичке теорије учења на ВИ. У овом приступу нема коришћења никаквог скупа података за обучавање, већ се агенти, односно модели, обучавају тако што уче на основу сопственог искуства, у додиру са њиховим окружењем (које може бити виртуелно или стварно). На овај начин покушавамо да „симулирамо“ процес учења кроз покушаје дајући моделима циљ који они морају да достигну током обучавања. Овај приступ је омогућио успех AlphaGo пројекта – модел који је победио светског шампиона у древној кинеској игри Гo.
Овде ћемо споменути укратко још само приступ заснован на узрочном расуђивању (енг. Causal machine learning). Ова област која се интезивно развија последњих деценија, проучава математички апарат који покушава да открије узроке одређених појава. Овде се, наравно, мисли на ситуације када потенцијално постоји велики број узрочника одређене појаве, те је потребно одредити оне најзначније. Јасно је да је само расуђивање о узрочностима одређених појава итекако уткано у наше свакодневно поимање света, те да би примена ових метода итекако могла да побољша постојеће системе ВИ.
Утицај великих компанија на академски свет
У наставку ћемо се осврнути на утицај који велике компаније имају на академску заједницу (махом у САД) како бисмо покушали да укажемо на то колики је њихов значај у одређивању правца развоја ВИ. Пре свега треба указати на чињеницу да је сама архитектура за развој сложених модела ВИ изузетно скупа, те да се ни најпознатији амерички универзитети (који свакако имају велики буџет) не могу поредити са технолошким гигантима.
Пре свега се осврнимо на величину и финансијску моћ поменутих компанија. Процењује се да су у 2024. години Microsoft, Meta, Google и Amazon заједно потрошили 125 милијарди долара на инфраструктуру за развој ВИ. Што се текуће године тиче – процењује се да ће та бројка прећи 300 милијарди долара улагања, дакле скоро троструко више него годину раније.
Према истраживању из 2021. године 65% младих доктораната радије изабере рад у индустрији насупрот рада на факултету, што представља пораст од 21% у односу на истраживање из 2010. године. Нарочито треба напоменути врло илустративан случај Тимнит Гебру. Она је, као изузетан стручњак у својој области, те високо позиционирани истраживач у оквиру Google-a, морала да да отказ у својој компанији након објављивања истраживачког рада на тему пристрасности модела ВИ те ризика који се повезују са њима. Овај случај јасно указује на то колико компаније не интересује озбиљан истраживачки рад у области ВИ. Чак и пре појаве потребе за развојем инфраструктуре за ВИ, универзитети су маком користили инфраструктуру рачунарства у облаку (енг. Cloud computing) коју, такође, поседују велики технолошки гиганти.
Поред саме инфраструктуре која је изузетно скупа, велике технолошке компаније директно финансирају поједине универзитете. Ту се пре свега мисли на програме стипендирања младих истраживача, односно пројеката у оквиру универзитета. Још један илустративан пример представља отворено писмо које су 2025. године потписали истраживачи са универзитета у Гронингену. Потписници у њему изражавају стрепњу због све веће зависности у односу на компаније попут Microsoft-a и Google-a, односно због тога што „дигитални сервиси које они користе умногоме обликују професионалну праксу“. На самом крају писма указују на то како велике технолошке компаније обликују и одређују правац истраживања које се базирају на њиховој инфраструктури. Ово писмо је потписало преко 500 истраживача са поменутог универзитета. Поменути примери јасно указују на чињеницу да универзитети широм Европе и Америке полако постају све зависнији од великих технолошких компанија, које ће неминовно диктирати, у већој или мањој мери, услове те сарадње.
Куда води овакав развој ВИ?
На самом крају покушајмо да се осврнемо на то које су последица оваквог развоја модела ВИ. Пре свега оне су економске природе. Карен Хао је своју изврсну књигу о великим технолошким компанијама назвала „Empire of AI“, при чему се она фокусирала на истраживање OpenAI компаније. Ова синтагма говори доста о томе куда води овакав развој ВИ. То је невероватна количина капитала које ове компаније сваке године повећавају. Као што смо већ споменули у тексту, поменуте компаније троше стотине милијарди долара годишње на унапређивање инфраструктуре за развој ВИ. У октобру ове године OpenAI је постао стартап компанија која вреди 500 милијарди долара претекавши SpaceX, те поставши највреднији стартап на свету. Овај податак додатно илуструје чињеницу о коликом капиталу се ради када говоримо о овим компанијама. Јасно је да им све већи капитал омогућује да остваре све веће политичке интересе које се огледају у већ поменутом утицају на академску заједницу, лобирање поводом евентуалног доношења регулатива које би некако успориле развој ВИ, изградњом центара за аналитику широм САД (без обзира на евентуалну штету по локално становништво о чему Карен Хао детаљно говори у својој књизи).
На крају, осврнимо се на то какве ће последице имати приступ заснован на примени парадигме скалирања модела. Пре свега јасно је да ће модели постајати све сложенији. Самим тим и њихове одлуке ће бити све теже за разумевање. То на неки начин отежава могућност примене ВИ у тандему са експертима из одређене области, на пример лекарима. Поред тога можемо очекивати све већу потражњу за новим изворима података које би модели могли да користе. Коначно, како нисмо применили неги „генијалан“ начин обучавања ових модела, закључујемо да ће они проширивати своје знање на идентичан начин као и до сада – овај метод можемо описати синтагмом „учење напамет на великој скали“. Додатно треба се осврнути и на мишљење које априори сматра овај приступ погрешним, односно недовољним за развијање било какве озбиљне интелигенције. Пре свега због превише упрошћеног посматрања људског знања као „корелација“ између одређених појмова. Ваља напоменути да постоје истраживачи који сматрају да смо ми суштински већ достигли максимум са применом оваквих модела, те да се даље може напредовати искључиво применом неких других парадигми (Гери Маркус, Ричард Сатон).
Имајући у виду све наведено можемо закључити да ће, уколико се настави по садашњем принципу, развој ВИ ићи постепено, при чему очекивано је значајно увећање капитала великих технолошких компанија. Чак и у случају да дође до неког значајног открића које би могло да нам омогући да правимо много безбедније и боље моделе, питање је колико би велике компаније примениле такав приступ, уколико би морале да потпуно изнова праве своје моделе. За њих је свакако интересантнији приступ који им гарантује уплив додатног капитала, без обзира на могуће ризике од модела ВИ које користи стотине милиона људи широм света…
Извор: Искра





