Novembro 18, 2024

Edge AI: Venkante la Defiojn de Gigantaj Modeloj

Kvankam artefarita inteligenteco estis reklamita pro sia potencialo pliigi efikecon tra pluraj industrioj, la teknologio trafis plurajn vojbarojn proprajn. La neefikeco de centralizitaj serviloj igis iujn sistemojn sperti alta latenteco aferoj aŭ eĉ rekte kraŝoj. Dirite, povas esti solvo al ĉi tiuj neefikecoj: randa komputado.

Randa komputado rilatas al datumtraktado ĉe retoj kaj aparatoj pli proksimaj al la uzanto, kontraste al tradiciaj komputikmetodoj de alcentrigitaj serviloj kaj datencentroj. Randa komputado povas esti vidita en ago kun ĉio de vendpunkto (POS) sistemoj ĝis Interreto de Aĵoj (IoT) aparatoj kaj sensiloj - esence, randaparatoj estas io ajn kiu komputas loke kaj interagas kun la nubo. Nun ni komencas vidi modelojn de artefarita inteligenteco aldonitaj al tiu kategorio de randa komputado.

La intersekciĝo de AI kaj randa komputado

Fakulo pri artefarita inteligenteco Siddhartha Rao havas unuamanan sperton laborante kun kaj AI kaj nuba komputiko teknologioj. Post pli ol jardeko da sperto laboranta kun ĉefaj teknologiaj kompanioj kiel Amazon Web Services, Rao nun funkcias kiel la kunfondinto kaj Ĉefoficisto de Positronaj Retoj, AI-firmao koncentriĝis pri artefarita inteligenteco-solvoj por la scienca esplorkomunumo. Konsiderante la unikajn bezonojn de ĉi tiu komunumo, Rao precipe interesiĝas pri la intersekco de AI kaj randa komputado.

"Estas pluraj kialoj, kial randa komputado fariĝis tiel elstara paradigmo, inkluzive de malpliigo de la latenteco de uzantinteragoj, malpliigo de kostoj pri nuba komputado kaj subteno de eksterretaj uzantspertoj," klarigas Rao. "Ĉi tiuj avantaĝoj estas en disputo kun aliaj celoj de randa komputado, kiel ekzemple plibonigo de marĝenoj malaltigante aparatkostojn, plilongigante baterian vivon per malalt-potencaj procesoroj aŭ elŝutado de modelaj ĝisdatigoj en malaltaj bendolarĝaj medioj kiel evolulandoj."

Tamen, ĉi tio petas la demandon pri kiel modeloj de artefarita inteligenteco - kiuj postulas gravan komputikan potencon - povas esti prizorgataj "sur la rando". Rao klarigas, ke sukcese transiri modelojn de artefarita inteligenteco al la rando postulas simpligi ĉi tiujn operaciojn.

"Por kunteksto, modelo estas sekvenco de lineara algebro (matrica matematiko) operacioj sinsekve efektivigitaj por antaŭdiri respondon bazitan sur enigo," Rao klarigas. "Inĝenieroj kaj sciencistoj de maŝinlernado reduktas la matematikan kompleksecon de ĉi tiuj operacioj aplikante diversajn teknikojn. La rezulto estas pli malgrandaj modeloj, kiuj postulas malpli da komputikcikloj por ekzekuti, malaltigante komputikpostulojn kaj plibonigante marĝenojn dum plibonigo de bateria vivo."

"Ĉi tiu inĝenierado havas plurajn pozitivajn efikojn sur la industrio," li daŭrigas. "Ekzemple, modeloj kiuj plenumas kun pli malalta latenco, uzas malpli da bateria potenco kaj produktas malpli varmegon. Ili ankaŭ uzas malpli da nubaj komputikresursoj por ekzekuti, plu malpliigante sian median efikon, kaj ili reduktas la konsumon de bendolarĝo de ĝisdatigo de modelo. Ĉiuj ĉi tiuj avantaĝoj plibonigas la uzantan sperton dum plibonigo de randoj malaltigante la koston de varoj."

Kial randa komputado estas la estonteco de AI

La ĉefa avantaĝo de randa komputado estas, ke ĝi signife plibonigas la uzantan sperton. Latenteco estas unu el la plej grandaj defioj alfrontataj de iu ajn teknologia novigado, precipe konsiderante la mallongajn (kaj malpliiĝantajn) atentoperiodojn de homoj.

"Se randa aparato ĉiam devas iri al la nubo por antaŭdiro, la efiko al latencia malbonigas la uzantan sperton, reduktante klientan engaĝiĝon," klarigas Rao. "Malpli engaĝitaj klientoj estas malpli verŝajne utiligi la aparaton, reduktante utilecon kaj adopton."

Randa komputado ankaŭ povas eble redukti la kostojn de artefarita inteligenteco-teknologio al punkto kiu estas pli atingebla por pli malgrandaj entreprenoj. Post ĉio, konservi la servilojn necesajn por funkciigi grandskalajn modelojn estas multekosta. Randa komputado reduktas la kompleksecon de ĉi tiuj aplikoj por permesi al ili funkcii sur la rando.

Tamen, Rao ankaŭ avertas kontraŭ iuj el la konsekvencoj, kiujn povus havi randa komputado en la AI-sfero, nomante ilin "kompromisoj" por la avantaĝoj kiujn ĝi proponas. "Pli altaj eraroj kaj halucinaj indicoj ĉar uzi pli malaltan precizecon poste influas la precizecon de la respondo," li klarigas. "Sciodistilado povas plifortigi biason kaj justecproblemojn en la pli grandaj modeloj. Finfine, randa komputado postulas dungi multekostan, specialiĝintan maŝinlernantan talenton kaj akiri multekostan maŝinlernadtrejnadinfrastrukturon kiel ekzemple GPUoj, kiuj estas tre postulataj."

Kiel ekzemplo de la sukcesa intersekciĝo de artefarita inteligenteco kaj randa komputika teknologio, Rao montras al uzokazo de sia tempo ĉe AWS kiu sukcese simpligis modelon je skalo. "Modelo, kiun mi sponsoris ĉe AWS, estis uzata en la kodeko Opus," li diras. "Ĉi tiu kodeko estas uzata de pli ol 1 miliardo da aparatoj tutmonde kaj lastatempe estis ĝisdatigita de Amazon kun maŝinlernada algoritmo de kaŝado de pakaĵetoj, kiu reakiris sonfluojn eĉ en perdaj retoj. Ĉi tiu kodeko povas esti uzata sur aparatoj kun limigita pretigpovo, kiel ekzemple Raspberry Pi aŭ skribotablo-telefono, por antaŭdiri aŭdspecimenojn en milisekundoj."

Rao ankaŭ mencias uzon, kiu montris apartan potencialon en la defenda sektoro. "Vidbendo en reala tempo estis prilaborita per fotiloj sur la fusilskopo de soldato por gvidi ilin ĉu la movadoj de batalanto estis suspektindaj aŭ eble en subteno de malica agado kiel terorismo," li aldonas. "La soldato povus tiam enfokusigi gvatadon sur sentemaj kaj altriskaj batalkampaj areoj. En ambaŭ ekzemploj, kompleksaj, realtempaj audio aŭ video estis prilaboritaj de malaltfortaj mikroprocesoroj funkcianta per IoT-aparatoj."

Efektive, ĉi tiuj uzkazoj estas perfektaj ekzemploj de kiel artefarita inteligenteco komputita sur la rando liveras superajn rezultojn laŭ efikeco kaj kosto. "Se la plej novaj AI-modeloj ne povas esti optimumigitaj por funkcii ĉe la rando, iliaj aplikoj estos limigitaj al nubaj aplikoj kaj sperto de uzanto," konkludas Rao.

Pri la aŭtoro 

Kyrie Mattos


{"email": "Retpoŝta adreso nevalida", "url": "Reteja adreso nevalida", "required": "Bezonata kampo mankas"}