B
Buildrya
Tagasi AI-RADARisse
AI uudised11 min lugemist

Qualcommi ja ByteDance’i kiibikõnelused näitavad, miks AI-firmad tahavad oma ränini jõuda

Qualcommi ja ByteDance’i väidetavad kiibikõnelused näitavad, miks AI-firmad liiguvad kohandatud ASICute ja oma taristu poole.

Mõju

Qualcommi ja ByteDance’i kõnelused näitavad, et tehisarutaristu konkurents liigub ostetud GPU-delt kohandatud ränini. Eesti ettevõtetele tähendab see vajadust hinnata lisaks mudelile ka inference’i hinda, latentsust, andmete asukohta ja tarnijalukustust.

Qualcommi ja ByteDance’i kiibikõnelused näitavad, miks AI-firmad tahavad oma ränini jõuda

Qualcommi ja ByteDance’i väidetavad läbirääkimised kohandatud andmekeskuse kiipide üle näitavad laiemat muutust tehisarutaristus. Reutersi vahendatud Bloombergi raporti järgi võib ByteDance hankida Qualcommilt miljoneid ASIC-kiipe oma tehisaru agentide ja andmekeskuste jaoks. Hilisem Reutersi raport lisas, et Qualcomm peab ByteDance’iga kõnelusi ka kohandatud kiibidisaini teenuse pakkumiseks, kuid tulemus ei ole kindel ning mõlemad ettevõtted jätsid Reutersi päringud kommenteerimata.

Väidetava tehingu keskne tähendus ei ole ainult kiipide arv. Kui Qualcomm aitaks ByteDance’il muuta valmis sisemine kiibidisain tootmiskõlblikuks pooljuhiks, liiguks suhe tavapärasest komponendimüügist sügavamale taristupartnerlusse. Reutersi järgi on kõnelused seotud muu hulgas kohandatud kiipidega, võimalik et videoprotsessoritega, ning osa tehnoloogiast võiks põhineda AlphaWave Semil, mille Qualcomm omandas varem.

See sobitub 2026. aasta suuremasse mustrisse. Pilve- ja tehisaruettevõtted ei taha enam sõltuda ainult üldotstarbelistest GPU-dest. Nad ehitavad või tellivad kiipe, mis sobivad täpsemalt nende enda töökoormuste, mudelite, andmekeskuste, tarkvarakihi ja hinnamudelitega. Google arendab TPU-sid, Amazon kasutab Gravitoni, Inferentiat ja Trainiumit, Microsoft liigub Maia kiipidega ning Meta laiendab MTIA perekonda.

Mis täpselt muutus

Reuters kirjutas 26. mail, et ByteDance võib osta Qualcommilt miljoneid ASIC-kiipe, mis toetaksid ettevõtte tehisaru agentide tarkvara. Samas raportis märgiti, et väidetav kokkulepe aitaks ByteDance’il muuta juba valmis sisemine kiibidisain tootmisvalmis pooljuhiks. Reuters rõhutas siiski, et ei saanud raportit iseseisvalt kinnitada ning ettevõtted ei vastanud kommentaaripäringule.

Juunis avaldatud Reutersi uus raport kirjeldas kõnelusi mõnevõrra ettevaatlikumalt: Qualcomm arutab ByteDance’iga kohandatud kiibidisaini teenust, kuid pole selge, kas sellest jõutakse valmis disaini ja tootmiseni. Ühe allika järgi puudutas arutelu videoprotsessoreid ning eesmärk võiks olla masstootmise alustamine aasta lõpus.

Qualcommi ametlik 24. juuni teade annab tehingujutule tausta. Ettevõte avalikustas Dragonfly andmekeskuse portfelli, kuhu kuuluvad C1000 CPU, High Bandwidth Compute, AI300 inference-kiirendi, ühenduvustooted ja kohandatud ränilahendused. Qualcommi tegevjuht Cristiano Amon ütles teates, et agentsete tehisarusüsteemide levik kasvatab andmekeskustes inference’i ehk mudelite päringutele vastamise koormust ning taristu peab pakkuma suuremat jõudlust väiksema energiakulu ja hinnaga.

Reutersi eraldi kajastuse järgi ootab Qualcomm oma andmekeskuse ärist 2029. aastaks 15 miljardi dollari suurust käivet. Ettevõte prognoosib 2027. aastaks 5 miljardit dollarit andmekeskuse käivet, millest 1 miljard tuleks uutelt kohandatud kiipide klientidelt. Reutersi järgi nimetas Qualcomm ka Microsofti ja Meta uute toodete kasutajatena ning ütles, et kaks nimetamata hüperskaalijat on tellinud kohandatud kiipe.

Taust: miks üldotstarbeline GPU ei ole enam alati parim vastus

GPU sobib hästi mudelite treenimiseks ja mitmekesisteks töökoormusteks, sest see on paindlik ja selle ümber on küps tarkvaraökosüsteem. Tootmiskeskkonnas muutub aga oluline küsimus sageli teistsuguseks: kui palju maksab iga vastus, iga token, iga soovitus, iga videojärjestuse arvutus ja iga kasutaja sessioon.

ASIC ehk rakendusspetsiifiline integraallülitus on kiip, mis on ehitatud kindlama töö jaoks. See kaotab osa paindlikkusest, kuid võib sobiva koormuse puhul võita energiatõhususes, latentsuses ja kasutuskulus. Sellest on kasu just inference’i puhul, kus sama tüüpi arvutust tehakse väga suure mahuga ja pidevalt.

TrendForce’i andmetel peaksid pilveteenusepakkujate sisemised ASICud 2026. aastal kasvama 44,6 protsenti, samal ajal kui GPU-de kasvuks prognoositakse 16,1 protsenti. Sama analüüs rõhutab, et see ei tähenda Nvidia positsiooni kiiret kadumist, vaid konkurentsi nihkumist ühe kiibi jõudluselt kogu platvormile: ühendused, lülitid, tarkvara ja ökosüsteem.

Seda kinnitab ka MediaTeki tegevjuhi Rick Tsai kommentaar Reutersile. Ta ütles aprillis, et andmekeskuste nõudlus kasvab ja kiireneb, ning hindas andmekeskuste ASIC-turu mahuks 2027. aastal 70–80 miljardit dollarit, võrreldes varasema 50–70 miljardi dollari hinnanguga.

ByteDance’i probleem: soovitusmudelid, agentid ja tarneahel

ByteDance ei ole ainult TikToki omanik. Ettevõtte põhiäri tugineb suuremahulistele soovitussüsteemidele, reklaamile, sisujärjestusele, e-kaubandusele ja üha enam ka tehisaruteenustele. Sellise mahu juures muutuvad kiibi hind, energiatarve, latentsus ja tarnepüsivus strateegiliseks küsimuseks.

Reuters kirjutas mais, et ByteDance arendab ka oma keskprotsessoreid, et toetada kasvavat tehisarutaristut. Allikate järgi töötab ettevõte kahe arhitektuurisuunaga: Arm ja RISC-V. Sama raporti järgi on ByteDance’i eesmärk kasutada neid protsessoreid oma serverites ja andmekeskustes, muu hulgas agentpõhiste toodete, sealhulgas Coze platvormi toetamiseks.

ByteDance’i tarneahelasurve on laiem. Reuters kirjutas juunis, et ettevõte peab kõnelusi ka Shanghai Iluvatar CoreXiga vähemalt 50 000 tehisarukiibi ostmiseks inference’i jaoks ning kaalub Baidu Kunlunxini kiipe. Sama raporti järgi oleks Iluvatar CoreX ByteDance’i kolmas suurem kodumaine tehisarukiipide tarnija Huawei ja Cambriconi kõrval, kui tehing sünnib.

USA ekspordipiirangud annavad Hiina ettevõtetele eraldi põhjuse otsida alternatiive. USA kaubandusministeeriumi tööstus- ja julgeolekubüroo BIS teatas 2026. aasta jaanuaris, et Nvidia H200, AMD MI325X ja sarnaste kiipide eksporti Hiinasse hakatakse hindama juhtumipõhiselt ning teatud julgeolekutingimustel. Mais lisandus Reutersi teatel juhis, mis sulges võimaliku lünga, mille kaudu Hiina peakontoriga ettevõtete välismaised tütarfirmad võisid pääseda ligi arenenud kiipidele.

Qualcommi vaade: telefonikiipidest andmekeskustesse

Qualcomm on ajalooliselt olnud tuntud nutitelefonide modemite ja Snapdragon-platvormide kaudu. Andmekeskuste turg on olnud teistsugune maailm: suuremad kliendid, pikemad müügitsüklid, rangem töökindlus, tugev tarkvarasõltuvus ja konkurents Nvidiast, AMD-st, Broadcomist, Marvellist ning hüperskaalijate enda kiipidest.

Reutersi järgi soovib Qualcomm vähendada sõltuvust nutitelefonide turust ja näeb andmekeskustes uut kasvuallikat. Ettevõtte finantsjuht Akash Palkhiwala ütles investoripäeval, et Qualcomm loodab 2029. aastaks saada kiipidest väljaspool nutitelefonide põhiturgu 40 miljardit dollarit käivet, mis on suurem kui varasem 22 miljardi dollari hinnang.

Kohandatud kiibidisaini teenus on Qualcommi jaoks teistsugune ärisuhe kui valmis protsessori müük. Kui klient kasutab tavalist kiipi, võib ta hiljem tarnijat vahetada. Kui tarnija aitab kujundada protsessori, ühendused, mäluarhitektuuri ja tootmistee, kinnistub ta sügavamalt kliendi taristuotsustesse. See on sama põhjus, miks Broadcom ja Marvell on muutunud suurte pilvefirmade jaoks oluliseks kohandatud räni partneriks. Reuters kirjutas OpenAI Jalapeño kiibi loos, et Meta, Amazon ja Google on oma majasiseste kiipide jaoks kasutanud Broadcomi ja Marvelli sarnaseid partnereid, sest vajalikke disainiteenuseid ja intellektuaalomandit on raske kõike ise luua.

Qualcommi jaoks on risk selles, et andmekeskuste turg on rahvarohke. Reutersi järgi hoiatasid Bank of America analüütikud, et Qualcomm siseneb kiiresti kasvavasse, kuid väga konkurentsitihedasse tehisarukiipide turgu, kus juba tegutsevad Nvidia, Cerebras, Amazon Graviton, Google Axion ja teised lahendused.

Pilvefirmad näitasid tee ette

Amazon on üks selgemaid näiteid, kuidas kohandatud räni muutus pilveäris strateegiliseks tööriistaks. AWS ütleb oma ametlikus materjalis, et on aastaid disaininud pilve jaoks optimeeritud ränilahendusi, sealhulgas protsessoreid, masinõppekiipe ja salvestusega seotud riistvara. AWS-i järgi annavad Gravitoni-põhised instantsid kuni 40 protsenti parema hinna ja jõudluse suhte kui võrreldavad x86-põhised instantsid ning Inferentia pakub kuni 70 protsenti madalamat inference’i kulu kui võrreldavad GPU-põhised instantsid.

Google teatas 2026. aastal kaheksanda põlvkonna TPU-dest: TPU 8t on suunatud treeningule ja TPU 8i madala viitega inference’ile. Google’i sõnul põhineb TPU-de eelis riistvara, võrgu, tarkvara, mudeliarhitektuuri ja rakenduse nõuete koosdisainil.

Microsoft tutvustas 2026. aasta jaanuaris Maia 200 kiipi, mida kirjeldatakse inference’i jaoks ehitatud kiirendina. Microsofti ametliku blogi järgi on Maia 200 valmistatud TSMC 3 nm protsessil, kasutab FP8/FP4 tensorarvutust, 216 GB HBM3e mälu ja 7 TB/s mälu ribalaiust ning on mõeldud Microsoft Foundry, Microsoft 365 Copiloti ja OpenAI mudelite teenindamiseks.

Meta ütles märtsis, et arendab ja võtab kahe aasta jooksul kasutusele neli uut MTIA kiibipõlvkonda. Ettevõtte sõnul töötab sadu tuhandeid MTIA kiipe juba inference’i töökoormustel Meta rakendustes ning kiibid on loodud konkreetselt Meta soovitus-, reklaami- ja generatiivse tehisaru koormuste jaoks.

Ekspertide vaade: konkurents liigub süsteemi tasandile

TrendForce’i analüüs sõnastab turu muutuse täpselt: kiibikonkurents ei ole enam ainult ühe GPU jõudluse võrdlus. Määravaks saavad ühendused, mälu, andmekeskusevõrk, tarkvara ja ökosüsteem. ASIC võib olla konkreetse töö jaoks tõhusam, kuid selle kasu avaldub ainult siis, kui kogu süsteem on selle ümber ehitatud.

OpenAI Jalapeño näide lisab samasse pilti veel ühe kihi. Reutersi järgi on OpenAI esimene oma kiip mõeldud just inference’iks ehk kasutajapäringutele vastamiseks, mitte üldiseks treeninguriistvaraks. OpenAI riistvarajuht Richard Ho ütles Reutersile, et kiip peaks olema jõudluslik ka tulevaste suurte keelemudelitega, kuid kiipe kasutatakse ainult OpenAI enda taristus.

Broadcomi juht Hock Tan märkis samas Reutersi loos, et kohandatud tehisarukiibid vajavad palju suure ribalaiusega mälu ning see mõjutab ka Broadcomi marginaale. See on oluline, sest ASIC ei eemalda tarneahela probleemi; see muudab selle kuju. Kui GPU asendub kohandatud kiibiga, jäävad endiselt kriitiliseks TSMC tootmisvõimsus, HBM-mälu, pakendamine, võrgud ja jahutus.

Eesti lugeja vaade

Eesti ettevõtetele ei tähenda Qualcommi ja ByteDance’i võimalik tehing seda, et oma kiipi oleks mõistlik projekteerima hakata. Vastupidi: oma räni on mõistlik ainult äärmusliku mahu, korduva töökoormuse ja pikaajalise taristustrateegia korral. Enamik Eesti ettevõtteid võidab rohkem mudelivaliku, pilvearhitektuuri, andmekvaliteedi ja kulumõõtmise korrastamisest.

Küll aga mõjutab see kaudselt kõiki tehisaruteenuste kasutajaid. Kui suured platvormid viivad inference’i kohandatud kiipidele, võib see vähendada teenuste ühikukulu ja parandada mahutavust. Samal ajal võib see luua uusi lukustusi: mudel, tarkvara ja riistvara võivad muutuda ühe teenusepakkuja sees nii tihedalt seotud süsteemiks, et hiljem on keeruline koormust mujale viia.

Eesti arendajatele on praktiline järeldus see, et „mis mudel?” ei ole enam ainus oluline küsimus. Üha rohkem loeb, kus mudel jookseb, milline on inference’i hind, milline on latentsus, kas teenus toetab avatud formaate ja kas töökoormuse saab vajaduse korral viia teise pilve, teise mudeli või lokaalse taristu peale.

Avaliku sektori ja reguleeritud ettevõtete jaoks on lisaküsimus tarneahela läbipaistvus. Kui teenus tugineb Hiina, USA või mõne teise jurisdiktsiooni kohandatud taristule, tuleb hinnata andmete asukohta, hanketingimusi, ekspordipiiranguid, teenuse jätkuvust ja seda, kas kriitiline töövoog sõltub ühest suletud kiibiplatvormist.

Riskid ja piirangud

Esimene piirang on allikastaatus. Qualcommi ja ByteDance’i kokkulepe ei ole ametlikult kinnitatud. Reuters vahendas Bloombergi raportit ning hiljem oma allikatele tuginevat infot käimasolevate kõneluste kohta. Artiklis ei tohi seda esitada valmis tehinguna.

Teine piirang puudutab ASICute üldistamist. Kohandatud kiip ei ole automaatselt parem kui GPU. ASIC tasub ära siis, kui töökoormus on piisavalt suur, korduv ja stabiilne. Kui mudelid, andmevood või rakenduse vajadused muutuvad kiiresti, võib paindlik GPU olla majanduslikult mõistlikum.

Kolmas risk on tarkvara. Nvidia tugevus ei ole ainult kiip, vaid CUDA, võrgud, draiverid, arendajatööriistad ja küps ökosüsteem. TrendForce rõhutab, et Nvidia positsioon ei kao üleöö, sest konkurents on liikunud platvormi tasandile.

Neljas risk on tootmine. Kohandatud kiibi disainimine ei tähenda, et seda saab kiiresti ja odavalt toota. Vaja on TSMC või muu tootja võimsust, keerukat pakendamist, HBM-mälu või alternatiivset mäluarhitektuuri, testimist, serveriplaate, jahutust ja tarkvaratoetust.

Viies risk on geopoliitika. USA ekspordikontrollid ja Hiina omavarustuse poliitika võivad muuta tarneahelaid kiiresti. BIS-i jaanuarikuine otsus H200 ja sarnaste kiipide juhtumipõhiseks hindamiseks ning mai lõpu juhis Hiina ettevõtete välismaiste tütarfirmade kohta näitavad, et reeglid võivad muutuda lühikese etteteatamisega.

Mida edasi jälgida

Esimene küsimus on, kas Qualcommi ja ByteDance’i kõnelustest sünnib ametlik tootmisprogramm. Kui ByteDance jääb ainult Qualcommi standardsete ASICute ostjaks, on mõju väiksem. Kui Qualcomm aitab ByteDance’i enda disaini tootmisse viia, on see märksa tugevam signaal kohandatud räni turu kohta.

Teiseks tuleb jälgida, millist tüüpi kiibist räägitakse. Videotöötlusprotsessor, inference-kiirendi, CPU ja üldisem tehisarukiirendi lahendavad eri probleeme. Ükski neist ei asenda kõiki GPU töökoormusi.

Kolmandaks tasub vaadata Qualcommi 2027.–2029. aasta andmekeskuse käibe täitumist. Ettevõte on varemgi püüdnud andmekeskustesse siseneda, kuid praegune laine erineb varasematest selle poolest, et inference’i maht ja kohandatud räni nõudlus kasvavad korraga.

Neljandaks on oluline jälgida, kas suured tehisarufirmad hakkavad oma kiipe kasutama ainult sisemiselt või pakuvad neid ka klientidele pilveteenuse kaudu. Google’i TPU ja AWS Trainiumi mudel näitab, et oma kiibist võib saada ka pilvetoote osa, mitte ainult sisemine kulukärbe.

Kokkuvõte

Qualcommi ja ByteDance’i väidetavad kiibikõnelused ei ole veel kinnitatud tehing, kuid suund on selge. Tehisarutaristus liigub konkurents toore arvutusvõimsuse ostmiselt selle juurde, kes suudab oma mudelid, andmekeskused, mälu, võrgud ja tarkvara üheks tõhusaks süsteemiks siduda.

GPU jääb endiselt keskseks, eriti treeningu ja mitmekesiste töökoormuste puhul. Kuid suuremahuline inference, soovitusmudelid, agenttöövood ja platvormide sisemised teenused loovad turu, kus kohandatud kiip võib anda hinna ja energiakasutuse eelise.

Eesti lugeja jaoks on põhijäreldus praktiline: tehisaru teenuse tegelik maksumus ei sünni ainult mudelis. See sünnib ka kiibis, mälus, serveriräkis, andmekeskuse elektris ja tarkvarakihis. Mida suuremaks muutub tehisaruteenuste kasutus, seda rohkem hakkavad need nähtamatud kihid määrama, kes saab teenust pakkuda odavamalt, kiiremini ja kindlamalt.

KKK

Mis Qualcommi ja ByteDance’i vahel väidetavalt toimub?

Reutersi vahendatud Bloombergi raporti järgi võib ByteDance hankida Qualcommilt miljoneid kohandatud ASIC-kiipe oma tehisaru agentide ja andmekeskuste jaoks. Reutersi hilisem allikapõhine raport kirjutas, et Qualcomm peab ByteDance’iga kõnelusi ka kohandatud kiibidisaini teenuse pakkumiseks. Ettevõtted ei ole tehingut kinnitanud.

Mis on ASIC?

ASIC ehk application-specific integrated circuit on kiip, mis on ehitatud kindla töö jaoks. See on vähem paindlik kui GPU, kuid võib sobiva töökoormuse puhul olla odavam, kiirem ja energiatõhusam.

Miks tehisarufirmad tahavad oma kiipe?

Suurte platvormide jaoks on inference’i kulu väga suur. Kui sama tüüpi arvutust tehakse miljardites päringutes, võib kohandatud kiip vähendada energiakulu, parandada latentsust ja vähendada sõltuvust välistarnijatest.

Kas kohandatud kiibid asendavad GPU-d?

Ei. GPU-d jäävad oluliseks treeningu, uurimistöö ja mitmekesiste töökoormuste jaoks. ASICud sobivad paremini väga suure mahu ja stabiilse töökoormusega inference’i jaoks.

Miks ByteDance’i puhul on tarneahel nii tähtis?

ByteDance vajab palju arvutusvõimsust TikToki, Douyini, soovitusmudelite, reklaami, agenttööriistade ja teiste tehisaruteenuste jaoks. USA ekspordipiirangud ja kiipide nappus suurendavad survet leida alternatiivseid tarnijaid ja arendada oma lahendusi.

Mida Qualcomm sellest võidaks?

Qualcomm saaks laiendada äri nutitelefonidest andmekeskustesse. Ettevõte ootab 2029. aastaks 15 miljardi dollari suurust andmekeskuse käivet ja näeb kohandatud kiipides üht uut tulusuunda.

Kes veel oma tehisarukiipe ehitab?

Google arendab TPU-sid, AWS kasutab Gravitoni, Inferentiat ja Trainiumit, Microsoft arendab Maia kiipe ning Meta laiendab MTIA perekonda. OpenAI on samuti esitlenud Broadcomiga loodud Jalapeño kiipi inference’i jaoks.

Mida see Eesti ettevõtetele tähendab?

Eesti ettevõtted ei pea oma kiipi ehitama, kuid peaksid jälgima tehisaruteenuste hinda, latentsust, andmete asukohta ja tarnijalukustust. Mudeli valiku kõrval muutub oluliseks ka see, millisel taristul teenus töötab.

Saa järgmine AI-RADAR postkasti

Kui järgmine praktiline AI-signaal või tööriistamuutus avaldatakse, saad selle otse e-postile.

Arutelu

0 kommentaari

0/1500

Laen kommentaare...
Loe edasi

Seotud teemad AI-RADARis