mysummit.school - Tehisintellekti blogi juhtidele

40 GigaChat juhtumit: kontrollime Sberi võrdlusuuringut andmetega

18 min lugemist

Sber – Venemaa suurim pank ja üks selle riigi juhtivaid tehisintellekti arendajaid – andis välja reklaami-eriprojekti: nelikümmend ärijuhtumit ettevõtetest, kes võtsid kasutusele GigaChati (Sberi enda vestlusmudeli) ja räägivad selle mõjust. EdTech, MedTech, HRTech, küberturve, PropTech. Ilusad kaardid, konkreetsed numbrid, päris idufirmad.

Sberi reklaamprojekt

Pildil: kiirendi Sber500×GigaChat reklaamslaid „Sammu võrra ees" – 40 idufirmat 9 valdkonnast. Lubatud efektid: äriprotsessid kuni x16 kiiremad, kulud kuni 90% väiksemad, ülesannete automatiseerimine kuni 95%, käive kuni 30% suurem.

Meil on võrdlusuuring: 29 mudelit, 4 308 sõltumatut hinnangut juhtimisülesannetel. GigaChat on selles teise testlaine järel viimasel, 29. kohal. See loob huvitava olukorra.

Mitte sellepärast, et Sber valetaks. Juhtumid on päris, idufirmad olemas, automaatika töötab. Küsimus on muus: kas see oli optimaalne mudel ülesannete jaoks, mida nad lahendasid?

Loe edasi
40 GigaChat juhtumit: kontrollime Sberi võrdlusuuringut andmetega
280 korda odavam kahe aastaga: TI majandus on ümber pööratud
8 min

280 korda odavam kahe aastaga: TI majandus on ümber pööratud

  1. aastal maksis üks päring GPT-4-le nii palju, et arvutamine pidi olema hoolikas. 2025. aastaks oli samaväärne päring 280 korda odavam. Mitte 280 protsenti – 280 korda. Kahe aastaga muutus TI kasutamise hind barjäärist ümardamisveaks.

Stanford AI Index – iga-aastane raport, mis kogub andmeid TI-tööstuse kohta sadadest allikatest – fikseeris selle kokkuvarisemise 2025. aasta raportis. Ja 2026. aasta raport lisas konteksti: investeeringud TI-sse plahvatasid 285,9 mld dollarini, tarbijad saavad väärtust 172 mld dollarit aastas ja andmekeskused tarbivad elektrit nagu New Yorgi osariik. Majandus on ümber pööratud – aga mitte nii, nagu oodati.

TI levis kiiremini kui internet – aga 62% kasutajatest jäid stardijoonele
7 min

TI levis kiiremini kui internet – aga 62% kasutajatest jäid stardijoonele

  1. aasta aprillis avaldas Stanford HAI üheksanda iga-aastase AI Index Report’i – kõige ulatuslikuma ülevaate tehisintellekti tööstuse seisust. Pealkirjad on ootuspäraselt optimistlikud: ettevõtete kasutuselevõtt on jõudnud 88%-ni, generatiivne TI on levikukiiruses edestanud internetti, tarbijatele loodav GenAI-tööriistade väärtus on hinnanguliselt 172 miljardit dollarit aastas. Aga numbrite taha vaadates kerkib esile tuttav probleem.

4 promptimise tehnikat, testitud 7 mudelil: tookokoja juhend
24 min

4 promptimise tehnikat, testitud 7 mudelil: tookokoja juhend

“Analüüsi seda projekti ja anna soovitusi” – üks prompt, seitse mudelit, ja GPT-5.4 andis välja 2231 sõna uduseid nõuandeid, samal ajal kui Claude Sonnet pakkus 11 kiitvat fraasi nagu “suurepärane eelarve struktuur”. Piisas päringu ümberkirjutamisest viie elemendi struktuuri järgi – kõik seitse mudelit mahtusid 346–443 sõnasse ja kiidulaulud kadusid. Tokenite kokkuhoid: 41% kuni 79% olenevalt mudelist.

See pole teooria. Need on andmed töökojast “Promptimine praktikas”, mille viisin läbi IIBA konverentsil. Üks projektibriif, neli tehnikat, seitse mudelit, 28 käivitust – ja $0,054 kokku. Odavam kui kohv automaadist.

99% kvaliteedist 1,4% hinnaga: mis on TI-mudelite turul valesti
6 min

99% kvaliteedist 1,4% hinnaga: mis on TI-mudelite turul valesti

Enamik juhte valib TI-mudeli nii: võtab kõige kallima saadaoleva. Loogika on arusaadav – kallim tähendab paremat. Nii on ettevõttetarkvara puhul viimased kakskümmend aastat toiminud.

TI-mudelite turg 2026. aastal on teisiti korraldatud. Ühe päringu maksumus varieerub $0,0001 kuni $0,17 – kolm suurusjärku. Aga tegelik kvaliteedierinevus kümne parima mudeli vahel? 0,24 punkti viiepallisel skaalal. Samal ajal Wharton / GBK Collective fikseerib: kolmandik ettevõtete TI-projektidest ei jõua piloodist kaugemale. Ja Epoch AI näitab, et vaid 5,6% kasutajatest rakendab TI-d tõeliselt süvitsi.

Võib-olla pole küsimus selles, milline mudel on parem, vaid selles, kas preemiumile üle maksmine annab tüüpiliste juhtimisülesannete puhul proportsionaalselt parema tulemuse.

Me kontrollisime. Vastus osutus oodatust karmimaks.

Kuidas YandexGPT-st maksimum kätte saada: mis töötab ja mis mitte
10 min

Kuidas YandexGPT-st maksimum kätte saada: mis töötab ja mis mitte

Miljonid inimesed Venemaal kasutavad Alice’i iga päev – mitte sellepärast, et nad seda valiksid, vaid sellepärast, et see on tasuta, sisse ehitatud Yandexi brauserisse ja töötab ilma VPN-ita. YandexGPT, Alice’i kapoti all olev mudel, on parim Venemaa mudel meie võrdlusuuringus, kuid GPT-5.4-ni jääb tal veel pikk maa.

Kas sellelt on võimalik saada GPT-le lähedasi vastuseid, kui õppida õigesti küsima? Me kontrollisime seda katses: kümme promptimistehnikat, kuus juhtimisülesannet, kaks sõltumatut LLM-kohtunikku. Lühike vastus: jah, on võimalik – aga kõik tehnikad ei tööta ja mõned teevad asja hullemaks.

Allpool on konkreetsed mallid, mille saad kohe vestlusse kopeerida, ning antimustrid, mida tasub vältida.

Kohalikud LLM-id juhtidele: mida tegelikult saab kodus käivitada
17 min

Kohalikud LLM-id juhtidele: mida tegelikult saab kodus käivitada

Kõik, kes on piisavalt kaua töötanud ChatGPT või Claude’iga, esitavad varem või hiljem selle küsimuse: kas saaks midagi sarnast käivitada otse oma sülearvutis – ilma tellimuseta, ilma andmete lekketa, ilma serveritest sõltumata?

Aastal 2026 on vastus jah, aga reservatsioonidega, mis on vastusest endast olulisemad.

See artikkel on neile, kes juba kasutavad pilvepõhiseid LLM-e ja tahavad mõista, mida kohalik käivitamine tegelikult annab, millist riistvara selleks vaja on ja kus lõpevad ootused. Ilma tehnilise süvitsi minekuta, aga konkreetsete numbritega.

P5.express ja agentne tehisintellekt: kus aitab, kus lõhub
20 min

P5.express ja agentne tehisintellekt: kus aitab, kus lõhub

PMI maailmas on tavaks mõelda portfellijuhtimisest kui millestki monumentaalsest: komiteed, Tableau, sajad väljad Jiras, iganädalased staatuskoosolekud slaidipakiga. P5.express pakub teistsugust lähenemist. Kolm tsüklit, viis dokumenti, kaks rolli. Süsteem mahub ühele lehele.

Just sellisele süsteemile on mõistlik agentset tehisintellekti rakendada: minimalistlik arhitektuur on arusaadav, rollid selged, andmed struktureeritud. Kuid “mõistlik” ei tähenda “kõikjal”. Mõned P5.expressi osad lakkavad automatiseerimisel töötamast – mitte sellepärast, et tehisintellekt on halb, vaid sellepärast, et nende osade mõte peitub just inimprotsessis.

Allpool – analüüs iga tsükli kaupa. Mida tasub agendile delegeerida, mida on parem jätta inimestele ja milline mudel selleks sobib.