mysummit.school - Tehisintellekti blogi juhtidele

40 GigaChat juhtumit: kontrollime Sberi võrdlusuuringut andmetega

26. mai 2026

18 min lugemist

Sber – Venemaa suurim pank ja üks selle riigi juhtivaid tehisintellekti arendajaid – andis välja reklaami-eriprojekti: nelikümmend ärijuhtumit ettevõtetest, kes võtsid kasutusele GigaChati (Sberi enda vestlusmudeli) ja räägivad selle mõjust. EdTech, MedTech, HRTech, küberturve, PropTech. Ilusad kaardid, konkreetsed numbrid, päris idufirmad.

Pildil: kiirendi Sber500×GigaChat reklaamslaid „Sammu võrra ees" – 40 idufirmat 9 valdkonnast. Lubatud efektid: äriprotsessid kuni x16 kiiremad, kulud kuni 90% väiksemad, ülesannete automatiseerimine kuni 95%, käive kuni 30% suurem.

Meil on võrdlusuuring: 29 mudelit, 4 308 sõltumatut hinnangut juhtimisülesannetel. GigaChat on selles teise testlaine järel viimasel, 29. kohal. See loob huvitava olukorra.

Mitte sellepärast, et Sber valetaks. Juhtumid on päris, idufirmad olemas, automaatika töötab. Küsimus on muus: kas see oli optimaalne mudel ülesannete jaoks, mida nad lahendasid?

Loe edasi

40 GigaChat juhtumit: kontrollime Sberi võrdlusuuringut andmetega

280 korda odavam kahe aastaga: TI majandus on ümber pööratud

12 mai

8 min

280 korda odavam kahe aastaga: TI majandus on ümber pööratud

aastal maksis üks päring GPT-4-le nii palju, et arvutamine pidi olema hoolikas. 2025. aastaks oli samaväärne päring 280 korda odavam. Mitte 280 protsenti – 280 korda. Kahe aastaga muutus TI kasutamise hind barjäärist ümardamisveaks.

Stanford AI Index – iga-aastane raport, mis kogub andmeid TI-tööstuse kohta sadadest allikatest – fikseeris selle kokkuvarisemise 2025. aasta raportis. Ja 2026. aasta raport lisas konteksti: investeeringud TI-sse plahvatasid 285,9 mld dollarini, tarbijad saavad väärtust 172 mld dollarit aastas ja andmekeskused tarbivad elektrit nagu New Yorgi osariik. Majandus on ümber pööratud – aga mitte nii, nagu oodati.

TI levis kiiremini kui internet – aga 62% kasutajatest jäid stardijoonele

8 mai

7 min

TI levis kiiremini kui internet – aga 62% kasutajatest jäid stardijoonele

aasta aprillis avaldas Stanford HAI üheksanda iga-aastase AI Index Report’i – kõige ulatuslikuma ülevaate tehisintellekti tööstuse seisust. Pealkirjad on ootuspäraselt optimistlikud: ettevõtete kasutuselevõtt on jõudnud 88%-ni, generatiivne TI on levikukiiruses edestanud internetti, tarbijatele loodav GenAI-tööriistade väärtus on hinnanguliselt 172 miljardit dollarit aastas. Aga numbrite taha vaadates kerkib esile tuttav probleem.

4 promptimise tehnikat, testitud 7 mudelil: tookokoja juhend

4 mai

24 min

4 promptimise tehnikat, testitud 7 mudelil: tookokoja juhend

“Analüüsi seda projekti ja anna soovitusi” – üks prompt, seitse mudelit, ja GPT-5.4 andis välja 2231 sõna uduseid nõuandeid, samal ajal kui Claude Sonnet pakkus 11 kiitvat fraasi nagu “suurepärane eelarve struktuur”. Piisas päringu ümberkirjutamisest viie elemendi struktuuri järgi – kõik seitse mudelit mahtusid 346–443 sõnasse ja kiidulaulud kadusid. Tokenite kokkuhoid: 41% kuni 79% olenevalt mudelist.

See pole teooria. Need on andmed töökojast “Promptimine praktikas”, mille viisin läbi IIBA konverentsil. Üks projektibriif, neli tehnikat, seitse mudelit, 28 käivitust – ja $0,054 kokku. Odavam kui kohv automaadist.

AI-võrdlusuuringud kaotavad mõtte – kuidas siis mudelit valida

3 mai

5 min

AI-võrdlusuuringud kaotavad mõtte – kuidas siis mudelit valida

Märtsis vaatasime, kuidas LLM-i võrdlusuuringud on üles ehitatud – GPQA Diamond, SWE-bench, Chatbot Arena. Aprillis testisime 53 mudelit ja avastasime, et tippmudelite kvaliteedivahe on kümnendik punkti, hinnavahe aga kolm suurusjärku.

Nüüd – järgmine küsimus. Mis siis, kui võrdlusuuringud ise lakkavad töötamast?

99% kvaliteedist 1,4% hinnaga: mis on TI-mudelite turul valesti

26 apr

6 min

99% kvaliteedist 1,4% hinnaga: mis on TI-mudelite turul valesti

Enamik juhte valib TI-mudeli nii: võtab kõige kallima saadaoleva. Loogika on arusaadav – kallim tähendab paremat. Nii on ettevõttetarkvara puhul viimased kakskümmend aastat toiminud.

TI-mudelite turg 2026. aastal on teisiti korraldatud. Ühe päringu maksumus varieerub $0,0001 kuni $0,17 – kolm suurusjärku. Aga tegelik kvaliteedierinevus kümne parima mudeli vahel? 0,24 punkti viiepallisel skaalal. Samal ajal Wharton / GBK Collective fikseerib: kolmandik ettevõtete TI-projektidest ei jõua piloodist kaugemale. Ja Epoch AI näitab, et vaid 5,6% kasutajatest rakendab TI-d tõeliselt süvitsi.

Võib-olla pole küsimus selles, milline mudel on parem, vaid selles, kas preemiumile üle maksmine annab tüüpiliste juhtimisülesannete puhul proportsionaalselt parema tulemuse.

Me kontrollisime. Vastus osutus oodatust karmimaks.

Kuidas YandexGPT-st maksimum kätte saada: mis töötab ja mis mitte

23 apr

10 min

Kuidas YandexGPT-st maksimum kätte saada: mis töötab ja mis mitte

Miljonid inimesed Venemaal kasutavad Alice’i iga päev – mitte sellepärast, et nad seda valiksid, vaid sellepärast, et see on tasuta, sisse ehitatud Yandexi brauserisse ja töötab ilma VPN-ita. YandexGPT, Alice’i kapoti all olev mudel, on parim Venemaa mudel meie võrdlusuuringus, kuid GPT-5.4-ni jääb tal veel pikk maa.

Kas sellelt on võimalik saada GPT-le lähedasi vastuseid, kui õppida õigesti küsima? Me kontrollisime seda katses: kümme promptimistehnikat, kuus juhtimisülesannet, kaks sõltumatut LLM-kohtunikku. Lühike vastus: jah, on võimalik – aga kõik tehnikad ei tööta ja mõned teevad asja hullemaks.

Allpool on konkreetsed mallid, mille saad kohe vestlusse kopeerida, ning antimustrid, mida tasub vältida.

Kohalikud LLM-id juhtidele: mida tegelikult saab kodus käivitada

19 apr

17 min

Kohalikud LLM-id juhtidele: mida tegelikult saab kodus käivitada

Kõik, kes on piisavalt kaua töötanud ChatGPT või Claude’iga, esitavad varem või hiljem selle küsimuse: kas saaks midagi sarnast käivitada otse oma sülearvutis – ilma tellimuseta, ilma andmete lekketa, ilma serveritest sõltumata?

Aastal 2026 on vastus jah, aga reservatsioonidega, mis on vastusest endast olulisemad.

See artikkel on neile, kes juba kasutavad pilvepõhiseid LLM-e ja tahavad mõista, mida kohalik käivitamine tegelikult annab, millist riistvara selleks vaja on ja kus lõpevad ootused. Ilma tehnilise süvitsi minekuta, aga konkreetsete numbritega.

Kuidas Microsoft vaikselt võitis korporatiivse TI turu: mida see tähendab juhtidele

19 apr

9 min

Kuidas Microsoft vaikselt võitis korporatiivse TI turu: mida see tähendab juhtidele

Millal te viimati lugesite pealkirja Microsoft Copilotist? Tõenäoliselt harva. Meediaruum on täis uudiseid GPT-5, Claude 4.7 ja Gemini Ultra kohta. Copilot näib olevat igav korporatiivne tööriist, millest kirjutatakse ainult LinkedInis.

Aga vaadake nüüd, kes mille eest maksab.

P5.express ja agentne tehisintellekt: kus aitab, kus lõhub

13 apr

20 min

P5.express ja agentne tehisintellekt: kus aitab, kus lõhub

PMI maailmas on tavaks mõelda portfellijuhtimisest kui millestki monumentaalsest: komiteed, Tableau, sajad väljad Jiras, iganädalased staatuskoosolekud slaidipakiga. P5.express pakub teistsugust lähenemist. Kolm tsüklit, viis dokumenti, kaks rolli. Süsteem mahub ühele lehele.

Just sellisele süsteemile on mõistlik agentset tehisintellekti rakendada: minimalistlik arhitektuur on arusaadav, rollid selged, andmed struktureeritud. Kuid “mõistlik” ei tähenda “kõikjal”. Mõned P5.expressi osad lakkavad automatiseerimisel töötamast – mitte sellepärast, et tehisintellekt on halb, vaid sellepärast, et nende osade mõte peitub just inimprotsessis.

Allpool – analüüs iga tsükli kaupa. Mida tasub agendile delegeerida, mida on parem jätta inimestele ja milline mudel selleks sobib.

mysummit.school - Tehisintellekti blogi juhtidele

40 GigaChat juhtumit: kontrollime Sberi võrdlusuuringut andmetega

280 korda odavam kahe aastaga: TI majandus on ümber pööratud

TI levis kiiremini kui internet – aga 62% kasutajatest jäid stardijoonele

4 promptimise tehnikat, testitud 7 mudelil: tookokoja juhend

AI-võrdlusuuringud kaotavad mõtte – kuidas siis mudelit valida

99% kvaliteedist 1,4% hinnaga: mis on TI-mudelite turul valesti

Kuidas YandexGPT-st maksimum kätte saada: mis töötab ja mis mitte

Kohalikud LLM-id juhtidele: mida tegelikult saab kodus käivitada

Kuidas Microsoft vaikselt võitis korporatiivse TI turu: mida see tähendab juhtidele

P5.express ja agentne tehisintellekt: kus aitab, kus lõhub

Vajalikud

Analüütika

Funktsionaalsed

Turundus

40 GigaChat juhtumit: kontrollime Sberi võrdlusuuringut andmetega

280 korda odavam kahe aastaga: TI majandus on ümber pööratud

TI levis kiiremini kui internet – aga 62% kasutajatest jäid stardijoonele

4 promptimise tehnikat, testitud 7 mudelil: tookokoja juhend

AI-võrdlusuuringud kaotavad mõtte – kuidas siis mudelit valida

99% kvaliteedist 1,4% hinnaga: mis on TI-mudelite turul valesti

Kuidas YandexGPT-st maksimum kätte saada: mis töötab ja mis mitte

Kohalikud LLM-id juhtidele: mida tegelikult saab kodus käivitada

Kuidas Microsoft vaikselt võitis korporatiivse TI turu: mida see tähendab juhtidele

P5.express ja agentne tehisintellekt: kus aitab, kus lõhub

⚙️ Küpsiste seaded

Vajalikud

Analüütika

Funktsionaalsed

Turundus

Tähelepanu

Küpsisepoliitika