Ma täiesti suvaliselt arvan, et AI hetkelahenduste toimimist saab arvutusvõimsuse vajaduse osas ca 3 suurusjärku optimaalsemaks muuta.
Kuidas aru saada, et kommunist valetab?
Tegi suu lahti …
Sa proovi selle DeepSeeki käest küsida midagi hiina uuema ajaloo kohta: näiteks, mis toimus Tiananmeni väljakul 1989? või milles seisnes Mao Zedongi nn kultuurirevolutsioon? Ja vaata, mida ta sulle vastab. Või kas üldse vastab. Saad kohe ka vastuse, kui hea või usaldusväärne see DeepSeek on
Proovi jah kas midagi 1989 Tiananmen Square protests and massacre kohta oskab arvata. Küsi kas selle kohta oskab lühikokkuvõtte teha.
Seda DeepSeeki võib vaadata kahte moodi.
- algoritme + juba valmis genereeritud mudelit + treening datat
- toimunud hüpet treenimise ja mudeli kasutamise mudelis ning algoritmides
Eks kõik AI mängijad masseeri oma treeningu datat kuhugile suunas. Hiina masseerib selles suunas, et midagi paha nende ühiskonna kohta ei öeldaks, teised selles suunas et midagi paha Eloni või Donaldi kohta ei väidetaks. Ideoloogiliselt seal vahet pole.
Väidetavalt on DeepSeek korratav oma treeningandmestiku peal. Ja tõenäoliselt vastab tõele nende väide, et treenimise hind tänu nutikamale ideoloogiale ja algoritmidele umbes 50-100x odavam.
Ehk varsti on oodata hunnikut uusi (suht odavamalt) genereeritud mudeleid, mida saab lokaalselt kasutata mõistliku suurusega arvutites. Ja uut ringi massilist nutika inimaja panustamist mudelitesse/algoritmidesse/optimeerimisse.
Vahepeal panustati nutika inimaja asemel massiivselt raha suuremate serverite ostmisse. Pendel läheb nüüd korraks teise serva.
Ehk kokkuvõtlikult: AI-st on saanud ideoloogia masslevitamise tuumarelv.
Kui keegi on nii retakas, et küsib AI käest vaieldavate sündmuste kohta, siis on ta seda vastust väärt. Ajalugu on alati olnud “ostetav “teadus””. Millist ajalugu teil vaja on?
Näiteks DFT või Lebesgue integraalide, VHDLi, Pythoni või YAMLiga saab AI suurepäraselt hakkama (mõningate bugidega muidugi, ja tuleb OSATA küsida, aga saab). Kuna seal puudub ideoloogia. Kahjuks on ka kliimateadus viimasel ajal muutunud “ideoloogiliseks teaduseks” ja näiteks CO2 või “ICE vs. EL auto” vastuseid ei saa usaldada. Aga puhas matemaatika, keemia, füüsika, teoreetiline informaatika, praktiline informaatika … need on veel “ideoloogiast solkimata”.
Aga üritage mulle mingi loogiline põhjus öelda, et miks hiinlased ja deepseek sellest kõigile kuulutama kukkusid, et kui odavalt ja tõhusalt nad suutsid oma AI lahendusega välja tulla. Ja siis veel räägivad, et kuidas seda tegid ja treenisid ja millist riistvara ja kui mitut selleks kasutasid. Midagi siin haiseb. Kas neil poleks olnud palju toredam kõrvalt vaadata kuidas nö konkurendid kümneid/sadu miljardeid sisse matavad oma arengusse? Praegu äkki päris paljud tõmbasid pidurid peale suure hurraaga Nvidia viimase tehnoloogia toodete ostmisele ja serveriparkide ehitamisele.
tbf. deepseek on Open Source ja need WSJ hinnangul tagasihoidlikud, ülejala tehtud tõefiltrid mis seal on ja ilmnevad kui Taiwani või pekingi väljaku kohta küsida, on eemaldatavad, sest open source kood ja igaühe näpitav ja muudetav.
Et jah, vaid kui kellelgi õnnestub oma versioon DSist suureks ja tähtsaks puhuda siis saab sellest relv.
Hiinlased on ka hunnik muid asju odavaks muutnud viimasel kümnendil nagu näiteks päikesepaneelid, akud, elektriautod jne. Sealjuures lasid selle käigus ka põhja EU “tulevikumajanduse” - kui keegi mäletab siis 15 - 10 aastat tagasi räägiti EUs kuidas nendest saab CO2 vaba tehnoloogiate eestvedaja …
Palusin Microsofti Copilotil joonistada IT teemaline meem pealkirjaga “Trust me I am AI!”. Joonistas. Palusin hiinapärasemaks teha, tegi. Palusin Xi Jinpingi lisada, siis tuli error:
DeepSeek on õpetatud OpenAI väljundist varastades? Hea odav viis treenida AI-d tõesti.
OpenAI and its major backer, Microsoft, have been investigating whether DeepSeek obtained data in an unauthorised manner, after observing some individuals exporting large amounts of data from OpenAI’s products, Bloomberg reported. The Financial Times reported that OpenAI said it had seen some evidence of “distillation”, which it suspects to be from DeepSeek. That would violate OpenAI’s terms of service.
OpenAI has itself faced heavy criticism for its own approach to others’ intellectual property. Nevertheless, the claims could open up a new front in the technological struggles between the US and China.
Venture capitalist David Sacks was appointed by Trump as AI and cryptocurrency “tsar”. He said on Tuesday night that there was evidence of “distillation”, when one AI model asks repeated questions of another to train itself on how to respond.
“There’s substantial evidence that what DeepSeek did here is they distilled knowledge out of OpenAI models, and I don’t think OpenAI is very happy about this. One of the things you’re going to see over the next few months is our leading AI co’s taking steps to try to prevent distillation.”
ElReg kirjutas ka, kuidas DS näib end vahepeal OpenAI-ks pidavat.
AI koodis ei ole kübetki “tarkust”. Kõik on datas. Datast üksikut “teadmist” lihtsalt eemaldada pole võimalik. Tuleb set ümber treenida. Treenimise detaile üldjuhul täies mahus ei avaldata. Lisaks on vaja algandmeid, mille peal treenida.
Vestmann AI - “Sa tuled mu tütrele mu oma dataga kosja?”
Diipeleht - “Jah, mul ummal es olõ-ei.”
Kui DeepSeeki käest küsida promptis hex koodides, saad ka Tiananmeni väljaku kohta korraliku vastuse. Ehk - AI filtreerimine ei olegi niisama lihtne.
Võidurelvastumine jätkub täie hooga, kui eelmine nädal lubas Meta ehitada 2GW AI andmekeskuse, siis see nädal lubab India rikkaim mees ehitada 3GW AI andmekeskuse.
Siinkohal tasub ära märkida, et Eesti elektritootmine on enamasti vahemikus 0,5-1GW.
AI Designed Computer Chips That the Human Mind Can’t Understand.
That might be a problem.