Trendaavat aiheet
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Mitkä ovat yritysten tekoälyn käyttöönoton keskeiset osa-alueet? Toisin kuin kuluttajat, jotka käyttävät tekoälyn suuria malleja tai tekoälyagentteja, yritykset käyttävät tekoälyä erittäin korkeilla vaatimuksilla tuotantoympäristöille, tiheille dokumenteille ja kontekstuaalisille ympäristöille, ja vaativat korkeaa tarkkuutta, mahdollisimman pientä tai jopa nolla virhemäärää. Koska tämä ei ole tarkoitettu siihen, että tekoäly kirjoittaisi runoja, juttelee, tuottaa kuvia tai ratkaisisi matemaattisia ongelmia, vaan todella upottaa tekoäly yrityksen tai tuotannon varsinaiseen liiketoimintaprosessiin, vaan antaa tekoälyn suorittaa monimutkaisen, työläisen ja äärimmäisen tarkan työn, jota ihmiset tekevät päivittäin.
On varsin mielenkiintoista nähdä SentientAGI:n käynnistämä Arena. Se antaa näille tekoälyagenteille todellisia vaikeita (tai erittäin simuloituja) yritystehtäviä tiukkojen pisteytyskriteerien (kuten tarkkuus, todisteiden täydellisyys, hallusinaatioprosentti, viittausten tarkkuus, suoritusaika jne.) avulla, ja tallentaa järjestelmällisesti vikatilat (kuten "datan valmistaminen tyhjästä", "väärien lähteiden viittaaminen", "päättelyhyppyjä", "puuttuvat avainlausekkeet"), ja lopuksi iteroi ja vertailee avoimesti, jotta kehittäjät voivat nähdä aukot ja kehittyä.
Lyhyesti sanottuna Arena ei ole testi siitä, "onko tekoäly älykäs vai ei", vaan siitä, pystyykö se ymmärtämään aikomukset tarkasti ja suorittamaan tehtäviä, käytännössä testatakseen, voiko tekoäly todella toimia suurissa yrityksissä, erityisesti niissä työyhteyksissä ja prosesseissa, joita on vaikein automatisoida ja jotka ovat alttiimpia onnettomuuksille.
Tästä näkökulmasta Arena on kilpailualusta, jossa kehittäjät lähettävät tekoälyagentteja standardoituihin tehtäviin ja vertailevat tuloksia johdonmukaisissa testausolosuhteissa. Se on kuin "tekoälyagenttikilpailu", jossa tekoälyagentit kilpailevat reilusti samoilla säännöillä samassa areenassa. Alusta seuraa sitten vikakategorioita, kuten hallusinaatioita, puuttuvia todisteita, virheellisiä viittauksia ja päättelyaukkoja, jolloin kehittäjät voivat diagnosoida toistuvia ongelmia.
Vaikuttaa siltä, että Sentient pyrkii pakottamaan avoimen lähdekoodin yhteisön saavuttamaan tekoälyagenttien luotettavuuden, pitkäketjuisen päättelyn ja auditoitavuuden todellisessa ympäristössä, jossa yritykset uskaltavat siirtyä tuotantoon sen sijaan, että pysyisivät vain demo- ja tulostaulukoissa. Tämä auttaa todella viemään tekoälyn uudelle huipputasolle (huippuluokkaa) todellisten yritystason päättelytehtävissä.
Tästä näkökulmasta ymmärrän myös, miksi nämä suuret rahoitusalan instituutiot, kuten Franklin Templeton, Founders Fund, Pantera, OpenRouter jne., ovat valmiita osallistumaan yhteistyöhön, koska hekin ovat tästä hyvin huolissaan, ja instituutioita ja yrityksiä todella kiinnostaa, uskaltavatko he ottaa tekoälyn osaksi varsinaista liiketoimintapäätösprosessiani.
Odotan edelleen edistystä Arena-alustalla, jonka pitäisi olla erittäin keskeinen osa "Open AGI" -tiekarttaa, jota Sentient haluaa edistää.
Johtavat
Rankkaus
Suosikit
