Актуальні теми
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Які ключові аспекти впровадження корпоративного ШІ? На відміну від споживачів, які використовують великі моделі або агенти ШІ, підприємства впроваджують ШІ з надзвичайно високими вимогами до виробничих середовищ, щільними документами та контекстними середовищами, а також вимагають високої точності, мінімального або навіть нульового рівня помилок. Оскільки це не для того, щоб ШІ писав вірші, спілкувався, створював зображення чи розв'язував математичні задачі, а щоб справді впроваджувати ШІ у реальний бізнес-процес роботи та виробництва підприємства чи компанії, це дозволяє ШІ виконувати складну, нудну і надзвичайно точну роботу, яку люди виконують щодня.
Досить цікаво бачити, як Arena була запущена компанією SentientAGI. Він надає цим агентам ШІ реальну складність (або сильно змодельовані) корпоративні завдання через суворі критерії оцінювання (такі як точність, повнота доказів, рівень галюцинацій, точність цитувань, час виконання тощо), а потім систематично фіксує режими відмов (наприклад, «вигадування даних з повітря», «посилання на неправильні джерела», «стрибки в міркуванні», «відсутні ключові положення»), а потім ітерує та відкрито порівнює, щоб дозволити розробникам бачити прогалини та покращуватися.
Коротко кажучи, Arena — це не тест «чи розумний ШІ», а те, чи може він точно розуміти наміри та виконувати завдання, фактично перевіряючи, чи може цей ШІ справді працювати у великих компаніях, особливо в тих робочих зв'язках і процесах, які найскладніше автоматизувати і які найбільш схильні до аварій.
З цієї точки зору Arena — це платформа для змагань, де розробники подають агентів ШІ на стандартизовані завдання та порівнюють результати за умов послідовного тестування. Це схоже на «змагання агентів ШІ», де агенти ШІ змагаються справедливо за однаковими правилами в одній арені. Платформа відстежує категорії помилок, такі як галюцинації, відсутні докази, неправильні цитування та прогалини у висновках, що дозволяє розробникам діагностувати повторювані проблеми.
Схоже, що Sentient сподівається змусити спільноту відкритого коду досягти надійності, довголанцюгового мислення та аудитуваності агентів ШІ в реальному середовищі, де підприємства наважуються перейти у виробництво, а не просто залишатися на етапах демонстрації та таблиці лідерів. Саме це справді допоможе підняти ШІ на новий рівень (найсучасніший) для реаліальних завдань інференції на рівні підприємств.
З цієї точки зору я також розумію, чому ці великі інституції у сфері фінансових інвестицій, такі як Franklin Templeton, Founders Fund, Pantera, OpenRouter тощо, готові брати участь у співпраці, адже вони самі дуже переймаються цим, а інституції та підприємства справді переймаються тим, чи наважаться вони впроваджувати ШІ у мій реальний процес прийняття бізнес-рішень.
Я все ще з нетерпінням чекаю подальшого прогресу над платформою Arena, яка має стати дуже важливою частиною дорожньої карти «Open AGI», яку Sentient хоче просувати.
Найкращі
Рейтинг
Вибране
