Провали на бичачому ринку призначені для покупки, особливо на проектах з великими каталізаторами Ми всі знаємо, що штучний інтелект – це наратив цього циклу, розпочатого ai16z та Virtuals минулого року. Я впевнений, що ринок зосередиться на більш складних і витончених технологіях, таких як VLA, і дозвольте мені пояснити вам чому. LLM (великі мовні моделі) в основному читають і записують текст: вони чудово пояснюють, планують і генерують інструкції, але самі по собі не керують моторами або не взаємодіють з фізичним світом (як ви, можливо, відчували з chatgpt). VLA (Vision Language Action models) відрізняються від LLM тим, що це мультимодальні системи, які дивляться на речі (vision), розуміють інструкції (мова) і безпосередньо виробляють дії. Це все одно, що сказати роботу підняти червону чашку, а потім рухати його рукою, щоб зробити це. ВЛА навчаються на прикладах, які поєднують зображення/відео + інструкції + сліди реальних дій (як насправді рухався робот), і вони повинні працювати швидко та безпечно в режимі реального часу. LLM зі свого боку тренуються на величезних колекціях текстів і зосереджуються на міркуваннях і мовних завданнях. ТЛ; DR LLM думають і говорять, а VLA бачать, міркують і діють. Як ви можете бачити, VLA є важливим доповненням до LLM і, зокрема, забезпечать наступну інновацію 0 до 1 у загальній економіці, якою стане робототехніка. Більшість інвестиційних фондів спрямовують значну частину своїх інвестицій у цей сектор, що розглядається як наступна логічна еволюція в індустрії штучного інтелекту. Деякий час тому я вже зробив пост про нинішнього лідера на крипторинку @codecopenflow, який ще не залучив капітал (справедливий запуск), ще не постачає передові продукти і в даний час коштує 23 мільйони доларів FDV. Для інформації, інші криптовалютні конкуренти залучили 20 мільйонів доларів ( @openmind_agi) за ціною, ймовірно, від 200 до 300 мільйонів доларів ++ FDV, хоча жоден продукт або спільнота ще не були створені та доставлені. Що робить Codec провідним проектом у цьому секторі, так це те, що вони вирішують важливе вузьке місце в робототехніці та штучному інтелекті, яке полягає в складності взаємодії всіх інструментів штучного інтелекту разом. Дозвольте мені пояснити. Їхній останній реліз, OPTR (operator), є набором інструментів, який допомагає створювати операторів, здатних взаємодіяти на кількох платформах, таких як роботи, настільні комп'ютери, браузери або симуляції. Мета оператора полягає в тому, щоб бачити, міркувати і діяти (VLA) як в цифровому (комп'ютери), так і у фізичному (роботи) світах. Цей набір інструментів слугує основною інфраструктурою для команд роботів, які прагнуть протестувати свій продукт і покращити загальний процес, надаючи уніфікований досвід замість окремих для веб-браузерів, симуляцій або роботів. Це, по суті, робить оператора адаптивним і автономним незалежно від навколишнього середовища. Отже, ви це зрозумієте, це значно заощадить час компаніям і розробникам, яким раніше доводилося проходити кожен крок вручну, і де ви можете заощадити час, ви можете заощадити гроші. Це також дозволить Codec створювати власні проекти для операторів і відносно швидко запускати нові потужності на ринок, зокрема через свій ринок. ...