Щойно опублікував свій виступ у Гарвардському університеті GSD про майбутнє творчого штучного інтелекту – куди ми йдемо та як його використовувати:
Теми, що розглядаються:
- Просторовий інтелект: фотограмметрія, поля нейронного сяйва (NeRFs) та 3D-гауссове сплескування для оцифрування реальності.
- Візуальний інтелект: оцінка пози за допомогою штучного інтелекту, сегментація, висновок про глибину та повторне освітлення.
- Гібридні робочі процеси: кодування Vibe, контекстний протокол моделі (MCP) та як LLM взаємодіють із Blender, Unreal та Runway.
- Парадигма перетворення контенту на контент: перехід від тексту до відео до повністю персоналізованих, динамічних та своєчасних медіа.
- Майбутнє медіа: персоналізовані подкасти, AR-тури, ігри на основі генеративного штучного інтелекту та розмиття програмного забезпечення з контентом.
Оскільки нано банан знає світ Близнюків, ви можете просто завантажити скріншоти реального світу і попросити його анотувати щось для вас.
«Ви – генератор досвіду AR на основі місцезнаходження. Виділіть [об'єкт інтересу] на цьому зображенні та додайте відповідну інформацію про нього».
Якщо Apple впустить термо/інфрачервоний датчик на iPhone, я збираюся негайно його купити. FLIR з роздільною здатністю 640-1024px на телефоні був би божевільним.