El siguiente paso con Hil-SERL - ajuste fino de vla RL. @_lilkm_ amplió el pipeline para seguir el artículo de ConRft 🤘🎊 Gran trabajo.