深度學習理論/科學的目標是指導實踐。但大多數實際問題距離理論的合理回答還有超過一篇論文的距離。那麼,在沒有理想的獎勵信號「這個理論是否給我們一個 SOTA 算法?」的情況下,我們該如何進步呢?…