Täällä on käyty paljon keskustelua tekoälystä ja luovuudesta – pystyykö tekoäly luomaan aidosti uutta tietoa tai taidetta? Luovuuden tyypit eroavat kahdessa: suljettu (tietyllä tavoitteella) ja avoin, "sinitaivaan" luovuus (avoin). Yhdessä suosikkiartikkeleistani: suljettu luovuus reagoi kannustimiin; "Sinitaivaan" luovuus ei perustu sisäiseen motivaatioon. Keskeinen osa tekoälyjärjestelmien koulutusta on RL, joka tuottaa positiivisia signaaleja mallin tuloksen perusteella. Saattaa olla, että tämä järjestelmä optimoi "suljetua" luovuutta, mutta epäonnistuu "sinitaivaan" luovuudessa. Itse asiassa sama kirjoittajajoukko osoittaa, että ihmiset jatkavat tekoälyn hallitsemista "sinitaivaan" luovuudessa, mutta jäävät heikommin suljetun luovuuden tehtävissä. Jos haluamme tekoälyn luovan aidosti uutta tietoa, on hyödyllistä miettiä, miten koulutuksen voi optimoida tämänkaltaiseen "sinitaivaan" luovuuteen. Tämä herättää monia tärkeitä kysymyksiä siitä, miten palkitsemisfunktio suunnitellaan, miten mallille annetaan sisäinen motivaatio (joka on aktiivinen tutkimusalue) jne.