Pubblicato il 01/02/2020 su facebook: vai al post per ulteriori commenti

A.I. & algoritmi investiranno per noi...
Strada segnata secondo me! Quale "disruptor" ci indicherà la strada?
Apprendimento di rinforzo distributivo
La quantità di ricompensa futura che deriverà da una determinata azione spesso non è una quantità nota, ma comporta invece una certa casualità. In tali situazioni, un algoritmo TD standard impara a prevedere la ricompensa futura che verrà ricevuta in media, mentre un algoritmo di rinforzo distributivo prevede l'intero spettro di premi.
https://www.linkedin.com/.../thepsironi_biology-ai-fmt...
https://venturebeat.com/.../deepmind-dopamine-protein.../
Thanks Paolo Siron