Cette vidéo parle de la fonction objectif des IA d'aujourd'hui, et de la manière dont elle est exploitée par les algorithmes d'apprentissage, notamment les algorithmes par renforcement (reinforcement learning). Dans ce cadre, les plus efficaces aujourd'hui semblent exploiter le "Q-learning", voire Deep Q-learning, c'est-à-dire l'apprentissage d'une fonction qui estime les récompenses espérées actualisées.
#AISafety #AIforGood #BeneficialAI #DébattonsMieux
Facebook : https://www.facebook.com/Science4Allorg/
Twitter : https://twitter.com/science__4__all
Tipeee : https://www.tipeee.com/science4all
La formule du savoir (mon livre) :
https://laboutique.edpsciences.fr/produit/1035/9782759822614/La%20formule%20du%20savoir
Moi en podcast avec Mr Phi :
Version YouTube : https://www.youtube.com/channel/UCNHFiyWgsnaSOsMtSoV_Q1A
Version Audio : http://feeds.feedburner.com/Axiome
Sous-titres sur les autres vidéos : http://www.youtube.com/timedtext_cs_panel?tab=2&c=UC0NCbj8CxzeCGIF6sODJ-7A
#IA #IntelligenceArtificielle #MachineLearning