یادگیری تقویتی(Reinforcement Learning) چیست؟
یادگیری تقویتی شاخهای از یادگیری ماشین است که در آن عاملها با تعامل با محیط و دریافت پاداش یا تنبیه، سیاست بهینه تصمیمگیری را میآموزند. این مقاله به معرفی مفاهیم پایهای مانند عامل، محیط، وضعیت، عمل، پاداش و سیاست میپردازد و تفاوت آن را با یادگیری نظارتشده و نظارتنشده بررسی میکند. همچنین، انواع روشها و الگوریتمهای یادگیری تقویتی، کاربردهای متنوع آن در بازیها، رباتیک، سیستمهای توصیهگر و چشمانداز آینده این حوزه مورد بحث قرار گرفته است.