چندی پیش به بهانهی انجام یک پروژهی درسی، متنی را آماده کردم با عنوان «روش تفاضلهای زمانی» یا «Temporal Differences Method». این روش از اصلیترین ایدههای شکل دهندهی الگوریتمهای «یادگیری تقویتی» است. فایلهای مربوط به گزارش و پیادهسازیهای Matlab این پروژه را در لینکهای زیر خواهید یافت:
اسلایدها (pdf 411K)
برنامهی Matlab به صورت فایل فشرده (zip 31K)
چند تصویر از اجرای برنامه [+] [+] [+] [+]