پنجشنبه، مهر ۳۰، ۱۳۸۸

روش تفاضل‌های زمانی

چندی پیش به بهانه‌ی انجام یک پروژه‌ی درسی، متنی را آماده کردم با عنوان «روش تفاضل‌های زمانی» یا «Temporal Differences Method». این روش از اصلی‌ترین ایده‌های شکل دهنده‌ی الگوریتم‌های «یادگیری تقویتی» است. فایل‌های مربوط به گزارش و پیاده‌سازی‌های Matlab این پروژه را در لینک‌های زیر خواهید یافت:

متن گزارش (pdf 455K)
اسلایدها (pdf 411K)
برنامه‌ی Matlab به صورت فایل فشرده (zip 31K)
چند تصویر از اجرای برنامه [+] [+] [+] [+]