یادگیری تقویتی (rl) یکی از حوزه های مهم در زمینه هوش مصنوعی است که به تقویت اینتراکتیو با محیط و یادگیری از تجربه برای بهبود عملکرد در مسائل تصمیم گیری متمرکز می شود.
WhatsApp: +86 18221755073در این مطلب فرض شده که مخاطبان با مفاهیم مقدماتی یادگیری تقویتی (RL) و فرآیندهای تصمیمگیری مارکوف (Markov Decision Processes) آشنایی دارند.
WhatsApp: +86 18221755073فرآیند یادگیری تقویتی فرض میشود که یک عامل در حال یادگیری بازی برادران سوپرماریو از طریق کار روی مثالها است.
WhatsApp: +86 18221755073عناصر یادگیری تقویتی به شرح زیر است: خط مشی (سیاست) تابع پاداش; تابع ارزش; مدل محیط; خط مشی: سیاست چگونه رفتار کردن عامل یادگیرنده طی یک دوره زمانی معین را تعریف میکند.
WhatsApp: +86 18221755073آموزش جامع یادگیری تقویتی (Reinforcement Learning) در پایتون. یادگیری تقویتی (Reinforcement Learning) یک زیرشاخه جذاب از هوش مصنوعی است که بر تعامل با یک محیط و انجام کنش هایی به منظور حل مسائل کنترلی توسط یک عامل هوشمند …
WhatsApp: +86 18221755073محیط به طور معمول در قالب یک فرآیند تصمیم گیری مارکوف (mdp) بیان می شود زیرا بسیاری از الگوریتم های یادگیری تقویتی کننده برای این زمینه از تکنیک های برنامه نویسی پویا استفاده می کنند.
WhatsApp: +86 18221755073ویژگیهای تقویت مثبت به شرح زیر است: عملکرد عامل را به حداکثر میرساند. تغییر را برای مدت طولانی حفظ میکند. تقویت بیش از حد رفتارهای صحیح میتواند نتایج درست را کاهش دهد.
WhatsApp: +86 18221755073یادگیری تقویتی یک فرآیند تصمیمگیری چندگانه است و این یعنی rl یک زنجیره تصمیمگیری را در طول زمان لازم برای اتمام یک کار خاص تشکیل میدهد. برعکس، یادگیری تحت نظارت یک فرآیند تک تصمیمی است.
WhatsApp: +86 18221755073همانطور که پیش از این هم اشاره شد، در یادگیری تقویتی برعکس روشهای یادگیری با برچسبگذاری دادهها، عامل از طریق آزمون و خطا آموزش میبیند. به بیانی دیگر، عامل با انجام یکسری اقدامات در محیط مشاهده میکند کدام از اقدامات دارای بازده خوب و کدامیک دارای بازده بد است. در نهایت با استفاده از تکنیکهای مختلف، عامل بر مبنای سیاست خود اقداماتی را اجرا میک...
WhatsApp: +86 18221755073یادگیری تحت نظارت: یادگیری تحت نظارت به دادههای آموزشی برچسبگذاریشده نیاز دارد، جایی که هر ورودی با برچسب هدف مربوطه مرتبط است. این فرایند برچسبزدن میتواند زمانبر و پرهزینه باشد.
WhatsApp: +86 18221755073