🧠 واحدهای بازگشتی دروازهای (GRUs)
مقدمه
واحدهای بازگشتی دروازهای یا GRU (Gated Recurrent Unit) یکی از معماریهای قدرتمند در خانوادهی شبکههای عصبی بازگشتی (RNN) است که در سال ۲۰۱۴ توسط Cho et al. معرفی شد. هدف اصلی طراحی GRU، رفع مشکل حافظه کوتاهمدت و گرادیان ناپایدار در RNNهای کلاسیک بود.
این مدل با استفاده از سازوکار دروازهها (Gates)، توانایی بهخاطر سپردن اطلاعات مهم و فراموش کردن دادههای غیرضروری را به شبکه میدهد.
🔹 مشکل RNNهای کلاسیک
شبکههای عصبی بازگشتی معمولی قادر به پردازش توالی دادهها (مثل جملات، سیگنالها یا سریهای زمانی) هستند، اما در یادگیری وابستگیهای بلندمدت با مشکلاتی مواجهاند.
بهویژه، در فرآیند پسانتشار از طریق زمان (BPTT)، گرادیانها ممکن است:
- بسیار کوچک شوند (Vanishing Gradient) و یادگیری از بین برود.
- یا بیش از حد بزرگ شوند (Exploding Gradient) و مدل ناپایدار گردد.
برای رفع این مشکل، معماریهایی مانند LSTM و GRU معرفی شدند.
🔸 ساختار کلی GRU
مدل GRU دارای دو دروازهی اصلی است:
- دروازهی بازنشانی (Reset Gate)
- دروازهی بهروزرسانی (Update Gate)
برخلاف LSTM، GRU فاقد سلول حافظهی جداگانه است و همهی اطلاعات درون حالت پنهان (Hidden State) مدیریت میشوند. این ویژگی باعث میشود GRU نسبت به LSTM سادهتر و سریعتر باشد، در حالی که عملکرد مشابهی ارائه میدهد.
⚙️ روابط ریاضی GRU
فرمولهای GRU به صورت زیر هستند:

🔍 تفسیر سادهتر دروازهها
🟩 دروازهی بهروزرسانی (Update Gate)
مثل یک کنترلکنندهی حافظه است که تصمیم میگیرد چه مقدار از اطلاعات گذشته را نگه دارد و چه مقدار از دادهی جدید جایگزین شود.
🟥 دروازهی بازنشانی (Reset Gate)
تصمیم میگیرد که هنگام ترکیب ورودی جدید با حالت قبلی، چقدر از اطلاعات قبلی نادیده گرفته شود.
اگر مقدار آن کوچک باشد، حافظهی قبلی تقریباً فراموش میشود.
⚡ مزایای GRU نسبت به RNN و LSTM
🧩 مزایا و ویژگیهای کلیدی GRU
- ✅ یادگیری وابستگیهای بلندمدت بدون از بین رفتن گرادیان
- ⚡ سرعت محاسباتی بالا نسبت به LSTM (به دلیل پارامترهای کمتر)
- 🔧 سازگاری با انواع دادههای ترتیبی مانند متن، گفتار، سیگنال، و سری زمانی
- 🧠 ظرفیت تعمیم بالا حتی در دادههای با نویز
- 🔄 قابلیت ترکیب با معماریهای پیچیدهتر مانند CNN یا Attention
🧪 کاربردهای GRU
- پردازش زبان طبیعی (NLP):
- ترجمه ماشینی
- مدلسازی زبان
- تحلیل احساسات
- پردازش گفتار (Speech Processing):
- تشخیص گفتار
- بازسازی سیگنال صوتی
- تحلیل سریهای زمانی:
- پیشبینی سهام
- تشخیص ناهنجاریها در دادههای سنسور
- بینایی ماشین:
- تشخیص حرکات در ویدیو
- توصیف تصاویر (Image Captioning)
🧭 جمعبندی
واحدهای بازگشتی دروازهای (GRUs) با ساختار سادهتر نسبت به LSTM، توانایی بالایی در مدلسازی دادههای ترتیبی دارند. آنها با دو دروازهی کلیدی خود — بازنشانی و بهروزرسانی — توازن مؤثری بین یادگیری و فراموشی ایجاد میکنند.
به همین دلیل GRU امروزه یکی از پرکاربردترین اجزای شبکههای عمیق بازگشتی در حوزههای گفتار، متن، سری زمانی و سیگنال است.






