شبکه عصبی بازگشتی (Recurrent Neural Network یا RNN) یکی از انواع مهم شبکههای عصبی مصنوعی است که بهطور خاص برای پردازش دادههای ترتیبی طراحی شدهاند، مانند دادههای زمانی (time series)، متن، صوت، و ویدیو.
تعریف
شبکههای RNN طوری طراحی شدهاند که اطلاعات را در طول توالی دادهها حفظ کنند. برخلاف شبکههای عصبی معمولی (مانند شبکههای پرسپترون چندلایه یا MLP)، که ورودیها را بهصورت مستقل پردازش میکنند، RNN دارای حافظه داخلی هستند که به آنها امکان میدهد تا وابستگیهای زمانی بین دادهها را یاد بگیرند.
نحوه عملکرد
در RNN، خروجی در هر مرحله نهتنها به ورودی فعلی بلکه به وضعیت پنهان (hidden state) مرحله قبلی هم وابسته است
کاربردها
ترجمه ماشینی مدلسازی زبان (Language Modeling) تشخیص گفتار تولید موسیقی یا متن پیشبینی سریهای زمانی (مثل قیمت سهام)
شبکه LSTM یا Long Short-Term Memory
یک نوع خاص از شبکه عصبی بازگشتی (RNN) است که برای یادگیری وابستگیهای طولانیمدت در دادههای ترتیبی طراحی شده است. برخلاف RNN معمولی که در مواجهه با توالیهای طولانی دچار مشکل نابود شدن گرادیان (Vanishing Gradient) میشود، LSTM با استفاده از مکانیزم دروازهای (Gate Mechanism) این مشکل را تا حد زیادی حل کرده است.
مزایای LSTM
توانایی به خاطر سپردن اطلاعات در طولانیمدت کارایی بالا در مدلسازی زبان و ترجمه مناسب برای سریهای زمانی، گفتار و متن کاربردها مدلسازی زبان طبیعی (NLP) تشخیص احساسات (Sentiment Analysis) پیشبینی سری زمانی (مثل دما، قیمت ارز و سهام) تشخیص گفتار و صدای انسان