🚀 معرفی مدل YOLO
YOLO (You Only Look Once) یکی از محبوبترین و سریعترین مدلهای تشخیص اشیاء (Object Detection) است که در سال ۲۰۱۶ توسط Joseph Redmon معرفی شد.
برخلاف مدلهایی مانند R-CNN که ابتدا نواحی پیشنهادی را جدا میکنند، YOLO در یک مرحله واحد و سراسری کل تصویر را پردازش میکند.
YOLO تصویر را به شبکهای از سلولها تقسیم میکند و هر سلول مسئول پیشبینی:
- وجود یا عدم وجود شیء
- نوع کلاس شیء
- مختصات جعبه محدودکننده (Bounding Box)
این طراحی باعث میشود YOLO بسیار سریعتر از روشهای قبلی عمل کند و در زمان واقعی (Real-Time) نیز کاربرد داشته باشد.
⚙️ معماری و ساختار YOLO
مدل YOLO از چندین بخش اصلی تشکیل شده است:
🔹 ۱. Backbone (ویژگیاستخری)
- شبکهی عصبی کانولوشنی (CNN) برای استخراج ویژگیها از تصویر ورودی
- در نسخههای مختلف از Darknet-19، Darknet-53، CSPDarknet یا EfficientNet استفاده شده است
🔹 ۲. Grid Division
- تصویر به شبکهای (مثلاً 13×13) تقسیم میشود
- هر سلول مسئول پیشبینی جعبههای محدودکننده (Bounding Boxes) برای اشیاء داخل محدوده خود است
🔹 ۳. Bounding Box Prediction
- هر سلول چند Anchor Box دارد
- خروجی هر Anchor شامل مختصات (x, y, w, h)، احتمال وجود شیء و توزیع احتمال برای کلاسهاست
🔹 ۴. Loss Function
- ترکیبی از سه نوع خطا:
- خطای مکانی برای مختصات جعبه
- خطای اطمینان از وجود شیء
- خطای کلاسبندی
- این تابع به بهینهسازی همزمان مکان و نوع اشیاء کمک میکند
💡 کاربردهای YOLO
به دلیل سرعت بالا و عملکرد بلادرنگ (Real-Time)، YOLO در حوزههای گستردهای به کار میرود:
🔹 ۱. خودروهای خودران
- شناسایی عابران، وسایل نقلیه، علائم راهنمایی و موانع
- تصمیمگیری سریع برای توقف یا تغییر مسیر
- جلوگیری از تصادف در محیطهای شهری
🔹 ۲. امنیت و نظارت تصویری
- شناسایی افراد و اشیاء مشکوک در زمان واقعی
- کنترل ورودیها و نظارت بر محیطهای عمومی
- شمارش افراد یا وسایل نقلیه
🔹 ۳. پزشکی
- تشخیص نواحی غیرطبیعی در تصاویر MRI، CT، یا X-ray
- شناسایی سلولهای سرطانی یا آسیبهای بافتی در تصاویر میکروسکوپی
🔹 ۴. کشاورزی و صنعت
- شناسایی محصولات، آفات یا بخشهای آسیبدیده گیاهان
- بررسی کیفیت تولید و بستهبندی
- کاربرد در رباتهای صنعتی برای شناسایی قطعات
🏆 مزایا، نسخهها و نتیجهگیری
✅ مزایای YOLO:
- سرعت بسیار بالا (قابل استفاده در Real-Time)
- پردازش تصویر در یک مرحله
- دقت بالا در اشیاء بزرگ و واضح
- قابل استفاده در سیستمهای嵌سازیشده (Embedded) مانند Jetson و Raspberry Pi)
🔄 نسخههای مختلف YOLO:
- YOLOv1 (2016): اولین نسخه با معماری ساده
- YOLOv2 / YOLO9000 (2017): بهبود دقت و شناسایی ۹۰۰۰ کلاس
- YOLOv3 (2018): معماری چندمقیاسی (Multi-Scale) با Darknet-53
- YOLOv4 (2020): افزایش دقت با تکنیکهای مدرن (Mosaic, DropBlock, CSPNet)
- YOLOv5 (2020): نسخهی PyTorch با سرعت و انعطاف بالا
- YOLOv7 (2022): نسخه بهینهشده برای عملکرد بالا
- YOLOv8 (2023): نسخهی Ultralytics با پشتیبانی از تشخیص، بخشبندی و ردیابی
🧩 نتیجهگیری:
مدل YOLO با رویکرد «یک نگاه کافی است»، تحول عظیمی در تشخیص بلادرنگ اشیاء ایجاد کرد.
با ترکیب سرعت، دقت و سادگی، امروزه در بینایی ماشین، پزشکی، امنیت، خودروهای خودران و رباتیک یکی از پرکاربردترین مدلهای تشخیص شیء است.
YOLO نشان داد که هوش مصنوعی میتواند در لحظه ببیند و تصمیم بگیرد.






