شبکه‌های عصبی کانولوشنال یا Convolutional Neural Networks(CNN)

...

همان طور که در مقاله قبلی با عنوان آشنایی با الگوریتم شبکه‌های عصبی مصنوعی اشاره کردیم، شبکه‌های عصبی یکی از الگوریتم‌های هوش مصنوعی برای حل مسائل پیچیده هوش مصنوعی هستند که برای حل مسائل از مجموعه لایه‌های مرتبط با یکدیگر استفاده می‌کند به این شکل که داده‌های ورودی در وزن‌های مشخصی ضرب می‌شوند و با عبور از هر لایه ارزش ورودی‌ها مشخص می‌شود. این الگوریتم یکی از پرکاربردترین الگوریتم‌های مورداستفاده در هوش مصنوعی، یادگیری ماشین و دیگر حوزه‌های هوش مصنوعی است. یکی از انواع شبکه‌های عصبی، شبکه عصبی کانولوشنال می‌باشد. شبکه‌های عصبی کانولوشنال Convolutional Neural Convolutional Neural Networks(CNN) نوعی از شبکه‌های عصبی عمیق (Deep Neural Networks) هستند که به بیشتر برای پردازش تصاویر و داده‌های دوبعدی مورد استفاده قرار می‌گیرند. روش کار شبکه‌های عصبی کانولوشنال بسیار شبیه به شبکه‌های عصبی است با این تفاوت که در شبکه‌های عصبی کانولوشنال از لایه‌هایی به نام لایه‌های کانولوشنی (Convolutional Layers) و لایه‌های ادغام (Pooling Layers) استفاده می‌شود که در تشخیص ویژگی‌های تصاویر بسیار مؤثر و کارآمد است. در این مقاله قصد داریم بیشتر با این مفهوم در هوش مصنوعی و شبکه‌های عصبی مصنوعی آشنا شویم و ویژگی‌ها و کاربردهای این نوع شبکه‌های عصبی را توضیح  دهیم. در ادامه با آرتیجنسهمراه باشید.

شبکه‌های عصبی کانولوشنال یا Convolutional Neural Networks(CNN) چیست و چگونه کار می‌کند؟

الگوریتم‌های شبکه عصبی CNN به عنوان مجموعه فرایندی در یادگیری عمیق مورد استفاده قرار می‌گیرد که می‌تواند در تشخیص ویژگی‌های تصاویر و طراحی‌های دو بعدی و به طور کلی در حل مسائل پیچیده هوش مصنوعی بسیار مفید باشد. شبکه‌های CNN معمولاً از ویژگی‌هایی مثل لایه‌های کانولوشنی و لایه‌های ادغام برای حل مسائل و تشخیص و استخراج ویژگی‌های تصاویر و  ورودی‌ها استفاده می‌کنند. روش کار شبکه‌های CNN در زیر آورده شده است:

لایه کانولوشنی (Convolutional Layer):

در این لایه، یک سری از فیلترها یا ماسک‌ها روی تصویر ورودی قرار می‌گیرد و در هر مرحله این فیلتر یا ماسک روی تصویر اسلاید می‌شود یا به اصطلاح می‌لغزد و عملیات کانولوشنال که شامل تشخیص خصوصیات تصویر است انجام می‌شود. این خصوصیات می‌توانند شامل لبه‌ها، خطوط، مقادیر رنگی، ویژگی‌های هندسی و... باشند.

لایه ادغام (Pooling Layer):

هر مرحله از لایه کانولوشن شامل یک مرحله کاهش ابعاد یا به اصطلاح پولینگ است در این لایه برای استخراج بهتر ویژگی‌های تصویر، اندازه تصویر کاهش می‌یابد و اطلاعات مهم تصویر حفظ و اطلاعات و داده‌های غیر ضروری حذف می‌شوند. معمولاً عملیات ادغام به دو حالت ادغام حداکثر (Max Pooling) یا ادغام میانگین (Average Pooling) انجام می‌شود.

لایه‌های عصبی عمیق (Deep Neural Layers):

پس از طی چند مرحله از فرایند لایه کانولوشنی و ادغامی، CNN از لایه‌های عصبی عمیق برای تصمیم‌گیری نهایی استفاده می‌کند تا خروجی مورد نظر را تولید کند. از این لایه‌ها معمولاً  برای حل مسائل مختلفی مثل دسته‌بندی یا رگرسیون که دارای پیچیدگی‌های بالایی است استفاده می‌شود.

توابع فعال‌سازی (Activation Functions):

در هر لایه از فرایندهای کانولوشنی و ادغامی از یک تابع فعال ساز هم برای افزایش کارایی، قابلیت یادگیری و تشخیص نقاط غیر خطی در داده‌ها استفاده می‌شود. ReLU (Rectified Linear Unit) یکی از معروف‌ترین این توابع فعال‌ساز است.

آموزش و بهینه‌سازی (Training and Optimization):

بعد از طی تمام این مراحل شبکه عصبی CNN با استفاده از مجموعه‌ای از داده‌های آموزشی نرمال شده و الگوریتم‌های بهینه‌سازی مثل Stochastic Gradient Descent یا روش‌های بهینه‌ سازی دیگر، وزن‌ها و پارامترها را برای تطبیق بهتر با داده‌ها تنظیم و مدل را آموزش می‌دهد.

convolutional-neural-networks

تاریخچه شبکه‌های عصبی کانولوشنال:

تاریخچه استفاده از این شبکه‌های عصبی به اوایل دهه ۱۹۶۰ با ایده‌های اولیه در زمینه شبکه‌های عصبی برمی‌گردد. اما توسعه و درخشش در این زمینه در دهه‌های بعدی اتفاق می‌افتد. در دهه ۱۹۸۰، تحقیقات در زمینه شبکه‌های عصبی به دلیل مشکلات محاسباتی و کمبود داده متوقف شد پس از آن در دهه ۱۹۹۰، تکنیک‌های بهبود یادگیری در شبکه‌های عصبی معرفی شدند اما این تکنیک‌ها هم با مشکلاتی مواجه بود. در دهه ۲۰۰۰، با معرفی معماری "AlexNet" توسط الکس کریزوسکی در مسابقه ILSVRC در سال ۲۰۱۲، CNN به عنوان یکی از بهترین مدل‌های تشخیص تصاویر به دنیا معرفی شد. و از همان تاریخ CNN به عنوان مدلی برتر در پردازش تصاویر و ویدئوها شناخته شد و به پیشرفت‌های بزرگی در زمینه بینایی ماشین، پردازش تصویر، شناسایی الگوها، تصویربرداری، تشخیص اشیا و غیره دست پیدا کرد.

کاربردهای شبکه‌های عصبی کانولوشنال:

شبکه‌های CNN به عنوان یک ابزار بسیار قوی در بینایی ماشینی و تشخیص الگوها و خصوصیات موجود در تصاویر شناخته می‌شوند. در زیر به مواردی که می‌توان از شبکه‌های CNN در آنها استفاده کرد اشاره خواهیم کرد و کاربرد شبکه‌های عصبی CNN را در زمینه‌های مختلف بررسی خواهیم کرد:
بینایی ماشینی در رباتیک: شبکه‌های عصبی کانولوشنال در زمینه قدرت بینایی بخشی به ربات‌ها هم به صورت گسترده مورد استفاده قرار می‌گیرند. ربات‌ها می‌توانند به کمک این الگوریتم شبکه‌های عصبی محیط اطراف خود را ببینند و اشیا و افراد اطراف خود را تشخیص دهند و مسیرها را برنامه ریزی کنند. 
تشخیص الگوها و اشیا: یکی از کاربردهای اصلی شبکه‌های CNN تشخیص الگوها و اشیا در تصاویر است. این شبکه‌ها می‌توانند اشیای مختلف  از قبیل خودروها و چهره‌ها را تشخیص دهند.
ترجمه ماشینی تصویری:یکی دیگر از کاربردهای شبکه‌های  CNN ترجمه ماشینی تصاویر است به این معنی که شما می‌توانید از روی تصویر متون را تشخیص و ترجمه و یا تبدیل به متن کنید.
پزشکی تصویری: در پزشکی هم به صورت گسترده از شبکه‌های عصبی CNN برای طراحی سیستم‌های هوشمند برای تصویر برداری و تشخیص بیماری مثل پرتونگاری، تصاویر سی تی اسکن و غیره استفاده می‌شود.
خودروهای خودران: در خودروهای هوش مصنوعی و خودران هم از شبکه‌های عصبی کانولوشنال برای تشخیص علائم ترافیکی، تعیین مسیر و سیستم رانندگی خودران استفاده می‌شود.

convolutional-neural-networks

نتیجه گیری:
شبکه‌های عصبی کانولوشنال یکی از مهم‌ترین و پرکاربردترین بخش‌های مطالعاتی و تحقیقاتی در زمینه یادگیری عمیق و پردازش تصویر و سیگنال می‌باشد و می‌توان از این الگوریتم در پیاده سازی مدل‌هایی برای تشخیص اشیا، تشخیص چهره و غیره استفاده کرد به خاطر همین کارایی بالا این نوع شبکه‌ها در حل مسائل دنیای واقعی بیش از بیش در بین متخصصین این حوزه محبوب شده است. استقبال از این نوع شبکه‌های عصبی در میان متخصصین و محققان به دلیل پیچیدگی کمتر نسبت به دیگر شبکه‌های عصبی عمیق بیشتر است. شبکه‌های کانولوشنی به بسیار انعطاف پذیر هستند و می‌توان از آنها برای حل مسائل پیچیده‌تری در کنار دیگر شبکه‌های عصبی مثل شبکه عصبی بازگشتی یا شبکه عصبی عمیق استفاده کرد. در کل، شبکه‌های عصبی کانولوشنال ابزاری قدرتمند برای طراحی و توسعه مدل‌های یادگیری ماشینی و یادگیری عمیق است. امروزه بسیاری از پیشرفت‌های که در حوزه یادگیری عمیق اتفاق افتاده به لطف استفاده از این شبکه‌های عصبی است و مسلماً بدون استفاده از آنها تا به این حد نمی‌توانستیم در حوزه مدل‌های یادگیری عمیق پیشرفت کنیم.

نظرات 0

wave

ارسال نظر

wave
برای ثبت نظر ابتدا وارد حساب کاربری خود شوید. ورود | ثبت نام

در آرتیجنس دنبال چی میگردی؟