یکی از اصلیترین بخشها در زیرشاخه یادگیری ماشین از علم هوش مصنوعی آموزش مدلهاست. برای اینکه بتوان به سیستمهای هوش مصنوعی و ماشینهای مبتنی بر هوش مصنوعی قدرت یادگیری داد از تکنیکی به نام یادگیری ماشین استفاده میشود. در روش یادگیری ماشین از دادهها مربوط به یک حوزه خاص برای آموزش مدل استفاده میشود و پس از آموزش از مدل خواسته میشود تا دادههای جدید را که هیچ مواجههای با آنها نداشته تشخیص دهد. آموزش مدلهای هوش مصنوعی پروسه پیچیدهای است و به فاکتورهای زیاد بستگی دارد. یکی از این فاکتورها که در آموزش مدلهای هوش مصنوعی بسیار مورد توجه است، بحث Underfitting یا کم برازش میباشد. در آموزش مدلهای هوش مصنوعی مسائل مهمی اعم از مشخص کردن پارامترها، نرمالیزه کردن داده و بسیاری دیگر از مسائل مورد توجه است. Underfitting هم یکی از مواردی است که در آموزش مدلهای هوش مصنوعی باید به توجه داشت. در تعریف کوتاه این مفهوم باید گفت که underfitting در آموزش مدلها زمانی رخ میدهد که مدل به علت سادگی بیش از حد، قادر به تشخیص کورولیشن و یا همبستگی بین داده نیست و یا نمیتواند آن را به درستی تشخیص دهد. در این مقاله قصد داریم بیشتر با این مفهوم در یادگیری ماشین و آموزش مدلهای هوش مصنوعی آشنا شویم و بررسی کنیم که Underfitting چه زمانی اتفاق میافتد و چگونه میتوان از بروز آن جلوگیری کرد. در ادامه با آرتیجنسهمراه باشید.
Underfitting چیست و چه زمانی اتفاق میافتد؟
یکی از چالشهای و مشکلات بر سر راه آموزش مدلهای هوش مصنوعی در یادگیری ماشین بروز Underfitting یا به عبارتی دیگر کم برازش است. شاید بهتر باشد برای درک بهتر این مفهوم در یادگیری ماشین ابتدا مفهوم مقابل آن را بررسی کنیم. Underfitting در مقابل مفهومی به نام Overfitting قرار دارد که در آن مدل با جزئیات بیشتر به تجزیه و تحلیل و آموزش از دادهها میپردازد. به عبارت دیگر حساسیت مدل روی دادههای آموزشی بیش از حد معمول است. در این حالت مدل قادر به یادگیری درست نخواهد بود و خروجی مورد نظر را تولید نخواهد کرد و در مواجهه با دادههای واقعی کارایی لازم را نخواهد داشت. Underfitting دقیقاً مقابل این مفهوم قرار دارد و زمانی اتفاق میافتد که مدل نسبت به دادههای ورودی یا آموزشی و تجزیه و تحلیل و یافتن همبستگی و یا به عبارتی کورولیشن در بین آنها دقت کافی را ندارد و با دادهها به شدت ساده برخورد میکند. در تعریفی دیگر Underfitting زمانی رخ میدهد که مدل به شدت ساده باشد و از تشخیص الگوهای غالب موجود در دادههای ورودی عاجز باشد که این موضوع منجر به خطا و عملکرد ضعیف مدل خواهد شد. Underfitting زمانی رخ میدهد که مدل به شدت ساده باشد و نیاز به زمان آموزش بیشتری داشته باشد، از طرفی کمبود ویژگیهای دادههای ورودی و عدم تنظیم مناسب Regularization میتواند منجر به Underfitting در آموزش مدلهای یادگیری ماشینی شود.
روش های جلوگیری از Underfitting:
حالا که با مفهوم Underfitting در یادگیری ماشینی آشنا شدیم و دیدیم که مفهومی است دقیقاً در مقابل Overfittingیا بیش برازش یا بیش برازش، بهتر است در این بخش از مقاله به معرفی روشهای جلوگیری از این موضوع در آموزش مدلهای مبتنی بر یادگیری ماشینی بپردازیم. در زیر برخی از روشهای جلوگیری از Underfitting یا کم برازش آورده شده و در مورد هر کدام توضیحاتی ارائه داده شده است:
ویژگیهای بیشتر:
همانطور که قبلاً اشاره شد، یکی از علل اتفاق افتادن Underfitting عدم استفاده از ویژگیهای کافی است. پس میتوان با استفاده از تکنیکهای استخراج ویژگی و افزودن ویژگیهای بیشتر به مدل که به طور منطقی با مسئله مرتبط است. Underfitting را کنترل کرد.
استفاده از تکنیکهای منظمسازی مناسب:
عدم تنظیم درست مقادیر regularization و یا همان مقادیر منظم سازی یکی دیگر از دلایلی است که باعث به وجود آمدن Underfitting میشود، مانند کاهش مقدار پارامتر lambda در رگرسیون خطی و یا استفاده از تکنیکهایی مانند Dropout در شبکههای عصبی
افزایش دادههای آموزشی:
کمبود دادههای آموزشی را میتوان یکی دیگر از دلایل Underfittingدر آموزش مدلهای یادگیری ماشینی در نظر گرفت. گاهی جمعآوری دادههای بیشتر برای آموزش مدل، میتواند باعث بهبود دقت مدل و جلوگیری از Underfitting شود.
آموزش طولانیتر:
مدت زمان آموزش مدل یکی دیگر از فاکتورهای مهم در جلوگیری از Underfitting است. افزایش تعداد ادوار یا همان epochsها و یا همان تعداد دفعاتی که مدل روی دادهها آموزش میبیند، میتواند روش دیگری برای جلوگیری از Underfitting باشد. افزایش تعداد دفعات آموزش مدل بر روی دادهها باعث میشود که مدل الگوها و همبستگی بین دادهها را بیشتر و بهتر درک کند.
نتیجه گیری:
همانطور که کیفیت آموزش یک انسان به فاکتورهای بسیاری بستگی دارد، در یادگیری و آموزش مدلهای هوش مصنوعی هم متغیرها و فاکتورهای زیادی وجود دارد که میتواند بر روی روند آموزش مدل تأثیر بگذارد. یکی از مهمترین این موارد Overfitting و دیگری Underfitting میباشد که در این مقاله به بررسی مفهوم Underfitting یا کم برازش پرداختیم و دیدیم که در صورت اتفاق افتادن Underfitting در پروسه آموزش مدل، چگونه میتواند روی نتیجه نهایی تأثیر منفی داشته باشد و مدل را در تشخیص درست ورودیهای جدید با مشکل مواجه کند. در این مقاله دیدیم زمانی که مدل نسبت به دادههای آموزشی بسیار ساده برخورد کند و حساسیت لازم برای تشخیص همبستگی بین آنها را نداشته باشد Underfitting رخ میدهد. در ادامه با روشهای جلوگیری از Underfitting و برطرف کردن آن هم آشنا شدیم. در حالت کلی باید گفت که آموزش مدلهای هوش مصنوعی روند حساسی است که دقت خروجی مدل به صورت مستقیم به آن بستگی دارد، لذا از اهمیت بالایی برخوردار است و لازم است تا برای رسیدن به خروجی مورد نظر توجه ویژهای به آن شود.
پاسخ :