مثال‌های یادگیری ماشینی تحت نظارت (و نحوه عملکرد آن)

فاطمه کارور
فروردین ۱۵, ۱۴۰۳
یک کامنت

مهارت های جانبی, مهارت های سخت, همه مقالات

یادگیری ماشینی زیرمجموعه ای از AI (هوش مصنوعی) است که از الگوریتم های برنامه ریزی شده برای پیش بینی استفاده می کند. به طور عمده دو نوع الگوریتم یادگیری ماشین وجود دارد، یعنی یادگیری تحت نظارت و بدون نظارت. اگر قصد دارید برای موقعیت های یادگیری ماشین مصاحبه کنید، ممکن است از دانستن بیشتر در مورد این مفاهیم بهره مند شوید. در این مقاله، چند نمونه یادگیری ماشینی تحت نظارت را بررسی می‌کنیم و در مورد اینکه الگوریتم یادگیری ماشین چیست، چگونه کار می‌کند، مزایا و معایب آن و تفاوت آن با یادگیری بدون نظارت بحث می‌کنیم.

مطالب مرتبط: تفاوت بین یادگیری تحت نظارت و بدون نظارت

نمونه های یادگیری ماشین نظارت شده

در اینجا برخی از نمونه‌های مدل‌های یادگیری ماشینی تحت نظارت مورد استفاده در برنامه‌های تجاری مختلف آورده شده است:

۱.تشخیص تصویر و اشیا

یادگیری ماشینی نظارت شده برای مکان یابی، طبقه بندی و جداسازی اشیاء از تصاویر یا ویدیوها استفاده می شود، که زمانی مفید است که برای تجزیه و تحلیل تصاویر و تکنیک های بینایی مختلف استفاده شود. هدف اصلی تشخیص تصویر یا شی، شناسایی دقیق تصویر است.مثال: ما از ML برای تشخیص دقیق تصویر استفاده می کنیم که گویی تصویر هواپیما یا یک ماشین است یا اگر تصویر یک گربه یا سگ است.

۲.تجزیه و تحلیل پیش بینی کننده

مدل‌های یادگیری ماشینی نظارت‌شده به‌طور گسترده در ساختن سیستم‌های تحلیلی پیش‌بینی‌کننده استفاده می‌شوند، که بینش عمیقی را در مورد نقاط مختلف داده‌های تجاری ارائه می‌دهد. این به سازمان ها امکان می دهد تا با استفاده از خروجی سیستم، نتایج خاصی را پیش بینی کنند. همچنین به رهبران کسب و کار کمک می کند تا برای بهبود شرکت تصمیم گیری کنند.مثال ۱: ممکن است از یادگیری نظارت شده برای پیش بینی قیمت خانه استفاده کنیم . داده هایی با جزئیات در مورد اندازه خانه، قیمت، تعداد اتاق های خانه، باغ و سایر ویژگی ها مورد نیاز است. ما برای هزاران خانه به داده هایی در مورد پارامترهای مختلف خانه نیاز داریم و سپس برای آموزش داده ها استفاده می شود. اکنون می توان از این مدل یادگیری ماشینی تحت نظارت آموزش دیده برای پیش بینی قیمت یک خانه استفاده کرد.مثال ۲: تشخیص هرزنامه حوزه دیگری است که اکثر سازمان ها از الگوریتم های یادگیری ماشینی نظارت شده استفاده می کنند. دانشمندان داده پارامترهای مختلفی را برای تمایز بین نامه های رسمی یا نامه های هرزنامه طبقه بندی می کنند. آنها از این الگوریتم ها برای آموزش پایگاه داده استفاده می کنند به طوری که پایگاه داده آموزش دیده الگوهای موجود در داده های جدید را تشخیص داده و آنها را به طور موثر به ارتباطات هرزنامه و غیر هرزنامه طبقه بندی می کند.

۳.تحلیل احساسات

سازمان ها می توانند از الگوریتم های یادگیری ماشینی نظارت شده برای پیش بینی احساسات مشتری استفاده کنند. آنها از الگوریتم ها برای استخراج و طبقه بندی اطلاعات مهم از مجموعه داده های بزرگ مانند احساسات، هدف و زمینه با دخالت اندک انسانی استفاده می کنند. این مدل از یادگیری نظارت شده همچنین برای پیش بینی احساسات متن استفاده می شود. این اطلاعات برای به دست آوردن بینش در مورد نیازهای مشتری و کمک به بهبود تلاش های تعامل برند و مشتری بسیار مفید است.مثال: برخی از سازمان‌ها، به‌ویژه فروشگاه‌های تجارت الکترونیک، اغلب سعی می‌کنند احساسات مشتریان خود را از طریق بررسی‌های محصول ارسال شده در برنامه‌ها یا وب‌سایت‌هایشان شناسایی کنند.

یادگیری ماشین نظارت شده چیست؟

یادگیری نظارت شده نوعی از یادگیری ماشینی است که در آن از داده های آموزشی با برچسب مناسب برای آموزش ماشین ها استفاده می شود. ماشین ها از این داده ها برای پیش بینی و ارائه خروجی استفاده می کنند. داده های “برچسب” نشان می دهد که برخی از داده ها با خروجی مناسب برچسب گذاری شده اند. داده‌های آموزشی که به عنوان ورودی به ماشین‌ها ارسال می‌شوند، به‌عنوان یک سرپرست کار می‌کنند و به ماشین آموزش می‌دهند که خروجی صحیح را ارائه دهد. این مفهوم مانند یادگیری دانش آموزان زیر نظر معلم است . به همین دلیل است که به آن یادگیری ماشین نظارت شده می گویند.هدف الگوریتم‌های یادگیری ماشینی تحت نظارت، یافتن تابعی برای نگاشت داده‌های ورودی به داده‌های خروجی است. ساخت موفقیت آمیز، مقیاس بندی و استقرار مدل های یادگیری نظارت شده صحیح نیازمند زمان و مهارت فنی از یک تیم بسیار ماهر از دانشمندان داده است. همچنین، دانشمندان داده ممکن است نیاز به بازسازی مدل‌ها داشته باشند تا اطمینان حاصل کنند که ورودی داده شده تا زمانی که تغییری در داده‌های آن ایجاد نشود، درست باقی می‌ماند.

مرتبط: ۱۰ مهارت تجزیه و تحلیل داده های ارزشمند

یادگیری ماشینی تحت نظارت چگونه کار می کند؟

در یادگیری نظارت شده، دقت الگوریتم از طریق تابع ضرر اندازه گیری می شود، مگر اینکه خطا به اندازه کافی به حداقل برسد. یادگیری ماشین نظارت شده در حین داده کاوی به دو مشکل تقسیم می شود. آن ها هستند:

۱.طبقه بندی

طبقه‌بندی از الگوریتم‌های مختلفی برای تعیین دقیق داده‌های آزمون در دسته‌های خاص استفاده می‌کند. موجودیت های متمایز را در یک مجموعه داده خاص تشخیص می دهد و سعی می کند برای برچسب گذاری یا تعریف آن موجودیت ها نتیجه گیری کند. برخی از الگوریتم‌های طبقه‌بندی رایج عبارتند از SVM (ماشین‌های بردار پشتیبانی)، طبقه‌بندی‌کننده خطی، k-نزدیک‌ترین همسایه، جنگل تصادفی و درخت‌های تصمیم. به عنوان مثال، می‌توانیم از طبقه‌بندی برای پیش‌بینی اینکه آیا کسی نکول کننده وام است یا خیر، استفاده کنیم.

۲.پسرفت

از رگرسیون برای تفسیر رابطه بین متغیرهای مستقل و وابسته استفاده می شود. برای ترسیم پیش بینی ها، مانند پیش بینی درآمد فروش در یک بازه زمانی تخمینی استفاده می شود. برخی از الگوریتم‌های رگرسیون رایج عبارتند از: رگرسیون منطقی، رگرسیون چند جمله‌ای و رگرسیون خطی. خروجی دریافت شده با استفاده از رگرسیون دارای تفسیر احتمالی است. برای مثال می توانیم از رگرسیون برای پیش بینی قیمت یک خانه استفاده کنیم.

تفاوت بین یادگیری ماشینی تحت نظارت و بدون نظارت

در زیر چند تفاوت بین یادگیری ماشینی تحت نظارت و بدون نظارت آورده شده است:

یادگیری ماشینی بدون نظارت از مجموعه داده‌های بدون برچسب استفاده می‌کند، در حالی که یادگیری ماشینی نظارت‌شده از مجموعه داده‌های دارای برچسب خوب استفاده می‌کند.
در یادگیری نظارت شده، الگوریتم های ML از مجموعه داده ها با پیش بینی های متعدد و ایجاد تنظیمات برای خروجی صحیح یاد می گیرند. الگوریتم‌های یادگیری بدون نظارت خودشان یاد می‌گیرند و هر الگوی داده‌های بدون برچسب را خودشان کشف می‌کنند.
یادگیری نظارت شده به مداخله انسانی برای یادگیری داده ها نیاز دارد، در حالی که یادگیری بدون نظارت به حداقل مداخله انسانی نیاز دارد. تنها زمانی که آنها ملزم به استفاده از انسان هستند زمانی است که بررسی می کنند که آیا خروجی منطقی است یا خیر.
الگوریتم های یادگیری نظارت شده برای پیش بینی آب و هوا، تشخیص احساسات انسان و پیش بینی قیمت مفید هستند. الگوریتم های یادگیری بدون نظارت برای موتورهای توصیه، شخصیت های مشتری، تصویربرداری پزشکی یا تشخیص ناهنجاری مفید هستند.
یادگیری نظارت شده نسبتاً ساده است، زیرا از زبان برنامه نویسی پایتون یا R استفاده می کند، اما یادگیری بدون نظارت از ابزارهای قدرتمند برای تجزیه و تحلیل حجم زیادی از داده ها استفاده می کند. همچنین، یادگیری بدون نظارت به دلیل حجم وسیعی از داده ها که برای پیش بینی نتیجه مورد نظر استفاده می کند، از نظر محاسباتی پیچیده است.
یادگیری ماشینی تحت نظارت روش دقیق تری است، در حالی که یادگیری بدون نظارت روشی نسبتاً کمتر دقیق است.
یادگیری ماشینی تحت نظارت، پیش بینی مجموعه داده های جدید را انجام می دهد. کاربر از قبل از خروجی مورد انتظار آگاه است، اما در یادگیری ماشینی بدون نظارت، بینش بر اساس حجم عظیمی از داده های جدید ارائه می شود.

مزایای یادگیری ماشین نظارت شده

در اینجا چند مزیت یادگیری ماشین نظارت شده وجود دارد:

در یادگیری نظارت شده، می توانید داده ها را جمع آوری کنید یا با استفاده از تجربه قبلی خود خروجی تولید کنید.
این مدل به شما اجازه می دهد تا با استفاده از تجربه، معیارهای عملکرد را بهینه کنید.
شما از تعداد کلاس های یک مجموعه داده آموزشی کاملا آگاه هستید.
به شما این امکان را می دهد که فرآیند نحوه یادگیری پیش بینی خروجی را توسط ماشین درک کنید.
این به حل مسائل مختلف محاسباتی در دنیای واقعی کمک می کند.
پس از اتمام آموزش، ذخیره مجموعه داده آموزشی در حافظه الزامی نیست. در عوض، شما می توانید مرز تصمیم را به عنوان یک فرمول ریاضی حفظ کنید.

مطالب مرتبط: اهداف هوش مصنوعی چیست؟ (و روش ها)

معایب یادگیری ماشینی نظارت شده

در اینجا برخی از معایب یادگیری ماشین نظارت شده وجود دارد:

برای آموزش طبقه‌بندی‌کننده، ممکن است از شما خواسته شود که نمونه‌های زیادی از هر کلاس انتخاب کنید، در غیر این صورت، دقت خروجی تحت تأثیر قرار می‌گیرد.
طبقه بندی حجم زیادی از داده ها یک چالش است.
آموزش داده‌ها در یادگیری ماشینی نظارت‌شده زمان محاسباتی بالایی دارد که گاهی اوقات کارایی ماشین را نیز آزمایش می‌کند.
یادگیری تحت نظارت نمی تواند مانند یادگیری بدون نظارت، داده ها را به خودی خود طبقه بندی یا خوشه بندی کند.
همیشه امکان نظارت برای داده های بزرگ وجود ندارد، بنابراین ممکن است ماشین نیاز به یادگیری خود از طریق داده های آموزشی داشته باشد.
توانایی یادگیری تحت نظارت به این معنا محدود است که قادر به انجام برخی وظایف پیچیده در ML نیست.
مدل‌های یادگیری ماشینی تحت نظارت برای آموزش داده‌ها به زمان زیادی نیاز دارند و برای ایجاد داده‌های برچسب‌گذاری شده به تخصص نیاز دارند.

چالش های پیش روی یادگیری ماشین نظارت شده

چند چالش متداول وجود دارد که ممکن است هنگام کار با یادگیری ماشینی تحت نظارت با آنها روبرو شوید:

پیش پردازش داده ها و آماده سازی داده ها برای ورودی یک چالش است.
اگر مقادیر ناقص و مقادیر بعید و غیرممکن به عنوان ورودی ارسال شوند، ممکن است دقت مدل یادگیری تحت نظارت کاهش یابد.
اگر ورودی به مدل بی ربط باشد، ممکن است خروجی نادرستی بدهد.
برای برچسب گذاری داده ها، یک متخصص مهم است، اما در غیاب یکی، نتایج ممکن است نادرست باشد.
از آنجایی که مداخله انسانی در یادگیری نظارت شده وجود دارد، احتمال خطای انسانی در مجموعه داده‌ها وجود دارد که ممکن است منجر به یادگیری نادرست الگوریتم‌ها شود.