- شنبه ۸ مهر ۱۴۰۲
تاریخچه و حوزههای کاربرد بینایی ماشین
راهنمای کامل بینایی ماشین
بخش نخست: تاریخچه و حوزههای کاربرد بینایی ماشین
بینایی ماشین یک زیرشاخه مهم از هوش مصنوعی است که به دریافت، پردازش، تحلیل و معنا بخشیدن به دادههای تصویری مانند تصاویر و عکسهای دیجیتال میپردازد و ما روزانه از آن استفاده میکنیم.
چکیده
بینایی ماشین (Computer vision) یکی از حورههای مهم علوم رایانهای و مهندسی رایانه است که سیستمها را قادر میکند اطلاعات معنادار از دادههای تصویری استخراج کنند. این شاخه به ما کمک میکند براساس اطلاعات استخراجشده اقدامات مناسب انجام دهیم و توصیههای مفید بکنیم.
بینایی ماشین از حوزههای نوظهور و مهم در شاخه فناوری اطلاعات است. هوش مصنوعی، یادگیری ماشین و بینایی ماشین از حوزههایی هستند که علاوه بر جذابیت و کاربرد وسیع آنها، امروزه بازار کار بسیار خوبی دارند و اکثر سازمانها و شرکتهای دولتی و خصوصی هزینه کلانی برای آنها صرف میکنند و متخصصان خبره را به کار میگیرند. این حوزه از پردرآمدترین حوزههای رایانهای محسوب میشود. برای کسب مهارت در این حوزه به دپارتمان فناوری اطلاعات و ارتباطات مجتمع فنی تهران سری بزنید و دوره مناسب خود را انتخاب کنید.
بینایی ماشین؛ خیال دیروز، واقعیت امروز
بینایی ماشین به ما کمک میکند پیچیدگی قوه بینایی انسان را درک کنیم و سیستمهای رایانهای را بهگونهای تربیت کنیم که بتوانند تصاویر و دیدیوهای دیجیتال را تفسیر و درک کنند. پیشتر طراحی یک سیستم رایانهای که هوشی شبیه هوش انسان داشته باشد، یک رؤیا بود، اما امروزه با پیشرفتهایی که در حوزه هوش مصنوعی و یادگیری ماشین حاصل شده است، این امر به تحقق نزدیک شده است.
به همین ترتیب، سیستمهای هوشمندی پدید آمدهاند که میتوانند جهان اطراف خود را مانند چشم انسان «ببینند» و تفسیر کنند. چیزی که دیروز خیال بود امروز به واقعیت تبدیل شده است. در این مقاله برخی از مفاهیم مهم در مورد بینایی ماشین را بررسی میکنیم و به نحوه کار آن، سیر تحول آن، کاربردهای آن و چالشهای پیش روی آن میپردازیم.
بینایی ماشین چیست؟
بینایی ماشین (Computer vision) یکی از حورههای مهم علوم رایانهای و مهندسی رایانه است که سیستمها را قادر میکند اطلاعات معنادار از دادههای تصویری استخراج کنند. این شاخه به ما کمک میکند براساس اطلاعات استخراجشده اقدامات مناسب انجام دهیم و توصیههای مفید بکنیم.
هوش مصنوعی نیز خود یکی از شاخههای علوم رایانه است که به هوشمند کردن سیستمها میپردازد و آنها را قادر میکند مانند ذهن انسان رفتار کنند و بیندیشند. پس میتوان گفت هوش مصنوعی به رایانه قدرت فکر کردن و بینایی ماشین به رایانه قدرت دیدن، تحلیل و درک میدهد.
تاریخچه بینایی ماشین
بینایی ماشین فناوری جدیدی نیست، زیرا دانشمندان و متخصصان حدود شش دهه است که در تلاش هستند به ماشینها توانایی دیدن و درک دادههای بصری را بدهند. سیر تحول بینایی ماشین در طول زمان از این قرار است:
- ۱۹۵۹
نخستین تجربیات بینایی ماشین در سال ۱۹۵۹ آغاز شد و در این تجربیات به رایانهای مجموعهای از عکسهای گربه را نشان دادند. رایانه نخست به گوشههای تیز و خطوط توجه کرد و از نظر علمی این بدان معناست که فرایند پردازش تصویر با توجه به اشکال ساده مانند گوشههای راست آغاز میشود.
- ۱۹۶۰
در سال ۱۹۶۰ هوش مصنوعی به حوزه مطالعات علمی بینایی ماشین افزوده شد.
- ۱۹۶۳
در این سال اتفاق مهم دیگری افتاد و آن این بود که رایانههای طراحی شدند که میتوانستند تصاویر دوبعدی را به تصاویر سهبعدی تبدیل کنند.
- ۱۹۷۴
در سال ۱۹۷۴ فناوریهای نویسهخوان نوری (optical character recognition) یا OCR و تشخیص هوشمند کاراکترها (Intelligent character recognition) یا ICR کشف شدند. فناوری نویسهخوان نوری مشکل تشخیص متن در هر فونت یا سبکی را حل کرد و فناوری تشخیص هوشمند کاراکتر توانست متون دستنویس را رمزگشایی کند. این فناوریها موفقیت عظیمی در حوزه پردازش متون و صورتحسابها فراهم کردند که امکان خواندن پلاک ماشینها، پرداخت موبایلی، ترجمه ماشینی و غیره را فراهم کرد.
- ۱۹۸۲
در این سال یک الگوریتم ساخته شد که میتوانست گوشهها، منحنیها و اشکال دیگر را تشخیص دهد. همچنین، دانشمندان شبکهای از سلولها را ساختند که میتوانست الگوها را تشخیص دهد.
- ۲۰۰۰
در سال ۲۰۰۰ دانشمندان به پژوهش درباره تشخیص اشیاء روی آوردند.
- ۲۰۰۱
در این سال نخستین برنامه تشخیص چهره لحظهای ساخته شد.
- ۲۰۱۰
در سال ۲۰۱۰ پایگاه داده ImageNet با میلیونها تصویر در اختیار کاربران قرار گرفت و میتوان آن را پایه و اساس «شبکه عصبی پیچشی» (convolutional neural network) یا CNN و مدلهای یادگیری ماشین دانست.
- ۲۰۱۲
در سال ۲۰۱۲ CNN در فناوری تشخیص تصویر به کار رفت و مشخص شد نرخ خطای آن نسبت به سیستم پیشین کمتر است
- ۲۰۱۴
«کوکو» (COCO) به عنوان پایگاهی داده ارائه شد که در آن منابع تشخیص اشیا وجود داشت و از پژوهشهای بعدی پشتیبانی میکرد.
بینایی ماشین چگونه کار میکند؟
بینایی ماشین یک تکنیک است که میتواند اطلاعات را از دادههای تصویری مانند تصاویر و ویدیوهای دیجیتال استخراج کند. اگرچه بینایی ماشین مانند بینایی انسان در رابطه با چیزی مانند مغز کار میکند، اما این حوزه احتمالاً یکی از مبهمترین حوزههای برای متخصصان فناوری اطلاعات است. مغز انسان چگونه کار میکند و اشیا را تشخیص میدهد؟
در سطح اولیه، بینایی ماشین تماماً به معنایی الگویی تشخیصی است که شامل فرایند آموزش سیستمهای ماشینی برای درک دادههای تصویری است. نخست حجم بسیار زیادی از دادههای برچسبدار را به ماشین میدهند تا از طریق آنها خود را آموزش دهد. این دادههای برچسبدار ماشین را قادر میکنند الگوهای متنوع را در همه بخشهای تصویر شناسایی کنند و به آن برچسب ارتباط دهند. برای نمونه، تصور کنید که دادههای تصویری میلیونها سگ را تهیه کنیم. رایانه بر اساس این دادهها و با تحلیل هر کدام و شناسایی اشکال و رنگهای آنها و فواصل این اشکال از هم، یاد میگیرد که سگ چیست و در نتیجه الگوهایی مشترک بین سگها را شناسایی میکند و یک مدل از سگ میسازد. به این ترتیب این مدل بینایی ماشین میتواند به درستی تشخیص دهد که آیا در یک تصویر سگی وجود دارد یا خیر.
حوزههای کاربردی بینایی ماشین
هرچند بینایی ماشین در حوزههای بسیار متنوعی به کار میرود، کاربرد آن در برخی از این حوزهها از بقیه رایجتر است. این حوزهها عبارتاند از:
- دستهبندی اشیا
دستهبندی اشیا یک تکنیک بینایی ماشین است که برای دستهبندی تصاویر مورد استفاده قرار میگیرد، مثلاً اینکه در یک تصویر، سگ، چهره انسان یا موز وجود دارد یا خیر. این تکنیک محتواهای تصویری و ویدیویی را تحلیل میکند و اشیا را در دستههای مشخص طبقهبندی میکند. این بدان معناست که ما میتوانیم بهدرستی دسته یک شیء را که در یک تصویر وجود دارد تشخیص دهیم.
- شناسایی و تشخیص اشیا
شناسایی تا تشخیص اشیا برای نوعی از دستهبندی تصاویر به کار میرود تا یک شی را در یک تصویر یا ویدیو شناسایی کرده و موقعیت آن را در آن تصویر یا ویدیو مشخص کند. این تکنیک باعث میشود سیستم بتواند تعداد مشخص یک شیء را در یک تصویر معین کند و موقعیت دقیق آنها را تشخیص دهند. برای نمونه، این تکنیک میتواند تشخیص دهد که در یک تصویر یک سگ، یک گربه و یک اردک اردک وجود دارد و مکان هر کدام را در آن تصویر مشخص کند.
- تأیید اشیا
این سیستم میتواند ویدیو ها را پردازش کرده و اشیا مورد نظر را در آنها شناسایی کند. همچنین میتواند حرکت آنها را تشخیص دهد و دنبال کند.
- شناسایی ویژگیهای تصویر
این سیستم میتواند ویژگیهای کلیدی هر شیء را در یک تصویر شناسایی کند.
- تقسیمبندی تصویر
تکنیک تقسیمبندی تصویر مانند دستهبندی تصاویر میتواند دستههای عکسها و ویدیوها را تشخیص دهد. اما در عین حال میتواند هر پبکسل را در هر عکس دستهبندی کند و بگوید کدام یک، بخشی از یک شیء را در خود جا دادهاند یا ندادهاند. این تکنیک نقش هر پیکسل را در یک تصویر شناسایی میکند.
- تشخیص اشیا
در این تکنیک، سیستم میتواند جای هر شیء را در یک تصویر شناسایی کند.
جمعبندی
بینایی ماشین به ما کمک میکند پیچیدگی قوه بینایی انسان را درک کنیم و سیستمهای رایانهای را بهگونهای تربیت کنیم که بتوانند تصاویر و دیدیوهای دیجیتال را تفسیر و درک کنند. پیشتر طراحی یک سیستم رایانهای که قدرت بینایی شبیه چشم انسان داشته باشد، یک رؤیا بود، اما امروزه با پیشرفتهایی که در حوزه هوش مصنوعی و یادگیری ماشین حاصل شده است، این امر به تحقق نزدیک شده است. در بخش دوم این مقاله، «راهنمای جامع بینایی ماشین، بخش دوم» شیوه یادگیری ماشین در بینایی ماشین را بخوانید.
بینایی ماشین از حوزههای نوظهور و مهم در شاخه فناوری اطلاعات است. هوش مصنوعی، یادگیری ماشین و بینایی ماشین از حوزههایی هستند که علاوه بر جذابیت و کاربرد وسیع آنها، امروزه بازار کار بسیار خوبی دارند و اکثر سازمانها و شرکتهای دولتی و خصوصی هزینه کلانی برای آنها صرف میکنند و متخصصان خبره را به کار میگیرند. این حوزه از پردرآمدترین حوزههای رایانهای محسوب میشود. برای کسب مهارت در این حوزه به دپارتمان فناوری اطلاعات و ارتباطات مجتمع فنی تهران سری بزنید و دوره مناسب خود را انتخاب کنید.
در دنیای کسبوکار امروز، تحصیلات دانشگاهی برای حفظ ارزش شما بهعنوان نیروی کار بااستعداد و کارآمد کافی نیستند. برای اینکه مزیت رقابتی شخصی خود را حفظ کنید، باید بر آموزش مستمر و مادامالعمر خود سرمایهگذاری کنید. خانواده بزرگ مجتمع فنی تهران هرساله به هزاران نفر کمک میکند تا در مسیر شغلی خود پیشرفت کنند.
اگر شاغل هستید و وقت ندارید در دورههای آموزشی حضوری شرکت کنید، مجتمع فنی تهران گزینههایی عالی برای آموزش مجازی، آنلاین، آفلاین و ترکیبی ارائه میدهد. با شرکت در دورههای کوتاهمدت مجتمع فنی تهران و دریافت مدارک معتبر و بینالمللی میتوانید با اعتماد به نفس مسیر ترقی را طی کنید و در سازمان خود به مهرهای ارزشمند تبدیل شود.
منبع: Javatpoint
مترجم: بهناز دهکردی