تشخیص و تولید همزمان تصویر با سیستم بینایی جدید

یک سیستم بینایی رایانه‌ای یکپارچه (MAGE) که توسط محققان دانشگاه ام‌آی‌تی و شرکت گوگل توسعه یافته است، می‌تواند کار تولید و تشخیص تصاویر را که معمولاً به طور جداگانه انجام می‌شود، به صورت همزمان انجام دهد.

*** تشخیص و تولید همزمان تصویر با سیستم بینایی جدید

به گزارش سروش، رایانه‌ها در رابطه با تصاویر دارای دو قابلیت قابل توجه هستند؛ هم می‌توانند آنها را شناسایی و هم دوباره تولید کنند و این دو کارکرد همیشه از هم جدا بوده‌اند.

حال سوالی که مطرح می‌شود این است که آیا امکان ترکیب و هماهنگی این دو کارکرد متفاوت با یکدیگر وجود دارد؟

محققان آزمایشگاه علوم کامپیوتر و هوش مصنوعی دانشگاه ام‌آی‌تی، سیستمی را آموزش داده‌اند تا قسمت‌های گم‌شده یک تصویر را استنباط کند، کاری که نیاز به درک عمیق محتوای تصویر دارد.

با پُرکردن موفقیت آمیز جاهای خالی، این سیستم که به عنوان رمزگذار مولد نقاب دار (MAGE) شناخته می‌شود، به دو هدف شناسایی دقیق تصاویر و ایجاد تصاویر جدید با شباهت چشمگیر به واقعیت به طور همزمان دست می‌یابد.

این سیستم دومنظوره کاربردهای بالقوه بی‌شماری مانند شناسایی و طبقه‌بندی اشیا در تصاویر، یادگیری سریع از حداقل نمونه‌ها، ایجاد تصاویر تحت شرایط خاص و بهبود تصاویر موجود را امکان‌پذیر می‌سازد.

جدا از توانایی این سیستم در تولید تصاویر واقعی از ابتدا، (MAGE) امکان تولید تصاویر مشروط را نیز فراهم می‌کند.

کاربران می‌توانند معیارهای خاصی را برای تصاویری که می‌خواهند این سیستم تولید کند، مشخص کنند و این ابزار تصویر مناسب را تهیه می‌کند.

همچنین این سیستم قادر به ویرایش تصویر یا حذف عناصر از یک تصویر در عین حفظ ظاهر واقعی آن است.

وظیفه تشخیص یکی دیگر از قابلیت‌های قدرتمند این سیستم به حساب می‌آید و تنها با تعداد انگشت‌شماری از نمونه‌های برچسب‌گذاری شده، به نتایج چشمگیری در مجموعه داده‌های تصویری بزرگ می‌رسد.

عملکرد این سیستم زمانی که مورد ارزیابی قرار گرفت، نتایج مثبت چشمگیری داشت. از یک طرف، رکوردهای جدیدی را در تولید تصاویر جدید ثبت کرد و با پیشرفت قابل توجهی از مدل های قبلی پیشی گرفت.

از طرف دیگر در زمینه تشخیص، در ۷۰.۱ درصد از موارد تنها با داشتن ۱۰ نمونه برچسب‌دار و طبقه‌بندی شده، توانست تصاویر را به درستی شناسایی کند.

به‌رغم نقاط قوت موجود، گروه تحقیقاتی این پروژه تایید می‌کند که این سیستم هنوز جای پیشرفت زیادی دارد.

آنها مشتاق هستند راه‌هایی را برای فشرده سازی تصاویر بدون از دست دادن جزئیات مهم و کیفیت در آینده کشف کنند.

این تیم همچنین قصد دارد این سیستم (MAGE) را روی مجموعه داده‌های بزرگتر آزمایش کند.

اکتشافات آینده ممکن است شامل آموزش این سیستم روی مجموعه داده‌های مرتب نشده بزرگتر باشد که به طور بالقوه منجر به عملکرد بهتر می‌شود.

هویی شنگ وانگ (Huisheng Wang) کارمند ارشد بخش مهندسی نرم افزار در بخش تحقیقات و هوش ماشینی گوگل (که در این پروژه دخالتی نداشت) می‌گوید:

دستیابی به تولید تصویر و تشخیص تصویر در یک سیستم واحد، یک رویای قدیمی بوده است. (MAGE) یک تحقیق پیشگامانه است که با موفقیت از هم افزایی این دو کارکرد (تشخیص و تولید تصاویر) استفاده می‌کند و به پیشرفته ترین آنها در یک سیستم واحد دست می‌یابد. این سیستم نوآورانه کاربردهای گسترده‌ و پتانسیل الهام بخشیدن به بسیاری از کارهای آینده در زمینه بینایی کامپیوتر را دارد.

انتهای پیام///

منبع

سروش