نسیم گیلان

آخرين مطالب

موفقیت هوش مصنوعی مایکروسافت در رنگی‌کردن ویدئوها فقط با یک تصویر علمي

  بزرگنمايي:

نسیم گیلان -
موفقیت هوش مصنوعی مایکروسافت در رنگی‌کردن ویدئوها فقط با یک تصویر 2
٠
٠
زومیت / تلاش جدید تیمی از پژوهشگران نشان داد یادگیری ماشین به‌کمک هوش مصنوعی مایکروسافت می‌تواند ویدئوهای سیاه‌و‌سفید را تنها با یک تصویر مرجع رنگی، رنگی کند.
رنگی‌کردن ویدئوها ممکن است اثری هنری قلمداد شود. امروزه، مدل‌های جدید هوش مصنوعی کم‌کم به این حوزه نیز وارد شدند و می‌توانند اثری هنری خلق کنند. تیم دانشمندان مایکروسافت با همکاری دانشگاه حمد‌بن‌خلیفه و مؤسسه‌ی USC در بخش‌های تحقیقات آسیا (Research Asia) و ادراک هوش مصنوعی (AI Perception) و بخش واقعیت ترکیبی (Mixed Reality Division) پژوهشی جدید انجام داد و مقاله‌ای با عنوان رنگی‌کردن ویدئوها مبتنی‌بر نمونه‌ی مرجع (Deep Exemplar-based Video Colorization) در وب‌سایت Arxiv منتشر کرد. این پژوهش جدید دستاوردی در حوزه‌ی فناوری‌های خلاقانه است و پژوهشگران این تیم ادعا می‌کنند موفق شدند اولین سیستم سرتاسری مستقلِ مبتنی‌بر نمونه (مثلا برگرفته از تصویری مرجع) را در رنگی‌کردن ویدئوها ایجاد کنند. به‌گفته‌ی پژوهشگران مایکروسافت، این تحقیقات در هر دو بخش کمّی و کیفی به نتایجی فراتر از اثری هنری دست پیدا کرده است.
نویسندگان این مقاله معتقدند:
مسئله‌ی اصلی چگونگی دستیابی به ثبات زمانی (Temporal Consistency) است؛ درحالی‌که بتوان به سبک و ویژگی‌های تصویر مرجع وفادار ماند. تمام بخش‌های مختلف این مدل هوش مصنوعی که به‌صورت سیستم سرتاسری آموزش داده شده، باعث ایجاد ویدئوهای واقعی با پایداری زمانی (Temporal Stability) مناسب می‌شود.
نویسندگان این مقاله خاطرنشان کردند توانایی هوش مصنوعی در تبدیل ویدئو‌های تک‌رنگی به ویدئوهای رنگی کار جدیدی نیست. برای نمونه، پژوهشگران انویدیا یکی از بزرگ‌ترین شرکت‌های فناوری جهان و غول پردازنده‌های گرافیکی، در سپتامبر گذشته موفق شدند مدلی ارائه کنند که رنگ‌ها را از فریم فقط یک ویدئو رنگی‌شده استخراج می‌کرد. نمونه‌ی دیگر، هوش مصنوعی گوگل است که در ژوئن با ارائه‌ی الگوریتمی، ویدئوهای سیاه‌وسفید را بدون نظارت دستی انسان رنگی می‌کرد. بااین‌حال، نکته‌ی اصلی این است که خروجی تمام این مدل‌ها و الگوریتم‌های ارائه‌شده خطاها و آرتیفکت‌های بسیار دارد که مدت زمان ویدئو ورودی را افزایش می‌دهد.
پژوهشگران در تلاش برای کاهش این نقص‌ها در روشی جدید، نتیجه‌ی فریم ویدئو قبلی را به‌عنوان ورودی (برای حفظ ثبات) حفظ و با استفاده از تصویر مرجع جدید، ویدئو را رنگی‌ کردند. در بیشتر مدل‌های قبلی، رنگ صحیح اجسام درون تصویر را نمی‌شد به‌صورت مستقیم از تصویر سیاه‌وسفید به‌دست آورد؛ بنابراین، هوش مصنوعی باید می‌توانست نوع و رنگ اجسام را ازطریق یادگیری ماشینی که از چند میلیون عکس رنگی به‌دست آورد و به‌درستی پیش‌بینی کند. در این مدل، به تصویر نمونه‌ی مرجع اجازه‌ی هدایت رنگی‌کردن فریم‌به‌فریم ویدئو داده می‌شد که این کار باعث جلوگیری از تجمع خطاها کاهش تعداد آن‌ها می‌شد. در این مدل جدید، هنگام جلورفتن فریم‌به‌فریم ویدئو، رنگ فریم‌ها تغییر نمی‌کند؛ یعنی رنگ جدید محتوای ویدئویی سیاه‌وسفید با جلورفتن ویدئو در فریم‌های بعدی ثابت باقی می‌ماند. اگر تصویر مرجع یک فریم رنگی در ویدئو باشد، این کار همانند بسیاری دیگر از روش‌های رنگی‌کردن ویدئوها، اما بسیار قدرتمندتر و با دقت بیشتری انجام می‌شود؛ درنتیجه، این مدل جدید می‌تواند رنگ‌های «طبیعی» را براساس معانی ورودی تصویر سیاه‌وسفید پیش‌بینی کند. این مدل حتی می‌تواند زمانی‌که تطبیق مناسبی در تصویر مرجع یا فریم قبلی ارائه نشده باشد، پیش‌بینی مناسبی از معنای رنگ کند.
دستیابی به چنین مدلی نیازمند معماری شبکه‌ی کانولوشن سرتاسری است. شبکه‌ی کانولوشن سرتاسری نوعی سیستم هوش مصنوعی است که برای تجزیه‌و‌تحلیل تصاویر دیداری از آن استفاده می‌شود و همراه‌با ساختاری مکرر است که اطلاعات تاریخی ازنظر زمانی را حفظ می‌کند. این مدل از دو ماژول تشکیل شده است: 1. مدل Correspondence که تراز تصویر مرجع را در فریم ورودی متناسب با معنای تراکم رنگ تنظیم می‌کند؛ 2. مدل رنگی‌کردن ویدئوها است که باتوجه‌به نتیجه‌ی رنگی‌شدن فریم فبلی و تراز تصویر مرجع، فریم ویدئو سیاه‌و‌سفید را رنگی می‌کند.
تیم تحقیقاتی مجموعه‌ای از داده‌های آموزش‌دیده را از مجموعه‌ی متن‌باز Videvo گردآوری کردند که بیشتر شامل تصاویر حیوانات و مناظر بودند. آن‌ها پرتره ویدئوها را با استفاده از مجموعه‌ی جداگانه‌ای (هالیوود 2) کامل کردند و مجموع 768 ویدئویی را فیلتر کردند که بیش‌ازحد تصویر آن‌ها تاریک بود یا رنگ محوی داشتند. برای هر ویدئو، 25 فریم استخراج شد و دسته‌بندی داده‌ها را با عکس‌های ImageNet، مرکز داده‌ی وسیعی برای توسعه‌ی نرم‌افزارهای هوش مصنوعی گسترش دادند که برای اعمال تحریف هندسی تصادفی و مشخص‌کردن نویزها برای تولید فریم‌ها استفاده می‌شدند. نتیجه‌ی نهایی، تولید 70 هزار ویدئو تکمیل‌شده در «دسته‌‌بندی‌های گوناگون» بود.
به‌گزارش نویسندگان این مقاله، در آزمایش‌های انجام‌شده‌ی این سیستم جدید، بهترین دقت کلاس Top-5 و Top-1 در ImageNet ارائه شده است. این نشان‌دهنده‌ی آن است که نتایج ازنظر معنایی معنادار بوده و آن را با کمترین مقدار Frechet Inception Distance یا FID در‌مقایسه‌با معیارهای بنچمارک مدیریت کرده که این کار باعث می‌شود خروجی بسیار واقعی‌تر باشد.
پژوهشگران گفتند:
به‌طورکلی، نتایج این مدل وایبرنت رنگی کمی دارند؛ اما شباهت زیادی با رنگ‌های زمینه عکس مرجع دارند. همچنین، این روش جدید در مقایسه‌ی کیفی نیز نتایج واقعی‌تری با وایبرنت رنگی‌سازی کمتری تولید می‌کند. علاوه‌براین در هر فریم، وایبرنت‌های رنگی با آرتیفکت‌های بسیار کمتری در‌مقایسه‌با مدل‌های قبلی وجود دارند. در‌عین‌حال، فریم‌های متوالی رنگی نشان می‌دهد هماهنگی ثبات زمانی مناسبی دارد.

لینک کوتاه:
https://www.nasimegilan.ir/Fa/News/100932/

نظرات شما

ارسال دیدگاه

Protected by FormShield
مخاطبان عزیز به اطلاع می رساند: از این پس با های لایت کردن هر واژه ای در متن خبر می توانید از امکان جستجوی آن عبارت یا واژه در ویکی پدیا و نیز آرشیو این پایگاه بهره مند شوید. این امکان برای اولین بار در پایگاه های خبری - تحلیلی گروه رسانه ای آریا برای مخاطبان عزیز ارائه می شود. امیدواریم این تحول نو در جهت دانش افزایی خوانندگان مفید باشد.

ساير مطالب

دیدار 46 کارگر استان گیلان با رهبر انقلاب

شاعرانه/ چه خوش است با خیال تو نهفته رازکردن

داستانک/ دوستت دارم

برگزاری دومین کنگره 8 هزار شهید گیلان با حرکت جهادی

پیشرفت فیزیکی 86 درصدی تصفیه خانه شرقی بندرانزلی

ضرورت ورود جدی مسئولان برای رفع اختلاف مالکیت ساکنان تالاب انزلی

ممنوعیت فروش امتیاز واحد‌های مسکونی طرح نهضت ملی مسکن

برگزاری نخستین المپیاد ملی هنر در گیلان

شعری فوق العاده زیبا از مولانا

به ظاهر دوست اما دشمنانند

این استان ها منتظر موج جدید بارش باران باشند

قیمت طلا، قیمت دلار، قیمت سکه و قیمت ارز 4 اردیبهشت 1403

دکتر قاضی‌زاده هاشمی: یادواره شهدا از جنس کار زینبی و رساندن پیام شهدا است

تکریم خانواده شهدا و  ترویج فرهنگ ایثار و شهادت امر بزرگی است که باید از دل جریان‌های مردمی بجوشد

تشریح آخرین وضعیت تردد کامیون های ترانزیتی از مرز آستارا

افزایش 67 درصدی شناسایی انشعاب غیرمجاز آب در گیلان

خودروِ ترکیبی یا دورگه؟

مصوبات دور اول سفر رییس جمهور در حوزه بنیاد شهید ایلام به صورت 100 درصد اجرایی شد

شاهین خزر رودسر در گیرودار مشکلات مالی

برگزاری 31 عنوان برنامه ویژه هفته کارگری در گیلان

رفع اختلاف مالکیت ساکنان حاشیه تالاب بین المللی انزلی مستلزم ورود جدی مسئولان مربوطه

گیتی آذرپی درگذشت

افزایش 30 درصدی سفر گردشگران خارجی به گیلان

معدوم سازی 389 کیلوگرم فرآورده خام دامی غیر بهداشتی در آستارا

جایزه کتاب سال فراخوان داد

ماجرای دستگیری یک قاتل فراری در شوش

مرگ تلخ یک دانشجوی دندانپزشکی در رفسنجان

حرکت پر سر و صدای آمریکا علیه ایران

انتصاب مدیرکل توسعه منابع انسانی بنیاد شهید و امور ایثارگران

نجات مرد 38 ساله آسیب دیده از ارتفاعات لیالستان

راه‌اندازی شعبه ویژه قضایی رسانه‌ها در گیلان

سخنان جالب دکتر کاکاوند در مورد شاعر مهستی گنجوی

لغو جایزه «انجمن قلم آمریکا» در پی تحریم نویسندگان

محاکمه دوباره کارگردان متهم به تجاوز

اطلاعیه مهم تامین اجتماعی درباره سن بازنشستگی

اتفاق خبرسازی که برای هنجارشکن‌ های اینستاگرام افتاد

سندروم «مسئله با پدر» در کمین دختران

ایثارگری‌های جبهه مقاومت ‌برای نسل جدید بازگو شود

جلوه‌های منحصر به‌فرد از سرزمین بهشتی گیلان + فیلم

عبور از اروند اوج شکوه رزمنده‌های گیلان در عملیات والفجر 8

ای مرغ سحر عشق ز پروانه بیاموز

لایروبی بیش از نیمی از انهار کشاورزی شهرستان رشت

اعزام اولین کاروان سفر عمره مفرده از گیلان

نمایش توان فنی و مهندسی ایران در سریلانکا

نوسان قیمت طلا و سکه در بازار رشت تا ساعت 10

آدمی حسرت سرگردونه

شعرخوانی زیبا از دکتر کاکاوند

سومین دیدار چهره به چهره سال 1403 مدیر کل بنیاد شهید خراسان رضوی با 60 تن از جامعه معزز ایثارگری

مدیرکل بنیاد شهید و امور ایثارگران استان اردبیل با فرمانده تیپ 37 سپاه اردبیل دیدار کرد

بارش‌های رگباری باران در گیلان