فیس بوک به یک ماشین نیاز دارد تا جهان را با چشم ما ببیند


طی دو سال گذشته ، فیس بوک AI Research (FAIR) با سیزده دانشگاه در سراسر جهان همکاری کرده است تا یک فیلم ویدیویی از شخص اول-به ویژه برای آموزش در قالب یادگیری عمیق-تهیه کند. هوش مصنوعی آموزش دیده که داده ها را تنظیم می کند در کنترل روبات های تعامل با مردم یا تفسیر ترجمه تصاویر بهتر عمل می کند. کریستن گرومن و FAIR ، که این پروژه را رهبری می کردند ، گفتند: “این دستگاه تنها در صورتی به ما کمک می کند که در زندگی روزمره خود به درک جهان بپردازیم.”

چنین فناوری می تواند از افرادی که در خانه به کمک احتیاج دارند پشتیبانی کند ، یا افرادی را در کارهایی که یاد می گیرند انجام دهند راهنمایی کند. مایکل ویو ، محقق بینایی رایانه ای در Google Brain در دانشگاه استونی بروک نیویورک ، که در 4D سرمایه گذاری نکرده است ، گفت: “ویدیوی موجود در این داده ها از آنچه انسانها به جهان نگاه می کنند نزدیکتر است.”

اما موارد استفاده احتمالی واضح و نگران کننده است. بر اساس مطالعه MIT Technology Review ، این نظرسنجی گسترده توسط فیس بوک حمایت می شود ، یک بستر رسانه های اجتماعی که اخیرا توسط قانونگذاران آمریکایی متهم شده است که منافع بیشتری را در جهت منافع عمومی قرار می دهد.

مدل تجاری فیس بوک به همراه سایر شرکت های Big Tech این است که تا آنجا که ممکن است داده ها را از رفتار اینترنتی مردم استخراج کرده و به تبلیغ کنندگان بفروشند. هوش مصنوعی ذکر شده در این پروژه می تواند دسترسی به رفتار افراد آفلاین را به صورت روزانه افزایش دهد و آنچه را که در اطراف خانه شما وجود دارد ، فعالیت های مورد علاقه شما ، افرادی که با آنها هستید ، و حتی منطقه تمرکز چشم های شما باز است – سطح اطلاعات بی سابقه شخصی.

گرومن گفت: “یک ویژگی حفظ حریم خصوصی وجود دارد که به شما امکان می دهد این مورد را از موتور جستجو حذف کرده و محصول را وارد کنید.” “این اثر ممکن است از این الهام گرفته شود.”

فیس بوک

داده های بزرگ ویدئوی اول شخص دارای یک تصویر 100 ساعته از افراد در آشپزخانه است. پایگاه داده Ego4D شامل 3025 ساعت فیلم توسط 855 نفر در 73 منطقه مختلف در 9 کشور (ایالات متحده ، انگلستان ، هند ، ژاپن ، ایتالیا ، سنگاپور ، عربستان سعودی ، کلمبیا و رواندا) است.

سن شرکت کنندگان و پیشینه های مختلف بود. برخی در مشاغل جالب مانند نانوایی ، مکانیک ماشین ، نجاری و سازمان دهنده ثبت نام کرده اند.

تنظیمات داده های قبلی معمولاً فیلم های کوتاهی هستند که در چند ثانیه ذخیره می شوند. در Ego4D ، شرکت کنندگان تا 10 ساعت یکبار از دوربین سر استفاده می کنند و اولین فیلم از یک رویداد غیر کلامی روزانه را شامل پیاده روی ، مطالعه ، لباس حمام ، خرید ، بازی با حیوانات ، بازی فوتبال و معاشرت می کنند. با دیگران. برخی از تصاویر همچنین شامل صدا ، اطلاعات مربوط به تمرکز شرکت کنندگان و چندین نمای در یک مکان است. ریو گفت ، این اولین داده در نوع خود است.


تمامی اخبار به صورت تصادفی و رندومایز شده پس از بازنویسی رباتیک در این سایت منتشر شده و هیچ مسئولتی در قبال صحت آنها نداریم