رد کردن لینک ها

هوش مصنوعی DeepMind آتاری بازی می کند!

شرکت گوگل که در لندن به نام DeepMind مشغول به کار است، اخیرا متودی برای آموزش بازی آتاری به هوش مصنوعی ایجاد کرده است. آن ها به جای اینکه داده ها و اطلاعات را به هوش مصنوعی بدهند، تنها آن را با ویدئوهای یوتیوب تنها گذاشتند.

آخرین متود آموزشی DeepMind برای حل مشکلاتی است که هوش مصنوعی در کاوش هایش با آن روبرو می شود. هوش مصنوعی در کشف مکان های جدید و یا کشف اینکه کدام راه را برود، بسیار بد عمل می کند. و توسعه دهندگان به دنبال راهی هستند که در جایی که هوش مصنوعی پیشرفت دارد و به چیزهای کوچکی دست می یابد، به آن جایزه دهند. به طور مثال، هوش مصنوعی DeepMind’s AlphaGo برای برنده شدن در بازی Go که قوانین خاصی دارد طراحی شده بود. با این حال، زمانی که یک هوش مصنوعی را به بازی هایی که نیاز به اکتشاف دارند، مانند Pitfall و یا Montezuma’s Revenge معرفی می کنید، کار ماشین برای تعیین کاری که باید انجام دهد مشکل خواهد بود.

انسان توانایی در تصمیم گیری را مسلم می پندارد. اگر در حال بازی هستیم، کشف اینکه چه راهی را برویم برای ما بسیار آسان است زیرا براساس آنچه به عنوان موانع می دانیم، عمل می کنیم. براساس گفته ی تیم whitepaper همین چالش برای هوش مصنوعی، می تواند مشکل باشد:

برخی وظایف عملا با استفاده از روش های اکتشاف ساده غیرممکن است، زیرا شمار مسیرهای عملی به صورت نمایی در تعداد فریم هایی که جایزه ها را جدا می کند، رشد می کنند. برای مثال، اولین دستیابی به جایزه در بازی MONTEZUMA’S REVENGE تقریبا ۱۰۰ مرحله ی محیطی می گیرد، و معادل با ۱۰۰ عمل متوالی ممکن می باشد.

اکنون توسعه دهندگان این مسئله را با ارائه ی مجموعه ای از داده های هوش مصنوعی که فریم هایی کاملا قالب بندی شده هستند، حل می کنند. این رویکرد در موقعیت هایی که مجموعه داده های برچسب گذاری شده در دسترس نیستند، چندان مفید نخواهد بود.

با متود جدید DeepMind، هوش مصنوعی تصاویر شلوغ گرفته و کشف می کند که چطور آن ها را به چیزی تبدیل کند که بتوان دوباره از آن داده تولید کند. اگر ویدئویی از بازی انسان که Pitfall و یا Montezuma’s Revenge به آن نشان دهید، می تواند حرکت هایی که انسان را موفق یا برنده می کند را جدا کرده و از آن ها تقلید کند.

این امر به محققان اجازه می دهد تا در حالی که یک همزمان مبنایی برای آموزش هوش مصنوعی ارائه می دهد،  پاداش تعیین کنند (به طور مثال اگر سریعتر انجام دهند، امتیاز بیشتری می گیرند). و این به سادگی بارگیری ویدئوهای یوتیوب در شبکه عصبی است زیرا این روش آموزش یک باره را ایجاد می کند.

این فناوری اجازه می دهد که ربات محیط های جدید را مطالعه کند، مانند سطح مریخ که با استفاده از نشانه های ارائه شده توسط فیلمی که گرفته می شود، می توان آن را بررسی کرد. و یا محیط کاری را از طریق تماشای یک ویدئو در یوتیوب، به سادگی آموزش دهد.

منبع: thenextweb

بازگشت به بالای صفحه