تشخیص آفلاین صدا و تصاویر با استفاده از فناوری جدید گوگل

حتماً تا به حال با دستیارهای هوشمند شخصی مانند گوگل ناو، سیری و یا کورتانا در تلفن خود کار کرده‌ و یا از اپلیکیشن‌هایی مانند SoundHound و Shazam برای تشخیص آهنگ در حال پخش استفاده کرده‌اید. اگر دقت کرده باشید تمام این‌ها یک نکته‌ی مشترک دارند و آن هم نیاز به اینترنت است. دلیل نیاز چنین اپلیکیشن‌هایی به اینترنت این است که آن‌ها قدرت پردازشی خود را نه از تراشه‌ی دستگاه شما، بلکه از دیتاسنترهایی که کیلومترها با شما فاصله دارند می‌گیرند.
قابلیت‌های مرتبط با یادگیری عمیق و الگوریتم‌های تشخیص تصاویر در محصولات گوگل هم از این قاعده مستثنی نیستند. تمام این قابلیت‌ها به لطف قدرت پردازش بالا قابل دستیابی هستند و گوگل هم مانند بقیه‌ی شرکت‌های نرم‌افزاری، برای به دست آوردن قدرت پردازشی خود متکی به چیپ‌های ساخت شرکت‌های بزرگ و صاحب نام ساخت تراشه است.
اگرچه با همین قدرت پردازشی فعلی هم می‌توان کارهای خارق‌العاده‌ای انجام داد، اما هیچ چیز مثل یک تراشه‌ی اختصاصی که از اول برای انجام وظیفه‌ای خاص طراحی شده باشد نیست.در حالی که اکثر شرکت‌های دنیای تکنولوژی به سوی پردازش ابری پیش می‌روند، گوگل قصد دارد با استفاده از تراشه‌ی اختصاصی، وظایف مرتبط با هوش مصنوعی را که تا پیش از این به صورت آنلاین بر روی دیتاسنترها انجام می‌شد، به صورت آفلاین و بر روی دستگاه‌ها انجام دهد.  

                                                                                     تشخیص آفلاین صدا و تصاویر با استفاده از فناوری جدید گوگل    
 
شرکت امریکایی موویدیوس (Movidius) که یکی از پیشگامان "بینایی ماشینی" است، به تازگی خبر از همکاری با گوگل داده است. قرار است گوگل از پردازنده‌ها و نرم‌افزارهای شرکت یاد شده در نسل جدیدی از دستگاه‌ها استفاده کند. طبق اعلام گوگل و موویدوس این دستگاه‌ها در آینده‌ای نه چندان دور روانه‌ی بازار خواهند شد. در همین حال گوگل به موویدوس در توسعه‌ی تکنولوژی شبکه‌های عصبی کمک خواهد کرد.
محصولات موویدوس به گوگل کمک خواهند کرد تا سیستم‌های هوش ماشینی این شرکت به جای اجرا بر روی دیتا سنترها، به صورت "بومی" و بر روی سخت‌افزار محلی اجرا شوند. با این کار اطلاعات کاربر بر روی دستگاه باقی خواهد ماند و الگوریتم بدون اتصال به اینترنت قادر خواهد بود تا نتایج را بدون تاخیر به نمایش بگذارد. این کار سرعت و دقت تشخیص تصاویر و صدا را افزایش خواهد داد و منجر به تجربه‌ای "شخصی‌ و هوشمند" خواهد شد.
تراشه‌ای که گوگل قرار است از آن استفاده کند، MA2450 نام دارد. این چیپ به گونه‌ای طراحی شده است تا با قدرت بالا و مصرف بهینه‌ی انرژی، محاسبات پیچیده‌ی شبکه‌های عصبی را در ابعادی بسیار کوچک انجام دهد. تعبیه کردن تکنولوژی یادگیری عمیق درون دستگاه‌های مصرفی مشکلات عمده‌ای مانند مصرف بالای انرژی دارد که چیپ مذکور باید بتواند از پس آن‌ها بربیاید.
اما آنچه گفته شد برای یک کاربر معمولی چه نفعی دارد؟ برای مثال یک تلفن هوشمند که به صورت آفلاین قابلیت تشخیص تصاویر را داشته باشد، می‌تواند به افراد نابینا کمک کند تا راحت‌تر در مناطق مختلف شهر به رفت و آمد بپردازند. همچنین اپلیکیشن‌ها برای کاربردهایی مانند تشخیص صورت یا علائم راهنمایی و رانندگی می‌توانند با استفاده از چیپ موویدوس تصاویر را بدون احتیاج به آپلود کردن، به صورت آفلاین پردازش کنند؛ بدون اینکه کاربر کوچکترین تاخیری را تجربه کند.
کاربردهای اشاره شده در بالا تنها موارد کوچکی هستند که به ذهن می‌رسند. برای دیدن قدرت واقعی این تکنولوژی باید منتظر باشیم تا دستگاه‌هایی که از چیپ موویدوس استفاده می‌کنند روانه‌ی بازار شوند و توسعه دهندگان با خلاقیت خود قدرت واقعی این چیپ را به ما نشان دهند.