صدای هوش گوگل
در نوامبر سال 2007، گوگل فعالیت خود را در زمینه تلفنهای هوشمند با عرضه سیستمعامل اندروید آغاز کرد. این کار با هدف سلطه بر بازار تلفنهای هوشمند به مرحله اجرا درآمد. اکنون که نه سال از این تاریخ میگذرد، بخش عمدهای از بازار – حدود 80 درصد- در اختیار این پلتفرم قرار دارد. حال گوگل در نظر دارد همین استراتژی را برای هوش مصنوعی نیز استفاده کند و با تلفیق این فناوری با فناوریهایی همچون رایانش کوانتومی، رهبری بازار را در زمینه عرضه محصولات هوشمند به دست آورد. در این مقاله به فعالیتهایی که گوگل در این زمینه داشته است، میپردازیم.
محاسبات شناختی یا در مفهومی کلیتر هوش مصنوعی، از جمله فناوریهای است که شرکتهای بزرگ سیلیکونولی به آن توجه دارند. اپل، استارتآپهای فعال در حوزه هوش مصنوعی را یکی بعد از دیگری تصاحب میکند. مایکروسافت بخش ویژهای را برای فناوریهای هوشمندانه راهاندازی کرده است و آبی بزرگ نیز از پلتفرم شناختی خود واتسون برای کمک به دولتها و سازمانهای بزرگ استفاده میکند. گوگل نیز همچون همتایان خود در عرضه هوش مصنوعی کاملاً قدرتمند ظاهر شده است. این شرکت چندی پیش استارتآپ DeepMind را تحت تملک خود قرار داد و همچنین پلتفرم منبع باز TensorFlow را که زیرساختی مبتنی بر یادگیری ماشینی است، به صورت منبع باز در اختیار جامعه جهانی گذاشت. گوگل با این کار به طراحان و توسعهدهندگانی که تمایل دارند از الگوریتمهای یادگیری ماشینی در محصولات خود استفاده کنند اما به دلایل مختلف با محدودیت روبهرو هستند، اجازه داد به طیف گستردهای از الگوریتمها دسترسی داشته باشند. این پلتفرم اکنون میزبان حداقل 50 سرویس مختلف گوگل است.
یادگیری ماشینی از شبکههای عصبی عمیق استفاده میکند. جالب آنکه خود گوگل از این پلتفرم یادگیری ماشینی برای انجام وظایفی همچون شناسایی تصاویر در سرویس Photo، جستوجوی اطلاعات در موتور جستوجوگر این شرکت، پردازش بهتر درخواستهای ارائهشده از Google Now و مانند اینها استفاده میکند. در حقیقت گوگلی که این روزها میشناسیم، تفاوت محسوسی با گذشته دارد و بخش عمدهای از فعالیتهای این شرکت بهویژه در حوزه امنیت، با استفاده از سرویسهای یادگیری ماشینی انجام میشود. منبع باز شدن این سرویس هوشمند این ظرفیت را به وجود آورده است تا گوگل با مشارکت جامعه جهانی و با صرف کمترین هزینه، به توسعه این فناوری هوشمندانه خود بپردازد.
مقدمهای بر تانسورفلو، اندروید دنیای هوش مصنوعی
تانسورفلو کتابخانهای از فایلها است که به پژوهشگران و دانشمندان علوم کامپیوتر اجازه داده است سامانههای ادراکی را برای تجزیهوتحلیل اطلاعات طراحی کنند. سامانههایی که بر پایه این کتابخانه طراحی میشوند، میتوانند دادههای مختلفی همچون تصاویر و اصوات را تجزیه و تفسیر کنند و به کامپیوترها اجازه دهند بر مبنای این اطلاعات تصمیماتی بگیرند. این تعریف پایه یادگیری ماشینی است؛ کامپیوترهایی که قادر به درک دادهها هستند و از این دادهها در زمینه اخذ تصمیمات استفاده میکنند. به عبارت سادهتر، یادگیری ماشینی، کامپیوتر را تبدیل به موجودیت هوشمندی میکند. تانسورفلو فوقالعاده پیچیده است، به سبب آنکه بر مبنای دقت و سرعت به اکتشاف در دادهها میپردازد و به صراحت میتوان گفت در قلمرو هوش مصنوعی ابزار کارآمدی است. جزئیاتی درباره تانسورفلو وجود دارد که در این بخش به آنها میپردازیم. اولین نکتهای که در خصوص این سیستم وجود دارد، این است که این الگوریتم یادگیری ماشینی بر مبنای گرافهای جریان داده کار میکند. در این سامانه دادهها با ابعاد مختلف همراه با محاسبات ریاضی بررسی شدهاند و محاسبات ریاضی دیگری را ارائه میکنند. این بیتهای پیچیده دادهای تانسور نامیده میشوند و محاسبات ریاضی انجامشده روی این دادهها گره نامیده میشود. دادههایی که از یک گره به گره دیگر تغییر پیدا میکنند، روابط کلی حاکم بر دادهها در این سیستم را نشان میدهد. در حالی که در ظاهر چنین نمود پیدا کرده است که گوگل پلتفرم هوشمندی را در اختیار آحاد جامعه قرار داده است، اما واقعیت این است که گوگل با استفاده از این سیستم در نظر دارد حوزه کاری این سیستم را از پژوهشگران حوزه هوش مصنوعی تا شرکتهای فعال در حوزه فناوری گسترش دهد. این استراتژی دقیقاً مشابه با سیاست گوگل در حوزه اندروید اتخاذ شده است تا در نهایت تانسورفلو به اندروید دنیای هوش مصنوعی تبدیل شود.
پروفسور کریستوفر منینگ، استاد دانشگاه استنفورد، تنها بعد از گذشت سه ماه کار با این سیستم تصمیم گرفت از این سامانه هوشمند در برنامه درسی خود استفاده کند. منینگ درباره تانسورفلو گفته است: «در حالی که همگان این سامانه را با اندروید مقایسه کردهاند، اما به اعتقاد من این سامانه شباهت زیادی به سرویس جیمیل دارد. سرویسهای ایمیل گوناگونی این روزها در دنیای اینترنت وجود دارند، اما بسیاری از کاربران به دلیل رابط کاربری ساده و خدمات متعددی که جیمیل ارائه میکند، تمایل دارند از این سرویس استفاده کنند. تا قبل از منبع باز شدن تانسورفلو از سوی گوگل، کتابخانههای یادگیری ماشین متعددی در اختیار مردم قرار داشت. اما همه این کتابخانهها در یک ویژگی اتفاق نظر داشتند؛ همه آنها را گروه محدودی از دانشگاهها یا پژوهشگران فعال در حوزه هوش مصنوعی طراحی کرده بودند.» در حالی که سامانههای مشابهی همچون Torch یا Theano وجود دارند که تعداد اندکی از متخصصان آنها را بهروزرسانی میکنند و بر قدرتشان افزوده میشود، اما گستردگی، قابلیتها و سرعتی که این چنین سامانههایی در اختیار مردم قرار میدهند، بههیچوجه با کاری که متخصصان گوگل انجام میدهند، قابل مقایسه نیست.
منینگ در این باره گفته است: «نظارت و بهینهسازی کدها در شبکههای عصبی، کار بسیار طاقتفرسا و وقتگیری است، با وجود این گوگل تصمیم گرفته است این شبکه بسیار قدرتمند را به صورت منبع باز در اختیار همگان قرار دهد.» جف دین، از مهندسان شرکت گوگل که در زمینه طراحی و توسعه تانسورفلو ایفای نقش داشته، گفته است: «گوگل در بسیاری از فعالیتهای مهم خود از این سامانه استفاده میکند، اما زمانی که طیف گستردهای از متخصصان سراسر جهان در حوزههای مختلف از این سیستم استفاده کنند، آنگاه کارکرد واقعی خود را نشان خواهد داد. ایدهای که در پس زمینه طراحی تاسورفلو قرار دارد، مربوط به نظریهای است که گروهی از متخصصان گوگل ارائه دادهاند؛ ایدهای که میگوید باید محصولی طراحی کرد که جنبه کاربردی داشته باشد.» او در بخش دیگری از صحبتهای خود گفت: «ما در گام نخست امیدوار هستیم تا شتاب تحقیقات و پیادهسازی سامانههایی در حوزه یادگیری ماشین به واسطه این سیستم بیش از پیش افزایش یابد. متخصصانی که در حوزه هوش مصنوعی فعالیت دارند، در ارائه نظریههای کاربردی کاملاً پویا هستند؛ با وجود این، تلاشهایی که در زمینه کدنویسی و پیادهسازی این ایدهها انجام گرفته، به اندازه ارائه ایدهها مطلوب نبوده است.» رویکرد دیگری که گوگل با منبع باز کردن این سامانه در نظر دارد به آن دست پیدا کند، متقاعد ساختن افراد و شرکتهای فعال در حوزه هوش مصنوعی است تا دستاوردهای خود در این حوزه را با گوگل به اشتراک بگذارد. با نگاهی به بسته تانسورفلو متوجه خواهید شد که گوگل این سامانه را با طیف گستردهای از ابزارها که در حوزه هوش مصنوعی موردنیاز کاربران است، در اختیار آنها قرار داده است. با توجه به اینکه گوگل این سامانه را همراه با گواهی آپاچی 2.0 عرضه کرده است، در نتیجه افراد و سازمانها در کاربردهای تجاری نیز میتوانند از این سرویس استفاده کنند. جالب اینکه کاربران میتوانند تانسورفلو را از طریق کامپیوتر دسکتاپ یا لپتاپ خود کامپایل کرده و از طریق تلفن هوشمند اندرویدی خود از آن استفاده کنند. منینگ در این باره گفته است: «مزیت تانسورفلو این است که میتوان آن را از روی تلفنهای هوشمند اندرویدی اجرا کرد. این بزرگترین برتری تانسورفلو بر الگوریتمهای یادگیری ماشینی متن باز است.»
در قلب آزمایشگاه هوش مصنوعی گوگل چه میگذرد؟
در حالی که گوگل نزدیک به سه سال زمان صرف طراحی این سیستم و آمادهسازی آن برای عرضه عمومی کرده است، اما در نهایت در نظر دارد آن را به یک سامانه هوش مصنوعی واقعی تبدیل کند تا بتوان از این سامانه در ماشینهای بزرگ و حساس استفاده کرد. طراحی این سیستم به گونهای بوده است که حتی مهندسان داخلی گوگل نیز میتوانند آن را مطابق با نیازهای خود در زمینه طراحی برنامههای کاربردی بازطراحی کنند. این شبکه عمیق عصبی بسیار انعطافپذیر است و حدود صد گروه در خود گوگل بر مبنای تکنیکهای مبتنی بر یادگیری ماشینی در حال توسعه آن هستند. ساندار پیچای، درباره این سامانه عنوان کرده است: «یادگیری ماشینی کانون تحولاتی است که در سرویسهای ما در حال رخ دادن است و ما را برای بازنگری کلی درباره کارکرد سامانههایمان به تفکر واداشته است. ما از این سامانه برای محصولات و سرویسهایی همچون جستوجوگر، یوتیوب، گوگلپلی و امنیت فروشگاه گوگل استفاده میکنیم و به مرور زمان این سامانه را در تمام سرویسهای خود پیادهسازی خواهیم کرد.» جان جیاناندرا، قائممقام مهندسی اینترنت، سیستمی را که گوگل در حال توسعه آن است، مدلی جایگذاریشده نامیده است.
در حالی که گوگل سامانه هوش مصنوعی خود را به صورت منبع باز در اختیار کاربران قرار داده است، هیچکس درباره فرایند توسعه آن اطلاعاتی ندارد. در ساختمان مرکزی گوگل که 325 هزار مترمربع است، تمامی گروههای نرمافزاری به نوعی در حال استفاده از سیستم هوش مصنوعی گوگل هستند. در حالی که افراد مستقر در گروههای مختلف از سامانه هوش مصنوعی استفاده میکنند، مهندسان ویژه و البته کمتردیدهشدهای نیز وجود دارند که وظیفه برطرف کردن ایرادات و توسعه این سامانه بر عهده آنها است. هرگونه فعالیتی که این افراد انجام دهند، مستقیماً بر عملکرد سرویسهای گوگل تأثیرگذار خواهد بود. معمولاً پروژههایی که بر مبنای این سامانه هوشمند طراحی میشوند، این شانس را دارند که روانه بازار شوند؛ سیستم دستخط کاربران از جمله این پروژهها به شمار میرود. اما اگر پروژهای این شانس را نداشته باشد که مستقلاً وارد بازار شود، با برنامه کاربردی یا سرویس دیگری ادغام شده و عرضه میشود. در واحد تحقیقاتی این شرکت افراد بر اساس سلایقشان در گروههای مختلفی قرار میگیرند. گروهی از متخصصان در حوزه بینایی ماشین، گروهی در حوزه ادارکپذیری، گروهی در حوزه صداشناسی و… به کار گرفته میشوند. شیوه کار به این صورت است که این گروه حاصل تحقیقات خود را در اختیار گروههای توسعه قرار میدهند تا این تحقیقات را اجرایی کرده و به محصول تبدیل کنند. جالب آنکه در گوگل بیش از هزار متخصص صرفاً برای تحقیق درباره کاربردهای هوش ماشینی و یادگیری ماشین در حوزههای مختلف مشغول به فعالیت هستند. این افراد نتیجه تحقیقات خود را در قالب مفاهیم نظری ارائه کرده و این ایدهها را در نهایت به نمونهای عملی و کاربردی در قالب یک سرویس تبدیل میکنند.
صدایی از آینده به گوش میرسد
در میان سرویسها و محصولات مختلفی که گوگل ارائه کرده است، بدون شک جستوجوی صوتی، آینده روشنی دارد. این سرویس که در قالب آیکونی در سمت راست کادر جستوجو قرار دارد، به کاربر اجازه میدهد با استفاده از آیکون مربوط به میکروفون جستوجوی خود را انجام دهد. شیوه کار ساده است؛ کافی است آن را فعال کنید و برای مثال عباراتی به زبان آورید، مشاهده خواهید کرد که این سیستم با چه دقتی کار میکند.
در حالی که سیری اپل در این زمینه قدرتمند است، اما جستوجوی صوتی گوگل اکنون به عنوان دومین راهکار برای دسترسی به مخزن دادههای گوگل استفاده میشود.
گوگل در این خصوص گفته است: «آمارهای ما نشان میدهد که جستوجوی مبتنی بر دستگاههای همراه بهویژه در ایالات متحده افزایش چشمگیری داشته و جستوجوی مبتنی بر کامپیوترهای دستکاپ را پشت سر گذاشته است. همچنین میزان جستوجوی صوتی از طریق تبلت و تلفنهای هوشمند در ایالات متحده در سال گذشته 50درصد رشد داشته است. با این حال هنوز هم بخش عمدهای از کاربران با این مکانیزم جستوجو آشنا نیستند.»
فرانسیز بوفیز محقق ارشد گوگل گفته است: «زمانیکه کار خود را در زمینه توسعه سامانههای تشخیص صوت آغاز کردیم، تعداد محدودی از کاربران از آن استفاده میکردند. اما به مرور زمان که این ویژگی پیشرفت کرد، بر تعداد این افراد افزوده شد و اکنون طیف گستردهای از کاربران به این سیستم اعتماد دارند. ما موتور قبلی تشخیص صوت را کنار گذاشتهایم و از سیستم مبتنی بر شبکههای عصبی برای تشخیص صدای کاربران و دستورات صوتی استفاده میکنیم. در حال حاضر بیش از میلیونها فایل صوتی متعلق به صدای کاربران را در اختیار داریم. هر زمان کاربری از مکانیزم جستوجوی صوتی استفاده میکند، صدای او در سرورهای گوگل بارگذاری میشود. اگر کاربر اجازه دهد از صدای او استفاده شود، گوگل از این صدا برای آموزش بهتر سیستم خود استفاده میکند.»
هدف نهایی چیست؟
هدف نهایی بهرهمندی از سامانههای مبتنی بر شبکههای عصبی، پیادهسازی هوشی مشابه با هوش انسانی است. برای مثال سامانههایی که این روزها در زمینه ترجمه فعال هستند، از ترجمه لغتبهلغت در کنار یک دستورالعمل گرامری استفاده میکنند. همین موضوع باعث میشود تا ترجمه آنها نه تنها هیچگونه شباهتی به نمونه انسانی نداشته باشد، بلکه بیشتر جنبه کامپیوتری پیدا کند.
دانشمندان این مشکل را به دلیل ضعف سختافزاری شبکههای عصبی میدانند. این شبکهها در عمل تفاوت فاحشی با مغز انسان دارند. با این همه کارشناسان اعلام کردهاند که پیشرفتهای پنج سال اخیر واقعاً شگفتانگیز بودهاند و آینده روشنی را پیش روی هوش مصنوعی متصور شدهاند. حال باید دید با توجه به پیشرفتهای محاسبات کوانتومی و تلفیق آن با هوش مصنوعی، این فناوری میتواند مسائل ناشناخته امروز ما را حل کند و به توسعه دانش بپردازد؟ آیا هوش مصنوعی این ظرفیت را پیدا خواهد کرد تا به صورت مستقل از عامل انسانی فعالیتهای خود را انجام دهد؟
==============================
منبع شبکه