صدای هوش گوگل

در نوامبر سال 2007، گوگل فعالیت خود را در زمینه تلفن‌های هوشمند با عرضه سیستم‌عامل اندروید آغاز کرد. این کار با هدف سلطه بر بازار تلفن‌های هوشمند به مرحله اجرا درآمد. اکنون که نه سال از این تاریخ می‌گذرد، بخش عمده‌ای از بازار – حدود 80 درصد- در اختیار این پلتفرم قرار دارد. حال گوگل در نظر دارد همین استراتژی را برای هوش مصنوعی نیز استفاده کند و با تلفیق این فناوری با فناوری‌هایی همچون رایانش کوانتومی، رهبری بازار را در زمینه عرضه محصولات هوشمند به دست آورد. در این مقاله به فعالیت‌هایی که گوگل در این زمینه داشته است، می‌پردازیم.

صدای هوش گوگل

محاسبات شناختی یا در مفهومی کلی‌تر هوش مصنوعی، از جمله فناوری‌های است که شرکت‌های بزرگ سیلیکون‌ولی به آن توجه دارند. اپل، استارت‌آپ‌های فعال در حوزه هوش مصنوعی را یکی بعد از دیگری تصاحب می‌کند. مایکروسافت بخش ویژه‌ای را برای فناوری‌های هوشمندانه راه‌اندازی کرده است و آبی بزرگ نیز از پلتفرم شناختی خود واتسون برای کمک به دولت‌ها و سازمان‌های بزرگ استفاده می‌کند. گوگل نیز همچون همتایان خود در عرضه هوش مصنوعی کاملاً قدرتمند ظاهر شده است. این شرکت چندی پیش استارت‌آپ DeepMind را تحت تملک خود قرار داد و همچنین پلتفرم منبع باز TensorFlow را که زیرساختی مبتنی بر یادگیری ماشینی است، به صورت منبع باز در اختیار جامعه جهانی گذاشت. گوگل با این کار به طراحان و توسعه‌دهندگانی که تمایل دارند از الگوریتم‌های یادگیری ماشینی در محصولات خود استفاده کنند اما به دلایل مختلف با محدودیت روبه‌رو هستند، اجازه داد به طیف گسترده‌ای از الگوریتم‌ها دسترسی داشته باشند. این پلتفرم اکنون میزبان حداقل 50 سرویس مختلف گوگل است.

یادگیری ماشینی از شبکه‌های عصبی عمیق استفاده می‌کند. جالب آنکه خود گوگل از این پلتفرم یادگیری ماشینی برای انجام وظایفی همچون شناسایی تصاویر در سرویس Photo، جست‌وجوی اطلاعات در موتور جست‌وجوگر این شرکت، پردازش بهتر درخواست‌های ارائه‌شده از Google Now و مانند این‌ها استفاده می‌‌کند. در حقیقت گوگلی که این روزها می‌شناسیم، تفاوت محسوسی با گذشته دارد و بخش عمده‌ای از فعالیت‌های این شرکت به‌ویژه در حوزه امنیت، با استفاده از سرویس‌های یادگیری ماشینی انجام می‌شود. منبع باز شدن این سرویس هوشمند این ظرفیت را به وجود آورده است تا گوگل با مشارکت جامعه جهانی و با صرف کمترین هزینه، به توسعه این فناوری هوشمندانه خود بپردازد.

مقدمه‌ای بر تانسورفلو، اندروید دنیای هوش مصنوعی
تانسورفلو کتابخانه‌ای از فایل‌ها است که به پژوهشگران و دانشمندان علوم کامپیوتر اجازه داده است سامانه‌های ادراکی را برای تجزیه‌وتحلیل اطلاعات طراحی کنند. سامانه‌هایی که بر پایه این کتابخانه طراحی می‌شوند، می‌توانند داده‌های مختلفی همچون تصاویر و اصوات را تجزیه و تفسیر کنند و به کامپیوترها اجازه دهند بر مبنای این اطلاعات تصمیماتی بگیرند. این تعریف پایه یادگیری ماشینی است؛ کامپیوترهایی که قادر به درک داده‌ها هستند و از این داده‌ها در زمینه اخذ تصمیمات استفاده می‌کنند. به عبارت ساده‌تر، یادگیری ماشینی، کامپیوتر را تبدیل به موجودیت هوشمندی می‌کند. تانسورفلو فوق‌العاده پیچیده است، به سبب آنکه بر مبنای دقت و سرعت به اکتشاف در داده‌ها می‌پردازد و به صراحت می‌توان گفت در قلمرو هوش مصنوعی ابزار کارآمدی است. جزئیاتی درباره تانسورفلو وجود دارد که در این بخش به آن‌ها می‌پردازیم. اولین نکته‌ای که در خصوص این سیستم وجود دارد، این است که این الگوریتم یادگیری ماشینی بر مبنای گراف‌های جریان داده‌ کار می‌کند. در این سامانه داده‌ها با ابعاد مختلف همراه با محاسبات ریاضی بررسی شده‌اند و محاسبات ریاضی دیگری را ارائه می‌کنند. این بیت‌های پیچیده داد‌ه‌ای تانسور نامیده ‌می‌شوند و محاسبات ریاضی انجام‌شده روی این داده‌ها گره نامیده می‌شود. داده‌هایی که از یک گره به گره دیگر تغییر پیدا می‌کنند، روابط کلی حاکم بر داده‌ها در این سیستم را نشان می‌دهد. در حالی که در ظاهر چنین نمود پیدا کرده است که گوگل پلتفرم هوشمندی را در اختیار آحاد جامعه قرار داده است، اما واقعیت این است که گوگل با استفاده از این سیستم در نظر دارد حوزه کاری این سیستم را از پژوهشگران حوزه هوش مصنوعی تا شرکت‌های فعال در حوزه فناوری گسترش دهد. این استراتژی دقیقاً مشابه با سیاست گوگل در حوزه اندروید اتخاذ شده است تا در نهایت تانسورفلو به اندروید دنیای هوش مصنوعی تبدیل شود.

پروفسور کریستوفر منینگ، استاد دانشگاه استنفورد، تنها بعد از گذشت سه ماه کار با این سیستم تصمیم گرفت از این سامانه هوشمند در برنامه درسی خود استفاده کند. منینگ درباره تانسورفلو گفته است: «در حالی که همگان این سامانه را با اندروید مقایسه کرده‌اند، اما به اعتقاد من این سامانه شباهت زیادی به سرویس جی‌میل دارد. سرویس‌های ایمیل گوناگونی این روزها در دنیای اینترنت وجود دارند، اما بسیاری از کاربران به دلیل رابط کاربری ساده و خدمات متعددی که جی‌میل ارائه می‌کند، تمایل دارند از این سرویس استفاده کنند. تا قبل از منبع باز شدن تانسورفلو از سوی گوگل، کتابخانه‌های یادگیری ماشین متعددی در اختیار مردم قرار داشت. اما همه این کتابخانه‌ها در یک ویژگی اتفاق نظر داشتند؛ همه آن‌ها را گروه محدودی از دانشگاه‌ها یا پژوهشگران فعال در حوزه هوش مصنوعی طراحی کرده بودند.» در حالی که سامانه‌های مشابهی همچون Torch یا Theano وجود دارند که تعداد اندکی از متخصصان آن‌ها را به‌روزرسانی می‌کنند و بر قدرتشان افزوده می‌شود، اما گستردگی، قابلیت‌ها و سرعتی که این چنین سامانه‌هایی در اختیار مردم قرار می‌دهند، به‌هیچ‌وجه با کاری که متخصصان گوگل انجام می‌دهند، قابل مقایسه نیست.
منینگ در این باره گفته است: «نظارت و بهینه‌سازی کدها در شبکه‌های عصبی، کار بسیار طاقت‌فرسا و وقت‌گیری است، با وجود این گوگل تصمیم گرفته است این شبکه بسیار قدرتمند را به صورت منبع باز در اختیار همگان قرار دهد.» جف دین، از مهندسان شرکت گوگل که در زمینه طراحی و توسعه تانسورفلو ایفای نقش داشته، گفته است: «گوگل در بسیاری از فعالیت‌های مهم خود از این سامانه استفاده می‌کند، اما زمانی که طیف گسترده‌ای از متخصصان سراسر جهان در حوزه‌های مختلف از این سیستم استفاده کنند، آن‌گاه کارکرد واقعی خود را نشان خواهد داد. ایده‌ای که در پس زمینه طراحی تاسورفلو قرار دارد، مربوط به نظریه‌ای است که گروهی از متخصصان گوگل ارائه داده‌اند؛ ایده‌ای که می‌گوید باید محصولی طراحی کرد که جنبه کاربردی داشته باشد.» او در بخش دیگری از صحبت‌های خود گفت: «ما در گام نخست امیدوار هستیم تا شتاب تحقیقات و پیاده‌سازی سامانه‌هایی در حوزه یادگیری ماشین به واسطه این سیستم بیش از پیش افزایش یابد. متخصصانی که در حوزه هوش مصنوعی فعالیت دارند، در ارائه نظریه‌های کاربردی کاملاً پویا هستند؛ با وجود این، تلاش‌هایی که در زمینه کدنویسی و پیاده‌سازی این ایده‌ها انجام گرفته، به اندازه ارائه ایده‌ها مطلوب نبوده است.» رویکرد دیگری که گوگل با منبع باز کردن این سامانه در نظر دارد به آن دست پیدا کند، متقاعد ساختن افراد و شرکت‌های فعال در حوزه هوش مصنوعی است تا دستاوردهای خود در این حوزه را با گوگل به اشتراک بگذارد. با نگاهی به بسته تانسورفلو متوجه خواهید شد که گوگل این سامانه را با طیف گسترده‌ای از ابزارها که در حوزه هوش مصنوعی موردنیاز کاربران است، در اختیار آن‌ها قرار داده است. با توجه به اینکه گوگل این سامانه را همراه با گواهی آپاچی 2.0 عرضه کرده است، در نتیجه افراد و سازمان‌ها در کاربردهای تجاری نیز می‌توانند از این سرویس استفاده کنند. جالب اینکه کاربران می‌توانند تانسورفلو را از طریق کامپیوتر دسکتاپ یا لپ‌تاپ خود کامپایل کرده و از طریق تلفن هوشمند اندرویدی خود از آن استفاده کنند. منینگ در این باره گفته است: «مزیت تانسورفلو این است که می‌توان آن را از روی تلفن‌های هوشمند اندرویدی اجرا کرد. این بزرگ‌ترین برتری تانسورفلو بر الگوریتم‌های یادگیری ماشینی متن باز است.»

در قلب آزمایشگاه هوش مصنوعی گوگل چه می‌گذرد؟
در حالی که گوگل نزدیک به سه سال زمان صرف طراحی این سیستم و آماده‌سازی آن برای عرضه عمومی کرده است، اما در نهایت در نظر دارد آن را به یک سامانه هوش مصنوعی واقعی تبدیل کند تا بتوان از این سامانه در ماشین‌های بزرگ و حساس استفاده کرد. طراحی این سیستم به گونه‌ای بوده است که حتی مهندسان داخلی گوگل نیز می‌توانند آن را مطابق با نیازهای خود در زمینه طراحی برنامه‌های کاربردی بازطراحی کنند. این شبکه عمیق عصبی بسیار انعطاف‌پذیر است و حدود صد گروه در خود گوگل بر مبنای تکنیک‌های مبتنی بر یادگیری ماشینی در حال توسعه آن هستند. ساندار پیچای، درباره این سامانه عنوان کرده است: «یادگیری ماشینی کانون تحولاتی است که در سرویس‌های ما در حال رخ دادن است و ما را برای بازنگری کلی درباره کارکرد سامانه‌هایمان به تفکر واداشته است. ما از این سامانه برای محصولات و سرویس‌هایی همچون جست‌وجوگر، یوتیوب، گوگل‌پلی و امنیت فروشگاه گوگل استفاده می‌کنیم و به مرور زمان این سامانه را در تمام سرویس‌های خود پیاده‌سازی خواهیم کرد.» جان جیاناندرا، قائم‌مقام مهندسی اینترنت، سیستمی را که گوگل در حال توسعه آن است، مدلی جای‌گذاری‌شده نامیده است.

در حالی که گوگل سامانه هوش مصنوعی خود را به صورت منبع باز در اختیار کاربران قرار داده است، هیچ‌کس درباره فرایند توسعه آن اطلاعاتی ندارد. در ساختمان مرکزی گوگل که 325 هزار مترمربع است، تمامی گروه‌های نرم‌افزاری به نوعی در حال استفاده از سیستم هوش مصنوعی گوگل هستند. در حالی که افراد مستقر در گروه‌های مختلف از سامانه هوش مصنوعی استفاده می‌کنند، مهندسان ویژه و البته کمتردیده‌شده‌ای نیز وجود دارند که وظیفه برطرف کردن ایرادات و توسعه این سامانه بر عهده آن‌ها است. هرگونه فعالیتی که این افراد انجام دهند، مستقیماً بر عملکرد سرویس‌های گوگل تأثیرگذار خواهد بود. معمولاً پروژه‌هایی که بر مبنای این سامانه هوشمند طراحی می‌شوند، این شانس را دارند که روانه بازار شوند؛ سیستم دست‌خط کاربران از جمله این پروژه‌ها به شمار می‌رود. اما اگر پروژه‌ای این شانس را نداشته باشد که مستقلاً وارد بازار شود، با برنامه کاربردی یا سرویس دیگری ادغام شده و عرضه می‌شود. در واحد تحقیقاتی این شرکت افراد بر اساس سلایقشان در گروه‌های مختلفی قرار می‌گیرند. گروهی از متخصصان در حوزه بینایی ماشین، گروهی در حوزه ادارک‌پذیری، گروهی در حوزه صداشناسی و… به کار گرفته می‌شوند. شیوه کار به این صورت است که این گروه حاصل تحقیقات خود را در اختیار گروه‌های توسعه قرار می‌دهند تا این تحقیقات را اجرایی کرده و به محصول تبدیل کنند. جالب آنکه در گوگل بیش از هزار متخصص صرفاً برای تحقیق درباره کاربردهای هوش ماشینی و یادگیری ماشین در حوزه‌های مختلف مشغول به فعالیت هستند. این افراد نتیجه تحقیقات خود را در قالب مفاهیم نظری ارائه کرده و این ایده‌ها را در نهایت به نمونه‌ای عملی و کاربردی در قالب یک سرویس تبدیل می‌کنند.

صدایی از آینده به گوش می‌رسد
در میان سرویس‌ها و محصولات مختلفی که گوگل ارائه کرده است، بدون شک جست‌وجوی صوتی، آینده روشنی دارد. این سرویس که در قالب آیکونی در سمت راست کادر جست‌وجو قرار دارد، به کاربر اجازه می‌دهد با استفاده از آیکون مربوط به میکروفون جست‌وجوی خود را انجام دهد. شیوه کار ساده است؛ کافی است آن را فعال کنید و برای مثال عباراتی به زبان آورید، مشاهده خواهید کرد که این سیستم با چه دقتی کار می‌کند.
در حالی که سیری اپل در این زمینه قدرتمند است، اما جست‌وجوی صوتی گوگل اکنون به عنوان دومین راهکار برای دسترسی به مخزن داده‌های گوگل استفاده می‌شود.
گوگل در این خصوص گفته است: «آمارهای ما نشان می‌دهد که جست‌وجوی مبتنی بر دستگاه‌های همراه به‌ویژه در ایالات متحده افزایش چشمگیری داشته و جست‌وجوی مبتنی بر کامپیوترهای دستکاپ را پشت سر گذاشته است. همچنین میزان جست‌وجوی صوتی از طریق تبلت و تلفن‌های هوشمند در ایالات متحده در سال گذشته 50درصد رشد داشته است. با این حال هنوز هم بخش عمده‌ای از کاربران با این مکانیزم جست‌وجو آشنا نیستند.»
فرانسیز بوفیز محقق ارشد گوگل گفته است: «زمانی‌که کار خود را در زمینه توسعه سامانه‌های تشخیص صوت آغاز کردیم، تعداد محدودی از کاربران از آن استفاده می‌کردند. اما به مرور زمان که این ویژگی پیشرفت کرد، بر تعداد این افراد افزوده شد و اکنون طیف گسترده‌ای از کاربران به این سیستم اعتماد دارند. ما موتور قبلی تشخیص صوت را کنار گذاشته‌ایم و از سیستم مبتنی بر شبکه‌های عصبی برای تشخیص صدای کاربران و دستورات صوتی استفاده می‌کنیم. در حال حاضر بیش از میلیون‌ها فایل صوتی متعلق به صدای کاربران را در اختیار داریم. هر زمان کاربری از مکانیزم جست‌وجوی صوتی استفاده می‌کند، صدای او در سرورهای گوگل بارگذاری می‌شود. اگر کاربر اجازه دهد از صدای او استفاده شود، گوگل از این صدا برای آموزش بهتر سیستم خود استفاده می‌کند.»

هدف نهایی چیست؟
هدف نهایی بهره‌مندی از سامانه‌های مبتنی بر شبکه‌های عصبی، پیاده‌سازی هوشی مشابه با هوش انسانی است. برای مثال سامانه‌هایی که این روزها در زمینه ترجمه فعال هستند، از ترجمه لغت‌به‌لغت در کنار یک دستورالعمل گرامری استفاده می‌کنند. همین موضوع باعث می‌شود تا ترجمه آن‌ها نه تنها هیچ‌گونه شباهتی به نمونه انسانی نداشته باشد، بلکه بیشتر جنبه کامپیوتری پیدا کند.
دانشمندان این مشکل را به دلیل ضعف سخت‌افزاری شبکه‌های عصبی می‌دانند. این شبکه‌ها در عمل تفاوت فاحشی با مغز انسان دارند. با این همه کارشناسان اعلام کرده‌اند که پیشرفت‌های پنج سال اخیر واقعاً شگفت‌انگیز بوده‌اند و آینده روشنی را پیش روی هوش مصنوعی متصور شده‌اند. حال باید دید با توجه به پیشرفت‌های محاسبات کوانتومی و تلفیق آن با هوش مصنوعی، این فناوری می‌تواند مسائل ناشناخته امروز ما را حل کند و به توسعه دانش بپردازد؟ آیا هوش مصنوعی این ظرفیت را پیدا خواهد کرد تا به صورت مستقل از عامل انسانی فعالیت‌های خود را انجام دهد؟

==============================

منبع شبکه

هاست 500 مگابایت + دامین IR فقط 18000 تومان

جهت تبادل گفتگو و حل مشکلات در باره این موضوع , کلیک کنید

جهت ورود به تالار گفتمان سایت کلیک کنید

صدای هوش گوگل

دیدگاهتان را بنویسید لغو پاسخ