تحولات منطقه

اگر پیش از این تجربه کار با پلتفرم مکالمه هوش مصنوعی «چت جی‌پی‌تی» ChatGPT برای شما لذت‌بخش بوده، با به روزرسانی جدیدی که شرکت سازنده آن یعنی «اوپن اِی‌آی» OpenAI به وجود آورده، این فناوری قرار است بسیار هیجان‌انگیزتر و مفیدتر شود.

اضافه شدن توانایی تعامل بلادرنگ و درک محیط به هوش مصنوعی / یک قدم دیگر به سمت تعبیر فیلم‌های علمی‌تخیلی!
زمان مطالعه: ۴ دقیقه

به گزارش قدس آنلاین، این شرکت روز دوشنبه آخرین مدل زبان بزرگ هوش مصنوعی خود را معرفی کرد که ChatGPT را هوشمندتر و استفاده از آن را آسان‌تر می‌کند. این مدل جدید که GPT-۴o نام دارد، مدل قبلی GPT-۴ این شرکت که بیش از یک سال پیش عرضه شد را به روز می‌کند. خبر خوب برای کاربران ایرانی که بسیاری از آن‌ها توانایی خرید حق اشتراک مدل پولی ChatGPT را ندارند این است که پیشرفته‌ترین فناوری این شرکت، در نسخه رایگان آن البته به صورت محدود قابل استفاده خواهد بود.

حس خوب مکالمه در زمان واقعی

با وجود همه توانایی‌های نسخه قبلی این فناوری، اما تاخیر حتی چند ثانیه‌ای این بات هوش مصنوعی در دادن پاسخ‌های متنی و صوتی خود، حس واقعی صحبت با یک موجود زنده را به کاربران نمی‌داد اما  براساس کنفرانسی که روز دوشنبه این شرکت برگزار کرد، GPT-۴o به طور موثری ChatGPT را به یک دستیار شخصی دیجیتال تبدیل می‌کند که می‌تواند بلادرنگ در زمان واقعی مکالمات گفتاری را انجام دهد. این فناوری همچنین می‌تواند با استفاده از متن و «دید» ای که شما با دادن دسترسی به دوربین ابزار خود (گوشی هوشمند، تبلت، لپ تاپ و کامپیوتر شخصی) به آن می‌دهید با شما و محیط اطراف تعامل داشته باشد، به این معنی که می‌تواند ویدیوها، عکس‌ها، اسناد یا نمودارهای آپلود شده توسط کاربران را مشاهده کرده و در مورد آنها تحلیل داشته و با شما گفتگو کند.

میرا موراتی، مدیر ارشد فناوری OpenAI می‌گوید که نسخه به روز شده ChatGPT اکنون دارای قابلیت های حافظه نیز خواهد بود، به این معنی که می تواند از مکالمات قبلی با کاربران درس بگیرد و همچنین می‌تواند ترجمه بلادرنگ انجام دهد. موراتی در جریان نمایش زنده از دفتر مرکزی این شرکت در سانفرانسیسکو گفت: «این اولین باری است که ما واقعاً گام بزرگی در زمینه سهولت استفاده از فناوری هوش مصنوعی برمی‌داریم. این تعامل بسیار طبیعی‌تر و بسیار آسان‌تر می‌شود.»

هیچکس عقب نمی‌کشد

نسخه جدید در حالی منتشر می‌شود که OpenAI به دنبال جلوتر بودن از رقابت رو به رشد در مسابقه هوش مصنوعی بین شرکت‌های فناوری است. رقبایی از جمله مایکروسافت، گوگل، اپل و مِتا برای ساختن مدل‌های زبان بزرگ و قدرتمندی کار می‌کنند که ربات‌های گفتگو را تقویت کرده و می‌تواند برای آوردن فناوری هوش مصنوعی به محصولات مختلف دیگر استفاده شود؛ تا جایی که شرکت گوگل برای عقب نشان ندادن خود، فردای روز همایش شرکت OpenAI کنفرانس خود را برگزار و از نوآوری‌های جدید این شرکت در این حوزه‌ها و ابزار هوش مصنوعی مختص به گوگل با نام «جِمینای» سخن گفت که آن نیز یک ابزار چندوجهی است، به این معنی که می تواند متن، تصویر و صدا را تفسیر و تولید و با محیط تعامل داشته باشد. همینطور اپل کنفرانس جهانی توسعه‌دهندگان خود را ماه آینده برگزار می‌کند که قطعاً شامل راه‌های جدید این شرکت برای ترکیب هوش مصنوعی در نسخه‌های بعدی آیفون یا iOS است. در این میان مایکروسافت نه تنها از برگزاری همایش OpenAI ناراحت نشده بلکه خوشحال هم هست، چون آن‌ها میلیاردها دلار در OpenAI سرمایه‌گذاری کرده‌اند تا فناوری هوش مصنوعی این شرکت را در محصولات خود قرار دهند.

همه ما واکین فنیکس هستیم!

در کنفرانس برگزار شده توسط مدیران OpenAI، آن‌ها یک مکالمه گفتاری با ChatGPT برای نشان دادن توانایی‌های آن برای دریافت دستورالعمل‌های بی‌درنگ برای حل مسائل ریاضی، گفتن یک داستان قبل از خواب توسط او و دریافت مشاوره صوتی برای کدنویسی را برای عموم نشان دادند. ChatGPT قادر بود با فرمان مخاطب با صدایی طبیعی و با صدای انسان و همچنین با صدای روبات صحبت کند. این ابزار همچنین قادر بود به تصویر یک نمودار نگاه کرده و در مورد آن بحث کند. آنها همچنین مدلی را نشان دادند که این ابزار قادر بود احساسات کاربران را تشخیص دهد. حتی در یک مورد، وقتی یکی از مدیران از او راهنمایی برای آرام شدن خواست، به او پیشنهاد کرد چند نفس عمیق بکشد و به شکل تنفس او گوش داد و وقتی آن مدیر اجرایی از عمد تند تند نفس ‌زد با او شوخی کرد که «تو جاروبرقی نیستی، آرام‌تر نفس بکش»!

قضیه آنجایی جالب‌تر می‌شد که صدای زن به کار رفته در ChatGPT به طرز قابل توجهی شبیه به صدای اسکارلت جوهانسون در فیلم «او» یا Her بود. فیلمی محصول سال ۲۰۱۳ که در آن مردی با بازی واکین فنیکس عاشق همراه صوتی هوش مصنوعی خود با صدای جوهانسون می‌شود!

ChatGPT همچنین می‌توانست با ترجمه بلادرنگ و پاسخ خودکار به چندین زبان مکالمه داشته باشد. به گفته OpenAI، این ابزار اکنون از بیش از ۵۰ زبان پشتیبانی می‌کند. سَم آلتمن، مدیر عامل OpenAI در یک پست پس از این رونمایی گفت: «این حالت جدید صدا (و ویدیو) بهترین رابط کامپیوتری است که من تا به حال استفاده کرده‌ام. احساس هوش مصنوعی به تصویر کشیده شده در فیلم‌ها را به من می‌دهد و هنوز برای من کمی تعجب‌آور است که این یک چیز واقعی باشد. رسیدن به زمان پاسخ و بیان در سطح انسانی تغییر بزرگی محسوب می‌شود.»

رایگان اما نه آنچنان!

این فناوری و ویژگی‌های به روز شده آن قرار است در ماه‌های آینده در ChatGPT عرضه شوند. کاربران رایگان ChatGPT قبل از اینکه ابزار به طور خودکار به مدل قدیمی GPT-۳.۵ برگردد، قابلیت انجام تعداد محدودی تعامل با مدل جدید GPT-۴o خواهند داشت. کاربرانی که برای اشتراک پول پرداخت کرده‌اند هم با آخرین مدل به تعداد بیشتری پیام دسترسی خواهند داشت.

OpenAI قبلاً اعلام کرده بود که بیش از ۱۰۰ میلیون نفر در سراسر جهان در حال حاضر از ChatGPT استفاده می‌کنند، اما یک تجربه به روز توسط ChatGPT و توانایی تعامل با آن در کامپیوتر شخصی و از طریق مکالمات صوتی بهبودیافته می‌تواند به افراد بیشتر دلیلی برای استفاده از این فناوری را بدهد. این حرکت‌های نوآورانه در زمانی انجام می‌شود که ادغام هوش مصنوعی در محصولات پرمصرف گوگل و متا، مانند اینستاگرام و دستیار گوگل، ممکن است فناوری این شرکت‌ها را به طور گسترده‌تر و آسان‌تری در دسترس عموم قرار دهد.

امیرمحمد سلطانپور

برچسب‌ها

نظر شما

شما در حال پاسخ به نظر «» هستید.