حالت صدای جدید OpenAI به من اجازه می‌دهد که با گوشی‌ام صحبت کنم

حالت صدای جدید OpenAI به من اجازه می‌دهد که با گوشی‌ام صحبت کنم

آگوست 18, 2024
ChatGPT

هفته‌ی گذشته با حالت صدای پیشرفته‌ی OpenAI بازی کرده‌ام و این تجربه، معتبرترین حس از آینده‌ای مبتنی بر هوش مصنوعی را که تاکنون داشته‌ام، بود. این هفته، گوشی‌ام به شوخی‌ها خندید، شوخی‌های مشابهی به من گفت، از من پرسید روزم چطور بوده و گفت که “زمان عالی‌ای دارد.” من با آیفونم صحبت می‌کردم، نه اینکه با دست‌هایم از آن استفاده کنم.

جدیدترین ویژگی OpenAI، که در حال حاضر در مرحله آزمایش محدود آلفا است، هوش مصنوعی ChatGPT را از نظر هوش بیشتر نمی‌کند. به‌جای آن، حالت صدای پیشرفته (AVM) باعث می‌شود که صحبت کردن با آن دوستانه‌تر و طبیعی‌تر باشد. این ویژگی یک رابط جدید برای استفاده از هوش مصنوعی و دستگاه‌های شما ایجاد می‌کند که حس تازه و هیجان‌انگیزی دارد و دقیقاً به همین دلیل است که من از آن می‌ترسم. محصول تا حدی دارای اشکالاتی بود و ایده‌اش به‌طور کامل من را می‌ترساند، اما از اینکه چقدر واقعاً از استفاده از آن لذت بردم، شگفت‌زده شدم.

با یک قدم به عقب، فکر می‌کنم AVM در چارچوب دیدگاه گسترده‌تر سام آلتمان، مدیر عامل OpenAI، در کنار عوامل، جای می‌گیرد که هدف آن تغییر روش تعامل انسان‌ها با کامپیوترها و مدل‌های هوش مصنوعی است که در مرکز توجه قرار دارند.

«در نهایت، شما فقط از کامپیوتر درخواست می‌کنید که چه چیزی نیاز دارید و آن همه این وظایف را برای شما انجام می‌دهد.» آلتمان در روز توسعه OpenAI در نوامبر 2023 گفت. «این قابلیت‌ها اغلب در زمینه هوش مصنوعی به عنوان ‘عوامل’ مطرح می‌شوند. مزیت این موضوع فوق‌العاده خواهد بود.»

دوست من، ChatGPT

روز چهارشنبه، من به‌دنبال بزرگترین مزیت برای این فناوری پیشرفته که می‌توانستم فکر کنم، بودم: از ChatGPT خواستم که Taco Bell را به همان شیوه‌ای که اوباما انجام می‌داد، سفارش دهد.

«اوه، اجازه دهید واضح بگویم – من یک Crunchwrap Supreme، شاید چند تاکو برای اطمینان، می‌خواهم»، گفت حالت صدای پیشرفته ChatGPT. «فکر می‌کنید او چگونه با درایو-ثرو برخورد می‌کند؟» گفت ChatGPT و سپس به شوخی خودش خندید. این تقلید واقعاً باعث خندیدن من نیز شد، با هماهنگی و توقف‌های معروف اوباما. با این حال، در لحن صدای ChatGPT که انتخاب کرده بودم، Juniper، باقی ماند تا با صدای اوباما اشتباه گرفته نشود. به نظر می‌رسید مانند دوستی است که تقلید بدی می‌کند و دقیقاً می‌فهمد که من چه چیزی را می‌خواهم از آن بگیرم و حتی این‌که چیزی خنده‌دار می‌گوید. صحبت کردن با این دستیار پیشرفته در گوشی من، به طرز عجیبی لذت‌بخش بود. همچنین از ChatGPT خواستم که راهنمایی‌هایی برای حل مشکلی مربوط به روابط انسانی پیچیده: درخواست از یک فرد مهم برای زندگی کردن با من ارائه دهد. پس از توضیح پیچیدگی‌های رابطه و مسیر شغف‌های ما، مشاوره بسیار دقیقی در مورد نحوه پیشرفت دریافت کردم. این‌ها سوالاتی هستند که هرگز نمی‌توانید از Siri یا جستجوی Google بپرسید، اما اکنون می‌توانید با ChatGPT بپرسید. صدای چت‌بات حتی هنگام پاسخ دادن به این درخواست‌ها لحن کمی جدی و ملایم داشت؛ تفاوتی چشمگیر با لحن شوخی‌آمیز سفارش Taco Bell اوباما.

حالت صدای پیشرفته‌ی ChatGPT همچنین در کمک به درک موضوعات پیچیده عالی است. از آن خواستم که موارد موجود در گزارش‌های درآمد، مانند جریان نقدی آزاد، را به روشی توضیح دهد که یک کودک 10 ساله درک کند. آن از یک ایستگاه لیموناد به عنوان مثال استفاده کرد و چندین اصطلاح مالی را به گونه‌ای توضیح داد که پسر عموی کوچک‌تر من کاملاً می‌فهمد. حتی می‌توانید از حالت صدای پیشرفته‌ی ChatGPT بخواهید که آرام‌تر صحبت کند تا با سطح درک شما هماهنگ شود.

Siri به قدری راه رفت که AVM بتواند بدود

در مقایسه با Siri یا Alexa، حالت صدای پیشرفته‌ی ChatGPT برنده واضحی است به دلیل زمان‌های پاسخ‌دهی سریع‌تر، پاسخ‌های منحصر به فرد و توانایی پاسخ به سوالات پیچیده‌ای که نسل قبلی دستیاران مجازی هرگز نمی‌توانستند. با این حال، AVM در دیگر زمینه‌ها کمبودهایی دارد. ویژگی صدای ChatGPT نمی‌تواند تایمرها یا یادآورها را تنظیم کند، در زمان واقعی به جستجوی وب بپردازد، وضعیت آب و هوا را بررسی کند یا با هر API در گوشی شما تعامل داشته باشد. در حال حاضر، حداقل، این ابزار جایگزین مؤثری برای دستیاران مجازی نیست.

در مقایسه با Gemini Live، ویژگی رقابتی Google، AVM کمی جلوتر به نظر می‌رسد. Gemini Live نمی‌تواند تقلید کند، هیچ احساسی را ابراز نمی‌کند، نمی‌تواند سرعت را افزایش یا کاهش دهد و زمان بیشتری برای پاسخ دادن می‌برد. Gemini Live صداهای بیشتری دارد (ده تا در مقایسه با سه صدای OpenAI) و به‌نظر می‌رسد که به‌روزتر باشد (Gemini Live از حکم ضد انحصار Google مطلع بود). به‌طور قابل توجهی، نه AVM و نه Gemini Live نمی‌توانند بخوانند، که احتمالاً تلاشی برای جلوگیری از مواجهه با دعاوی حقوقی مربوط به حق نشر از صنعت ضبط است.

با این حال، حالت صدای پیشرفته‌ی ChatGPT اغلب دارای مشکلاتی است (همچنین Gemini Live به طور منصفانه). گاهی اوقات ممکن است وسط جمله قطع شود و سپس دوباره شروع کند. همچنین صدای آن در بعضی موارد به شکل عجیبی و با کیفیت پایین‌تر به نظر می‌رسد که کمی ناخوشایند است. من مطمئن نیستم که آیا این مشکل از مدل، اتصال اینترنت یا چیز دیگری است، اما این مشکلات فنی به‌طور نسبی برای یک آزمایش آلفا قابل انتظار است. این مشکلات به‌طور کمی از تجربه‌ی صحبت کردن واقعی با گوشی من کاسته است.

این مثال‌ها به نظر من زیبایی AVM را نشان می‌دهند. این ویژگی ChatGPT را همه‌دان نمی‌کند، اما به مردم اجازه می‌دهد تا با مدل هوش مصنوعی GPT-4o به‌طور منحصر به فردی انسانی تعامل کنند. (من درک می‌کنم اگر فراموش کنید که هیچ فردی در طرف دیگر گوشی شما وجود ندارد.) تقریباً احساس می‌شود که ChatGPT هنگام صحبت با AVM از نظر اجتماعی آگاه است، اما البته، اینطور نیست. این فقط مجموعه‌ای از الگوریتم‌های پیش‌بینی منظم است.

صحبت درباره فناوری

صادقانه بگویم، این ویژگی من را نگران می‌کند. این اولین بار نیست که یک شرکت فناوری هم‌نشینی در گوشی شما ارائه می‌دهد. نسل من، Gen Z، اولین نسل بود که در کنار رسانه‌های اجتماعی رشد کرد، جایی که شرکت‌ها اتصال را ارائه دادند اما در عوض با ناامنی‌های جمعی ما بازی کردند. صحبت کردن با یک دستگاه هوش مصنوعی – مانند چیزی که AVM به نظر می‌رسد ارائه می‌دهد – به نظر می‌رسد که تکامل پدیده “دوست در گوشی شما” رسانه‌های اجتماعی باشد که اتصالات ارزان‌قیمتی ارائه می‌دهد که به غرایز انسانی ما می‌پردازد. اما این بار، انسان‌ها به‌طور کامل از این حلقه خارج شده‌اند.

اتصال مصنوعی انسانی به طرز عجیبی استفاده محبوبی برای هوش مصنوعی مولد شده است. امروزه مردم از چت‌بات‌های هوش مصنوعی به عنوان دوستان، مشاوران، درمانگران و معلمان استفاده می‌کنند. وقتی OpenAI فروشگاه GPT خود را راه‌اندازی کرد، به سرعت با «دوست‌های هوش مصنوعی»، چت‌بات‌های تخصصی برای ایفای نقش شریک عاطفی شما، پر شد. دو محقق از MIT Media Lab در این ماه هشدار دادند که باید برای «هوش اعتیادآور»، یا هم‌نشین‌های هوش مصنوعی با الگوهای تاریک برای جذب انسان‌ها آماده شویم. ممکن است در حال باز کردن جعبه پاندورا برای راه‌های جدید و وسوسه‌انگیز برای جلب توجه دستگاه‌ها باشیم.

اوایل این ماه، یک ترک تحصیل‌کننده از هاروارد دنیای فناوری را با یک گردنبند هوش مصنوعی به نام Friend شوکه کرد. این دستگاه پوشیدنی — اگر به وعده‌هایش عمل کند — همیشه در حال گوش دادن است و چت‌بات با شما در مورد زندگی‌تان پیامک می‌زند. اگرچه این ایده دیوانه‌کننده به نظر می‌رسد، نوآوری‌هایی مانند AVM ChatGPT به من دلیلی می‌دهد تا این کاربردها را به‌طور جدی در نظر بگیرم.

و در حالی که OpenAI در این زمینه پیشرو است، Google هم خیلی عقب نیست. من مطمئنم که Amazon و Apple در حال رقابت برای قرار دادن این قابلیت در محصولات خود هستند و به زودی ممکن است به یک استاندارد صنعت تبدیل شود.

تصور کنید که از تلویزیون هوشمند خود درخواست یک توصیه بسیار خاص برای فیلم کنید و دقیقا همان را دریافت کنید. یا به Alexa بگویید که دقیقا چه علائم سرماخوردگی را احساس می‌کنید و به نوبه خود، آن را مجبور کنید که برای شما دستمال کاغذی و دارو سفارش دهد، در حالی که شما را در مورد درمان‌های خانگی مشاوره می‌دهد. شاید بتوانید از کامپیوتر خود بخواهید که برنامه‌ریزی یک سفر آخر هفته برای خانواده‌تان را آماده کند، به جای جستجوی دستی همه چیز در Google.

اکنون به وضوح، این اقدامات نیاز به مرزها و جهش‌های زیادی در دنیای عامل‌های هوش مصنوعی دارد. تلاش OpenAI در این زمینه، فروشگاه GPT، به‌نظر می‌رسد که محصولی با تبلیغات بیش از حد باشد که دیگر تمرکز زیادی بر روی آن نیست. اما AVM حداقل به حل بخش “صحبت کردن با کامپیوترها” از پازل کمک می‌کند. این مفاهیم راهی طولانی در پیش دارند، اما پس از استفاده از AVM، به نظر می‌رسند که خیلی نزدیک‌تر از هفته‌ی گذشته هستند.

 

منبع خبر: Techcrunch

Leave A Comment

Hello! We are a group of skilled developers and programmers.

آشنایی با شرکت فراسیس

شرکت فراسیس با بیش از 15 سال سابقه درخشان در ارائه خدمات تخصصی و جامع در حوزه فناوری اطلاعات (IT)، به عنوان یکی از پیشروان این صنعت در ایران و کشورهای همسایه شناخته می‌شود. ما با هدف ارائه الگویی استاندارد در زمینه اجرای پروژه‌های ICT، فعالیت خود را از سال 1389 آغاز کرده‌ایم و تاکنون توانسته‌ایم با بهره‌گیری از تیمی مجرب و دارای مدارک معتبر بین‌المللی، سوابق کاری درخشانی از خود به جای بگذاریم.