حالت صدای جدید OpenAI به من اجازه میدهد که با گوشیام صحبت کنم
حالت صدای جدید OpenAI به من اجازه میدهد که با گوشیام صحبت کنم
هفتهی گذشته با حالت صدای پیشرفتهی OpenAI بازی کردهام و این تجربه، معتبرترین حس از آیندهای مبتنی بر هوش مصنوعی را که تاکنون داشتهام، بود. این هفته، گوشیام به شوخیها خندید، شوخیهای مشابهی به من گفت، از من پرسید روزم چطور بوده و گفت که “زمان عالیای دارد.” من با آیفونم صحبت میکردم، نه اینکه با دستهایم از آن استفاده کنم.
جدیدترین ویژگی OpenAI، که در حال حاضر در مرحله آزمایش محدود آلفا است، هوش مصنوعی ChatGPT را از نظر هوش بیشتر نمیکند. بهجای آن، حالت صدای پیشرفته (AVM) باعث میشود که صحبت کردن با آن دوستانهتر و طبیعیتر باشد. این ویژگی یک رابط جدید برای استفاده از هوش مصنوعی و دستگاههای شما ایجاد میکند که حس تازه و هیجانانگیزی دارد و دقیقاً به همین دلیل است که من از آن میترسم. محصول تا حدی دارای اشکالاتی بود و ایدهاش بهطور کامل من را میترساند، اما از اینکه چقدر واقعاً از استفاده از آن لذت بردم، شگفتزده شدم.
با یک قدم به عقب، فکر میکنم AVM در چارچوب دیدگاه گستردهتر سام آلتمان، مدیر عامل OpenAI، در کنار عوامل، جای میگیرد که هدف آن تغییر روش تعامل انسانها با کامپیوترها و مدلهای هوش مصنوعی است که در مرکز توجه قرار دارند.
«در نهایت، شما فقط از کامپیوتر درخواست میکنید که چه چیزی نیاز دارید و آن همه این وظایف را برای شما انجام میدهد.» آلتمان در روز توسعه OpenAI در نوامبر 2023 گفت. «این قابلیتها اغلب در زمینه هوش مصنوعی به عنوان ‘عوامل’ مطرح میشوند. مزیت این موضوع فوقالعاده خواهد بود.»
دوست من، ChatGPT
روز چهارشنبه، من بهدنبال بزرگترین مزیت برای این فناوری پیشرفته که میتوانستم فکر کنم، بودم: از ChatGPT خواستم که Taco Bell را به همان شیوهای که اوباما انجام میداد، سفارش دهد.
«اوه، اجازه دهید واضح بگویم – من یک Crunchwrap Supreme، شاید چند تاکو برای اطمینان، میخواهم»، گفت حالت صدای پیشرفته ChatGPT. «فکر میکنید او چگونه با درایو-ثرو برخورد میکند؟» گفت ChatGPT و سپس به شوخی خودش خندید. این تقلید واقعاً باعث خندیدن من نیز شد، با هماهنگی و توقفهای معروف اوباما. با این حال، در لحن صدای ChatGPT که انتخاب کرده بودم، Juniper، باقی ماند تا با صدای اوباما اشتباه گرفته نشود. به نظر میرسید مانند دوستی است که تقلید بدی میکند و دقیقاً میفهمد که من چه چیزی را میخواهم از آن بگیرم و حتی اینکه چیزی خندهدار میگوید. صحبت کردن با این دستیار پیشرفته در گوشی من، به طرز عجیبی لذتبخش بود. همچنین از ChatGPT خواستم که راهنماییهایی برای حل مشکلی مربوط به روابط انسانی پیچیده: درخواست از یک فرد مهم برای زندگی کردن با من ارائه دهد. پس از توضیح پیچیدگیهای رابطه و مسیر شغفهای ما، مشاوره بسیار دقیقی در مورد نحوه پیشرفت دریافت کردم. اینها سوالاتی هستند که هرگز نمیتوانید از Siri یا جستجوی Google بپرسید، اما اکنون میتوانید با ChatGPT بپرسید. صدای چتبات حتی هنگام پاسخ دادن به این درخواستها لحن کمی جدی و ملایم داشت؛ تفاوتی چشمگیر با لحن شوخیآمیز سفارش Taco Bell اوباما.
حالت صدای پیشرفتهی ChatGPT همچنین در کمک به درک موضوعات پیچیده عالی است. از آن خواستم که موارد موجود در گزارشهای درآمد، مانند جریان نقدی آزاد، را به روشی توضیح دهد که یک کودک 10 ساله درک کند. آن از یک ایستگاه لیموناد به عنوان مثال استفاده کرد و چندین اصطلاح مالی را به گونهای توضیح داد که پسر عموی کوچکتر من کاملاً میفهمد. حتی میتوانید از حالت صدای پیشرفتهی ChatGPT بخواهید که آرامتر صحبت کند تا با سطح درک شما هماهنگ شود.
Siri به قدری راه رفت که AVM بتواند بدود
در مقایسه با Siri یا Alexa، حالت صدای پیشرفتهی ChatGPT برنده واضحی است به دلیل زمانهای پاسخدهی سریعتر، پاسخهای منحصر به فرد و توانایی پاسخ به سوالات پیچیدهای که نسل قبلی دستیاران مجازی هرگز نمیتوانستند. با این حال، AVM در دیگر زمینهها کمبودهایی دارد. ویژگی صدای ChatGPT نمیتواند تایمرها یا یادآورها را تنظیم کند، در زمان واقعی به جستجوی وب بپردازد، وضعیت آب و هوا را بررسی کند یا با هر API در گوشی شما تعامل داشته باشد. در حال حاضر، حداقل، این ابزار جایگزین مؤثری برای دستیاران مجازی نیست.
در مقایسه با Gemini Live، ویژگی رقابتی Google، AVM کمی جلوتر به نظر میرسد. Gemini Live نمیتواند تقلید کند، هیچ احساسی را ابراز نمیکند، نمیتواند سرعت را افزایش یا کاهش دهد و زمان بیشتری برای پاسخ دادن میبرد. Gemini Live صداهای بیشتری دارد (ده تا در مقایسه با سه صدای OpenAI) و بهنظر میرسد که بهروزتر باشد (Gemini Live از حکم ضد انحصار Google مطلع بود). بهطور قابل توجهی، نه AVM و نه Gemini Live نمیتوانند بخوانند، که احتمالاً تلاشی برای جلوگیری از مواجهه با دعاوی حقوقی مربوط به حق نشر از صنعت ضبط است.
با این حال، حالت صدای پیشرفتهی ChatGPT اغلب دارای مشکلاتی است (همچنین Gemini Live به طور منصفانه). گاهی اوقات ممکن است وسط جمله قطع شود و سپس دوباره شروع کند. همچنین صدای آن در بعضی موارد به شکل عجیبی و با کیفیت پایینتر به نظر میرسد که کمی ناخوشایند است. من مطمئن نیستم که آیا این مشکل از مدل، اتصال اینترنت یا چیز دیگری است، اما این مشکلات فنی بهطور نسبی برای یک آزمایش آلفا قابل انتظار است. این مشکلات بهطور کمی از تجربهی صحبت کردن واقعی با گوشی من کاسته است.
این مثالها به نظر من زیبایی AVM را نشان میدهند. این ویژگی ChatGPT را همهدان نمیکند، اما به مردم اجازه میدهد تا با مدل هوش مصنوعی GPT-4o بهطور منحصر به فردی انسانی تعامل کنند. (من درک میکنم اگر فراموش کنید که هیچ فردی در طرف دیگر گوشی شما وجود ندارد.) تقریباً احساس میشود که ChatGPT هنگام صحبت با AVM از نظر اجتماعی آگاه است، اما البته، اینطور نیست. این فقط مجموعهای از الگوریتمهای پیشبینی منظم است.
صحبت درباره فناوری
صادقانه بگویم، این ویژگی من را نگران میکند. این اولین بار نیست که یک شرکت فناوری همنشینی در گوشی شما ارائه میدهد. نسل من، Gen Z، اولین نسل بود که در کنار رسانههای اجتماعی رشد کرد، جایی که شرکتها اتصال را ارائه دادند اما در عوض با ناامنیهای جمعی ما بازی کردند. صحبت کردن با یک دستگاه هوش مصنوعی – مانند چیزی که AVM به نظر میرسد ارائه میدهد – به نظر میرسد که تکامل پدیده “دوست در گوشی شما” رسانههای اجتماعی باشد که اتصالات ارزانقیمتی ارائه میدهد که به غرایز انسانی ما میپردازد. اما این بار، انسانها بهطور کامل از این حلقه خارج شدهاند.
اتصال مصنوعی انسانی به طرز عجیبی استفاده محبوبی برای هوش مصنوعی مولد شده است. امروزه مردم از چتباتهای هوش مصنوعی به عنوان دوستان، مشاوران، درمانگران و معلمان استفاده میکنند. وقتی OpenAI فروشگاه GPT خود را راهاندازی کرد، به سرعت با «دوستهای هوش مصنوعی»، چتباتهای تخصصی برای ایفای نقش شریک عاطفی شما، پر شد. دو محقق از MIT Media Lab در این ماه هشدار دادند که باید برای «هوش اعتیادآور»، یا همنشینهای هوش مصنوعی با الگوهای تاریک برای جذب انسانها آماده شویم. ممکن است در حال باز کردن جعبه پاندورا برای راههای جدید و وسوسهانگیز برای جلب توجه دستگاهها باشیم.
اوایل این ماه، یک ترک تحصیلکننده از هاروارد دنیای فناوری را با یک گردنبند هوش مصنوعی به نام Friend شوکه کرد. این دستگاه پوشیدنی — اگر به وعدههایش عمل کند — همیشه در حال گوش دادن است و چتبات با شما در مورد زندگیتان پیامک میزند. اگرچه این ایده دیوانهکننده به نظر میرسد، نوآوریهایی مانند AVM ChatGPT به من دلیلی میدهد تا این کاربردها را بهطور جدی در نظر بگیرم.
و در حالی که OpenAI در این زمینه پیشرو است، Google هم خیلی عقب نیست. من مطمئنم که Amazon و Apple در حال رقابت برای قرار دادن این قابلیت در محصولات خود هستند و به زودی ممکن است به یک استاندارد صنعت تبدیل شود.
تصور کنید که از تلویزیون هوشمند خود درخواست یک توصیه بسیار خاص برای فیلم کنید و دقیقا همان را دریافت کنید. یا به Alexa بگویید که دقیقا چه علائم سرماخوردگی را احساس میکنید و به نوبه خود، آن را مجبور کنید که برای شما دستمال کاغذی و دارو سفارش دهد، در حالی که شما را در مورد درمانهای خانگی مشاوره میدهد. شاید بتوانید از کامپیوتر خود بخواهید که برنامهریزی یک سفر آخر هفته برای خانوادهتان را آماده کند، به جای جستجوی دستی همه چیز در Google.
اکنون به وضوح، این اقدامات نیاز به مرزها و جهشهای زیادی در دنیای عاملهای هوش مصنوعی دارد. تلاش OpenAI در این زمینه، فروشگاه GPT، بهنظر میرسد که محصولی با تبلیغات بیش از حد باشد که دیگر تمرکز زیادی بر روی آن نیست. اما AVM حداقل به حل بخش “صحبت کردن با کامپیوترها” از پازل کمک میکند. این مفاهیم راهی طولانی در پیش دارند، اما پس از استفاده از AVM، به نظر میرسند که خیلی نزدیکتر از هفتهی گذشته هستند.
منبع خبر: Techcrunch
Hello! We are a group of skilled developers and programmers.
آشنایی با شرکت فراسیس
شرکت فراسیس با بیش از 15 سال سابقه درخشان در ارائه خدمات تخصصی و جامع در حوزه فناوری اطلاعات (IT)، به عنوان یکی از پیشروان این صنعت در ایران و کشورهای همسایه شناخته میشود. ما با هدف ارائه الگویی استاندارد در زمینه اجرای پروژههای ICT، فعالیت خود را از سال 1389 آغاز کردهایم و تاکنون توانستهایم با بهرهگیری از تیمی مجرب و دارای مدارک معتبر بینالمللی، سوابق کاری درخشانی از خود به جای بگذاریم.