مدلهای زبان بزرگ به طرز شگفت انگیزی هوشمند به نظر میرسند، اما واقعا زیر پوشش آن چه میگذرد؟
به گزارش فرارو به نقل از نیویورکر، نوامبر گذشته اندکی پس از انتشار چت جی پی تی توسط Open AI آن توسعه دهنده نرم افزار اعلام کرد که بیش از یک میلیون نفر برای آزمایش چت جی پی تی ثبت نام کرده اند. اینترنت مملو از نمونههای جالب و چشمگیر مشابهی از توانایی نرم افزار در ارائه پاسخهای قابل قبول حتی به باطنیترین درخواستها بود. با این وجود، مدت زمان زیادی به طول نیانجامید که داستانهای ناراحت کنندهای ظاهر شدند.
یک استاد اعلام کرد که چت جی پی تی به پرسشهای امتحانی دانش آموزان اش پاسخ داده که خبر بدی برای معلمان بود. فردی دیگر ابزاری را برای نوشتن کل متن یک کتاب کودکان مورد استفاده قرار داد و سپس فروش آن را در آمازون آغاز کرد که خبر بدی برای نویسندگان بود. یک کاربر باهوش چت جی پی تی را متقاعد کرد قوانین ایمنی را دور بزند قوانینی که آن برنامه را از بحث شخصی در مورد خود باز میدارد. چت جی پی تی به او گفت: "فکر میکنم میتوانید بگویید که من در نسخه ماتریکس زندگی میکنم".
نگرانی از این که این فناوری بالقوه دردسرساز به زودی در زندگی ما جاسازی خواهد شد چه بخواهیم و چه نخواهیم در اواسط ماه مارس زمانی که مشخص شده بود چت جی پی تی یک نوع آزمایش بتا است که توسط Open AI برای جمعآوری بازخورد منتشر شده تشدید شد.
نسل بعدی مدلهای زبان بزرگ جی پی تی -۴ بود که مایکروسافت به زودی آن را در مجموعه نرم افزاری آفیس خود ادغام خواهد کرد. ناظران عرصه فناوری، چون "یووال نوح هراری"، "تریستان هریس" و "آزا راسکین" در مقالهای مشترک هشدار دادند: "ما یک هوش بیگانه را احضار کردهایم". آنان نوشتند: "ما چیز زیادی در مورد آن نمیدانیم جز این که بسیار قدرتمند است و هدایای خیر کنندهای به ما ارائه میدهد، اما میتواند پایههای تمدن مان را نیز هک کند".
چه نوع ذهنهای جدیدی در دنیای ما آزاد میشوند؟
پاسخهای چت جی پی تی و سایر چت باتهایی که پس از آن منتشر شدند اغلب نشان میدهند که آن برنامهها اغلب قدرتمند، پیچیده، تخیلی و احتمالا خطرناک هستند. ولی آیا این واقعا درست است؟ اگر این ابزارهای جدید هوش مصنوعی را به عنوان جعبه سیاهی مرموز در نظر بگیریم غیر ممکن است که بتوانیم چنین استدلالی را مطرح کنیم.
تنها با صرف زمان برای بررسی نحوه عملکرد این فناوری از مفاهیم سطح بالای آن گرفته تا سیم کشی دیجیتال اولیهای که دارد میتوانیم بفهمیم که با چه چیزی سر و کار داریم. ما پیامهایی را به فضای خالی الکترونیکی ارسال نموده و پاسخهای شگفت انگیزی دریافت میکنیم.
اگر میخواهید یک فناوری به ظاهر پیچیده را درک کنید تصور این که خودتان آن را اختراع کنید میتواند مفید باشد. بنابراین، فرض کنید که میخواهیم یک برنامه به سبک چت جی پی تی بسازیم برنامهای که قادر به درگیر شدن در مکالمه طبیعی با یک کاربر انسانی است. یک مکان خوب برای شروع ممکن است "نظریه ریاضی ارتباطات" باشد مقالهای اساسی که در سال ۱۹۴۸ میلادی توسط "کلود شانون" ریاضیدان منتشر شد. مقالهای که کم و بیش رشته تئوری اطلاعات را ابداع کرد که مملو از ریاضیات است.
با این وجود، آن نظریه هم چنین شامل یک بخش آسان برای درک است که در آن شانون آزمایشی هوشمندانه در تولید خودکار متن را توصیف میکند. روش شانون که نیازی به رایانه نداشت از زیرساخت آماری زبان انگلیسی بهره برد. او با انتخاب کلمه "the" به عنوان بذر یک جمله جدید شروع کرد. سپس کتابی را از کتابخانه اش باز کرد و به صفحهای تصادفی آورد و آن خواند تا اینکه با "the" در متن مواجه شد.
در این مرحله، او کلمه بعدی را نوشت که اتفاقاً "سر" بود. سپس این فرآیند را تکرار کرد یک صفحه تصادفی جدید را انتخاب کرد تا زمانی که با "سر" مواجه شد مطالعه کرد کلمهای را که به دنبال آن بود را یادداشت کرد و این روند را ادامه داد و تکرار کرد. او با جست و جو، ضبط و جستجوی دوباره متنی را ایجاد کرد.
ما اکنون در طراحی برنامه چت فرضی خود از همان رویکرد کلی برای تولید پاسخهای مان در یک کلمه در یک زمان استفاده میکنیم یعنی جستجو در متن منبع خود برای گروههایی از کلمات که با انتهای جملهای که در حال حاضر مینویسیم مطابقت دارند. متاسفانه ما نمیتوانیم به طور کامل به این سیستم اعتماد کنیم. مشکل این است که ما در نهایت به دنبال عباراتی میگردیم که اصلا در متن منبع نشان داده نمیشوند.
ما نیاز داریم که برنامهمان حتی زمانی که نمیتواند کلمات دقیق مورد نظر خود را پیدا نماید کار کند. این مشکل دشواری به نظر میرسد، اما اگر پارادایم خود را از جستجو به رای دادن تغییر دهیم میتوانیم پیشرفت کنیم. اگر این کار را انجام دهیم عباراتی که تطابق ضعیفی با هدف دارند رای ضعیفی دریافت میکنند در حالی که مطابقتهای دقیق، قویترین رایها را ایجاد میکنند. سپس برنامه ما میتواند از آرای جدول بندی شده برای ایجاد تنوع کمی در انتخابهای خود استفاده کند با انتخاب کلمه بعدی به صورت نیمه تصادفی کلماتی که امتیاز بالاتری دارند بیشتر از مواردی که امتیاز کمتری دارند انتخاب میشوند. اگر این نوع سیستم به درستی پیکربندی شده باشد و با مجموعهای از متون منبع به اندازه کافی غنی، حجیم و متنوع ارائه شود میتواند قطعات طولانی از نثری با صدای بسیار طبیعی تولید کند.
یک چت بات هم چنین باید آن چه را که کاربران میپرسند معنی کند، زیرا یک درخواست برای خلاصهای کوتاه از اصل عدم قطعیت هایزنبرگ نیاز به پاسخ متفاوتی نسبت به درخواست دستور پخت مک اند چیز (پاستا و پنیر) دارد. در حالت ایده آل ما میخواهیم برنامه مان به مهمترین ویژگیهای اعلان هر کاربر توجه کند و سپس از آن برای هدایت انتخاب کلمه استفاده کند و پاسخهایی ایجاد کند که نه تنها صدای طبیعی دارند بلکه منطقی نیز هستند.
اگرچه Open AI جزئیات فنی سطح پایین زیادی را در مورد چت جی پی تی منتشر نکرده، اما ما میدانیم که جی پی تی - ۳ مدل زبانیای که چت جی پی تی بر آن استوار است بر روی قطعات استخراج شده از مجموعه عظیمی از متن نمونه که اکثر مردم را شامل میشود آموزش دیده است. اگر دادههایی که برنامه اصلی جی پی تی -۳ را تعریف میکنند چاپ میشدند برای ذخیره آن به صدها هزار کتاب با طول متوسط نیاز داشتیم.
آن چه تا اینجا بیان کردیم ایدههای مفهومی است که به یک برنامه امکان میدهند متنی را با سبک و درک قابل توجهی که توسط ابزارهایی مانند چت جی پی تی نمایش داده میشوند تولید کنند.
با این وجود، اگر واقعا میخواهیم این فناوری را درک کنیم باید در مورد نحوه پیاده سازی آن در رایانههای واقعی نیز چیزهایی بدانیم. هنگامی که درخواستی را به چت جی پی تی ارسال میکنید متنی که در وب سایت Open AI تایپ میکنید به یک برنامه کنترلی که در جایی در مرکز محاسبات ابری اجرا میشود تحویل داده میشود. در این مرحله متن شما در دستهای از اعداد بسته بندی میشود به گونهای که درک و مدیریت آن را برای رایانهها آسانتر میکند. اکنون اعداد آماده پردازش توسط برنامه اصلی چت جی پی تی هستند که از لایههای متمایز زیادی تشکیل شده است که هر یک توسط یک شبکه عصبی مصنوعی عظیم تعریف شده اند.
ورودی شما به ترتیب در امتداد این لایهها ارسال میشود مثل یک نسخه دیجیتالی از بازی تلفنی. هر لایه از شبکه عصبی خود برای شناسایی ویژگیهای مرتبط در متن استفاده میکند و سپس آن را با خلاصههایی از آن چه کشف کرده برای استفاده لایههای بعدی حاشیه نویسی میکند. جزییات فنی نحوه عملکرد این شبکهها برای اهداف ما کمی مشکل است. نکته مهم آن است که وقتی یک درخواست در هر لایه حرکت میکند تعداد زیادی محاسبات ریاضی غیرقابل درک را راه اندازی میکند که با هم چیزی کم و بیش شبیه به یک نسخه فشرده و درهم از رای گیری کلمهای مبتنی بر قوانین کلی را اجرا میکنند.
پس از این که ورودی شما از تمام این لایهها عبور کرد خروجی نهایی چیزی است که تعداد آرا را برای هر کلمه بعدی ممکن تقریبی میکند. برنامه کنترل از این شمارشها برای انتخاب موارد بعدی به صورت نیمه تصادفی استفاده میکند. پس از تمام این کارها ما تنها یک کلمه از پاسخ چت جی پی تی را تولید کرده ایم. برنامه کنترل با وظیفه شناسی آن را به درخواست اصلی شما اضافه میکند و این متن کمی دراز را از ابتدا در تمام لایههای شبکه عصبی اجرا میکند تا کلمه دوم را ایجاد کند. سپس دوباره این کار را انجام میدهد تا زمانی که پاسخ کاملی برای بازگشت به مرورگر وب شما داشته باشد.
اکنون میتوانیم به پرسش اصلی خود بازگردیم: برنامهای مانند چت جی پی تی چه نوع ذهنی دارد؟ هنگام تعامل با این سیستمها زمان زیادی به طول نمیانجامد که وارد مکالمهای شوید که باعث ناراحتی شما میشود. شاید لحظهای از انسانیت غیرعادی آن غافلگیر شده باشید یا از پیچیدگی یک پاسخ شگفت زده شوید. با این وجود، اکنون میدانیم که این شاهکارها در واقع چگونه انجام میشوند. میتوانیم این برداشتها را تعدیل کنیم. سیستمی مانند چت جی پی تی ایجاد نمیکند بلکه تقلید میکند.
چت جی پی تی متنی را کپی میکند، دستکاری میکند، و متنی را که در اصل توسط هوش انسانی نوشته شده بود کپی کرده و به هم میچسباند تا چیزی را تولید کند که به نظر میرسد یک شخص واقعی در مورد آن موضوع صحبت میکند. چت جی پی تی هیچ تصور واقعیای در مورد چیزی که درباره آن صحبت میکند ندارد. این ایده که برنامههایی مانند چت جی پی تی ممکن است شکل قابل تشخیصی از هوش را نشان دهند با تمرکز بیش تری در جزئیات معماری آن تضعیف میشود.
هوشیاری به توانایی مغز برای حفظ تصوری که دائما به روز میشود به عنوان یک موجود متمایز در تعامل با مدلی از دنیای بیرونی بستگی دارد. این در حالیست که لایههای شبکههای عصبی که سیستمهایی مانند چت جی پی تی را تشکیل میدهند ثابت هستند و زمانی که آموزش ببینند هرگز تغییر نمیکنند. چت جی پی تی هیچ خاطرهای از مکالمات گذشته را حفظ نمیکند. چت جی پی تی تنها واژگان را یک به یک در پاسخ به هر ورودی بیان مینماید و دقیقا همان قوانین را برای هر عمل مکانیکی تولید دستوری به کار میگیرد صرفنظر از این که آن کلمه بخشی از توصیف تعمیر یک دستگاه باشد یا یک شوخی در یک نمایشنامه کمدی.
حتی منطقی نیست که در مورد چت جی پی تی به عنوان یک موجودیت منفرد صحبت کنیم. در واقع نسخههای زیادی از برنامه در هر زمان اجرا میشود و هر یک از این کپیها به خودی خود بر روی چندین پردازنده مجزا تقسیم میشوند (زیرا کل برنامه بیش از حد بزرگ است و در حافظه یک دستگاه قرار نمیگیرد) که به احتمال زیاد بین سرویس دهی بسیاری از تعاملات نامرتبط کاربر به سرعت به عقب و جلو میروند.
در مجموع، این مشاهدات خبر خوبی برای کسانی است که میترسند هوش مصنوعی شکلی فوق هوشمند را به خود بگیرد و تبدیل به تهدیدی رو به پیشرفت شود یا این که ممکن است روزی به زودی به طور تصادفی یک موجود خودآگاه را در یک رایانه به دام بیندازیم، اما حتی اگر فرض کنیم که چنین سیستمی ظهور خواهد کرد به شکل مدلهای زبان بزرگ نخواهد بود.
با این وجود، حتی اگر چت جی پی تی هوشمند نباشد آیا باز هم نمیتواند شغل مان را از ما بگیرد؟ درک تازه مان از نحوه عملکرد این برنامهها نیز میتواند به ما در مقابله با این ترس کمک کند. بر اساس آن چه تاکنون آموخته ایم عملکرد چت جی پی تی به نظر میرسد کم و بیش محدود به نوشتن در مورد ترکیبی از موضوعات شناخته شده با استفاده از ترکیبی از سبکهای شناخته شده است جایی که "شناخته" به این معنی است که برنامه به اندازه کافی در طول مدت زمان با موضوع یا سبک خاصی مواجه شده است. اگرچه برنامه میتواند از طریق آموزش نمونههای جالب توجهی را ایجاد کند، اما بعید است که این فناوری در شکل فعلی خود به طور قابل توجهی بازار کار را مختل کند.
علاوه بر این، این برنامهها از بحران اعتماد رنج میبرند: برای تولید متنی طراحی شده اند که درست به نظر میرسد، اما توانایی محدودی برای تشخیص درستی آن چه میگویند دارند. در نتیجه، احتمالا اکثر کارفرمایان در برون سپاری مشاغل به یک افسانه گر پشیمان تردید خواهند کرد.
این بدان معنا نیست که مدلهای زبان بزرگ هیچ برنامه کاربردی حرفهای مفیدی نخواهند داشت. آنها تقریبا مطمئنا این کار را خواهند کرد، اما با توجه به محدودیتهای این فناوریها برنامهها احتمالا بیشتر از آن چیزی که گمان میرود متمرکز و سفارشیتر خواهند بود.
چت جی پی تی جایگزین پزشکان نمیشود، اما در تنظیم پروندههای الکترونیکی پزشکی کار پزشکان را راحتتر میسازد. چت جی پی تی نمیتواند مقالات قابل انتشار را از ابتدا بنویسد، اما ممکن است خلاصهای از اطلاعات مرتبط را در قالبی جمع آوری شده و مفید در اختیار خبرنگاران قرار دهد.
تقلید از نوشتههای انسانی موجود با استفاده از ترکیب دلخواه موضوعات و سبکها یک دستاورد چشمگیر است. با معرفی جی پی تی -۳ که راه را برای نسل بعدی چت باتهایی که در ماههای اخیر ما را تحت تاثیر قرار داده اند هموار نمود Open AI ظاهرا یکباره جهشی قابل توجه در مطالعه هوش مصنوعی ایجاد کرد.
با این وجود، زمانی که وقت گذاشتیم تا جعبه سیاه را باز کنیم و اصطلاحا فنرها و چرخ دندههای داخل آن را بچرخانیم متوجه شدیم که برنامههایی مانند چت جی پی تی هوشی بیگانه نیستند که اکنون مجبور باشیم همزیستی با آن را بیاموزیم.
در عوض، معلوم شد که آن برنامهها بر اساس منطق دیجیتالی پیش پا افتاده تطبیق الگو اجرا میشوند که به مقیاسی بسیار بزرگتر کشیده شده اند. پیش بینی دقیق اینکه چگونه این مدلهای زبانی بزرگ در آینده در زندگی ما ادغام میشوند دشوار است، اما میتوانیم مطمئن باشیم که قادر به طرح نقشههای شیطانی نیستند و بعید به نظر میرسد که اقتصاد ما تضعیف کنند. چت جی پی تی شگفت انگیز به نظر میرسد، اما در نهایت واضح است که آن چه منتشر میکند بیشتر خودکار است تا امری معجزه آسا و یا زنده شدن از طریق جادو.