محمدعلی نژادیان: «ای‌آی ایجنت‌» یکی از مهم‌ترین روندهای جدید هوش مصنوعی است

رویداد «ایران تک کلود» در روز جمعه 10 اسفند 1403 با همراهی دانشگاه تهران و دانشگاه ایلیا گرجستان برگزار شد.

به گزارش چترا محرک، دکترمحمدعلی نژادیانمدرس دانشگاه و فعال حوزه دیجیتال در قسمتی از سخنرانی خود به گزارش ام‌آی‌تی تکنولوژی ریویو درباره روندهای هوش مصنوعی در سال 2025 پرداخت.

وی عنوان کرد: ام‌آ‌ی‌تی تکنولوژی ریویو برای سال گذشته (2024) چهار پیش‌بینی برای هوش مصنوعی انجام داد که 3 مورد آن به تحقق پیوست. این موارد عبارت بودند از:

  1. چت‌بات‌های سفارشی [1]: در ابتدا ام‌آی‌تی نام این فناوری را «اپلیکیشن‌های کمکی تعاملی مبتنی بر مدل‌های زبانی چندوجهی»[2] نامید. به گفته این مرجع در آن زمان نمی‌دانستند که این همان چیزی است که امروز عامل‌های هوش مصنوعی (ای‌آی ایجنت) (Ai Agents) نامیده می‌شود و اکنون یکی از داغ‌ترین ترندهای این حوزه است (ای‌آی ایجنت‌ها چیزی مانند «دستیارهای دیجتال» هستند که کارهایی مانند رزرو بلیط، خرید آنلاین، نوشتن ایمیل و… را برای شما انجام خواهند داد).
  2. ویدئوی مولد [3]: در طول یک سال گذشته، فناوری‌های تولید ویدئو با سرعتی باورنکردنی پیشرفت کردند. شرکت‌های اوپن‌ای‌آی [4]و گوگل دیپ‌مایند[5] مدل‌های برجسته‌ی خود، سورا [6]و وئو [7] تنها با فاصله‌ی یک هفته از هم را در دسامبر منتشر کردند،.
  3. ربات‌های عمومی‌تر [8]: مدل‌های زبانی بزرگ [9]تأثیر خود را بر سایر بخش‌های صنعت فناوری نیز گذاشتند، و رباتیک[10] یکی از مهم‌ترین این بخش‌ها بود.
  4. اطلاعات نادرست انتخاباتی تولیدشده با هوش مصنوعی [11] ام‌آی‌تی پیش‌بینی کرده بود که دیپ‌فیک‌های[12] سیاسی همه جا خواهند بود، اما این اتفاق نیفتاد. البته مسائل نگران‌کننده‌ی زیادی وجود داشت، اما دیپ‌فیک‌های انتخاباتی چندان گسترده نشدند.

نژادیان عنوان کرد: اما چه چیزی در سال ۲۰۲۵ در راه است؟ طبق گزارش ام‌آی‌تی تکنولوژی ریویو در سال جدید علاوه‌بر «ای‌آی‌ایجنت‌ها» و «مدل‌های زبانی کوچک»، باید 5 روند جدید و جالب توجه را نیز زیر نظر داشت. متن کامل بدین شرح است:

  1.  زمین‌های بازی مجازی مولد (محیط‌های تعاملی مجازی مولد) [13]:

اگر ۲۰۲۳ سال تولید تصاویر با هوش مصنوعی [14]و ۲۰۲۴ سال تولید ویدئو با هوش مصنوعی  [15] بود، حالا ۲۰۲۵ سال دنیای مجازی مولد[16] خواهد بود مانند بازی‌های ویدیویی تولیدشده با هوش مصنوعی. در فوریه ۲۰۲۴، دیپ‌مایند  [17]مدلی به نام جِی‌نی [18]را معرفی کرد که می‌توانست یک تصویر ثابت[19] را به یک بازی پلتفرم دو بعدی[20] تبدیل کند که بازیکنان می‌توانستند با آن تعامل داشته باشند. در دسامبر، جی‌نی2معرفی شد. مدلی که می‌تواند از یک تصویر اولیه [21]یک دنیای مجازی کامل[22] بسازد. دیگر شرکت‌ها نیز در حال توسعه‌ی فناوری‌های مشابه هستند.

چرا این فناوری مهم است؟

  • کاربرد در بازی‌های ویدیویی[23]: مدل‌های مولد سه‌بعدی[24] می‌توانند برای طراحی مفهوم‌های جدید بازی‌ها [25]به کار روند، به‌طوری که یک طرح ساده  [26]را به یک محیط قابل‌بازی[27] در لحظه تبدیل کنند. این می‌تواند منجر به سبک‌های کاملاً جدیدی از بازی‌ها شود.
  • کاربرد در آموزش ربات‌ها [28]: استارت‌آپ وِرلْد لَبْز[29] به دنبال توسعه‌ی هوش فضایی [30]است؛ توانایی ماشین‌ها برای درک و تعامل با دنیای واقعی.  اما یکی از مشکلات کلیدی در رباتیک[31]، کمبود داده‌های واقعی برای آموزش هوش مصنوعی است. با استفاده از دنیاهای مجازی مولد[32]، می‌توان بی‌نهایت سناریوی آموزشی برای ربات‌ها ساخت و به آن‌ها اجازه داد که با آزمون و خطا یاد بگیرند (ویل داگلاس هیون).

2-مدل‌های زبانی بزرگ که «استدلال» می‌کنند

بیشتر مدل‌ها، از جمله مدل پرچم‌دار اوپن‌ای‌آی یعنی جی‌پی‌تی-4[33]، اولین پاسخی که به ذهنشان می‌رسد را ارائه می‌دهند. گاهی این پاسخ صحیح است، گاهی نه. اما مدل‌های جدید این شرکت به گونه‌ای آموزش داده شده‌اند که پاسخ‌های خود را گام به گام بررسی کنند و مسائل پیچیده را به مجموعه‌ای از مسائل ساده‌تر تبدیل کنند. وقتی یک روش جواب نمی‌دهد، روش دیگری را امتحان می‌کنند. این تکنیک که به  «استدلال»[34] (تفکر منطقی) (رِیزِنِینْگ)[35] معروف است (بله، دقیقاً می‌دانیم این اصطلاح چه بار معنایی دارد)، می‌تواند این فناوری را دقیق‌تر کند، به‌ویژه در مسائل ریاضی، فیزیک و منطق. چیز بعدی که مهم است، ابزارهای هوش مصنوعی[36] هستند که قادر به انجام وظایف پیچیده‌تر خواهند بود. اینجا می‌بینید که چطور عمل خواهند کرد. این موضوع همچنین برای عامل‌ها(اجنت‌ها) حیاتی است.

در دسامبر، گوگل دیپ‌مایند یک عامل آزمایشی جدید برای مرور وب به نام مَری‌نِر [37]معرفی کرد. در میانه یک دمو پیش‌نمایش که شرکت به «ام‌آی‌تی‌ تکنولوژی ریویو» رائه داد، مَری‌نِر به نظر می‌رسید که گیر کرده است. می‌گَها گُوئل[38]، مدیر محصول در این شرکت، از عامل خواسته بود که دستور پخت کوکی کریسمس‌هایی که شبیه عکس‌هایی که به آن داده بود پیدا کند. مارینر دستور پختی را در وب پیدا کرد و شروع به اضافه کردن مواد به سبد خرید آنلاین گوئل کرد. سپس گیر کرد؛ نمی‌توانست نوع آرد را انتخاب کند. گوئل دید که مارینر گام‌های خود را در یک پنجره چت توضیح می‌دهد: می‌گوید: من از دکمه بازگشت مرورگر برای بازگشت به دستور پخت استفاده می‌کنم. این لحظه قابل توجهی بود. به جای برخورد با مانع، عامل وظیفه را به مجموعه‌ای از اقدامات جداگانه تقسیم کرده و یکی را که ممکن است مشکل را حل کند، انتخاب کرده بود. فهمیدن اینکه باید دکمه بازگشت را فشار بدهید شاید ساده به نظر برسد، اما برای یک ربات بدون فکر مانند علم موشک است. و این کار کرد: مارینر به دستور پخت برگشت، نوع آرد را تأیید کرد و به پر کردن سبد خرید گوئل ادامه داد. گوگل دیپ‌مایند همچنین در حال ساخت نسخه‌ای آزمایشی از مدل زبان بزرگ جدید خود به نام  جِمی‌نی[39](جمنای) 2.0 است که از این رویکرد گام به گام برای حل مسائل استفاده می‌کند، که به آن تفکر سریع[40] جِمی‌نی 2.0 گفته می‌شود.

اما اوپن‌ای‌آی و گوگل تنها نوک کوه یخ هستند. شرکت‌های زیادی در حال ساخت مدل‌های زبانی بزرگ مشابهی هستند که از تکنیک‌های مشابه استفاده می‌کنند، و این مدل‌ها را در انجام طیف وسیعی از وظایف، از پخت و پز تا کدنویسی، بهتر می‌کنند. انتظار داشته باشید که امسال هیاهوی بیشتری در مورد استدلال (رِیزِنِینْگ) بشنوید (ویل داگلاس هِون)[41].

3- دوران رونق برای هوش مصنوعی در علوم

یکی از هیجان‌انگیزترین کاربردهای هوش مصنوعی، تسریع کشف‌ها در علوم طبیعی است. شاید بزرگترین تایید توانمندی هوش مصنوعی در این حوزه، در ماه اکتبر گذشته بود، زمانی که آکادمی سلطنتی علوم سوئد جایزه نوبل شیمی را به دِمِیس هَسابیس [42]و جان ام. جامپر[43] از گوگل دیپ‌مایند به دلیل ساخت ابزار آلفا فُلد[44] که قادر به حل مشکلات چینش پروتئین‌ها است، و به دیوید بیکر [45]به خاطر ساخت ابزارهایی برای کمک به طراحی پروتئین‌های جدید اهدا کرد.

انتظار می‌رود که این روند در سال آینده ادامه یابد و مدل‌ها و مجموعه‌های داده‌ای بیشتری که به‌طور خاص برای کشف‌های علمی طراحی شده‌اند، پدید آیند. پروتئین‌ها هدف مناسبی برای هوش مصنوعی بودند، زیرا این حوزه داده‌های موجود بسیار خوبی داشت که مدل‌های هوش مصنوعی می‌توانستند روی آنها آموزش ببینند. دنبال کشف «چیز بزرگ بعدی» هستند. یکی از زمینه‌های بالقوه، علم مواد است. متا [46]مجموعه‌های داده و مدل‌های عظیمی را منتشر کرده است که می‌تواند به دانشمندان کمک کند تا با استفاده از هوش مصنوعی، مواد جدید را بسیار سریع‌تر کشف کنند. در ماه دسامبر، هَگینگ فِی [47]به همراه استارتاپ انتالپیک[48] پروژه‌ی اوپن‌سورس لِ ماتِریال[49] را راه‌اندازی کردند که هدف آن ساده‌سازی و تسریع تحقیقات مواد است. اولین پروژه آنها، مجموعه داده‌ای است که مجموعه‌های داده مواد برجسته را یکپارچه، تمیز و استاندارد می‌کند.

سازندگان مدل‌های هوش مصنوعی همچنین تمایل دارند محصولات مولدی خود را به‌عنوان ابزارهای تحقیقاتی برای دانشمندان ارائه دهند. اوپن‌ای‌آی به دانشمندان این فرصت را داد که مدل جدید o1 خود را آزمایش کنند و ببینند که چگونه می‌تواند از آنها در تحقیقات پشتیبانی کند. نتایج امیدوارکننده بود. داشتن ابزاری از هوش مصنوعی که بتواند به شیوه‌ای مشابه یک دانشمند عمل کند، یکی از آرزوهای دنیای فناوری است. در بیانیه‌ای که در اکتبر سال گذشته منتشر شد، بنیان‌گذار آنتروپیک [50]داریو آمودی [51]، علم، به‌ویژه زیست‌شناسی را به‌عنوان یکی از زمینه‌های کلیدی که هوش مصنوعی قدرتمند می‌تواند کمک کند، برجسته کرد. آمودی پیش‌بینی می‌کند که در آینده، هوش مصنوعی نه تنها به‌عنوان یک روش تجزیه و تحلیل داده‌ها، بلکه به‌عنوان یک «زیست‌شناس مجازی که تمام کارهایی را که زیست‌شناسان انجام می‌دهند، انجام می‌دهد»، عمل کند. ما هنوز از رسیدن به این سناریو فاصله داریم. اما سال آینده، ممکن است شاهد گام‌های مهمی به سوی آن باشیم (ملیسا هایکیلّا )[52].

4-همکاری نزدیک‌تر شرکت‌های هوش مصنوعی با بخش امنیت ملی

برای شرکت‌های هوش مصنوعی که حاضر به ارائه ابزارهای خود به نظارت مرزی، جمع‌آوری اطلاعات و سایر وظایف امنیت ملی هستند، پول زیادی وجود دارد. ارتش آمریکا چندین طرح جدید راه‌اندازی کرده که نشان‌دهنده تمایل شدید آن به استفاده از هوش مصنوعی است، از جمله برنامه رِپْلِکِیتُور[53] که بر اساس تجربه‌ها و نیازهای ناشی از جنگ در اوکراین طراحی شده است و وعده داده شده که یک میلیارد دلار برای پهپادهای کوچک هزینه کند. همچنین واحد قابلیت‌های سریع هوش مصنوع[54] که در حال به‌کارگیری هوش مصنوعی در بخش‌های مختلف، از تصمیم‌گیری‌های میدان نبرد گرفته تا مدیریت لجستیک، است. ارتش‌های اروپایی نیز تحت فشار هستند تا سرمایه‌گذاری‌های فناوری خود را افزایش دهند، که این فشار ناشی از نگرانی‌ها از این است که دولت دونالد ترامپ ممکن است هزینه‌های مربوط به اوکراین را کاهش دهد. همچنین، تنش‌های روزافزون بین تایوان و چین نیز تأثیر زیادی بر ذهن برنامه‌ریزان نظامی دارد. آمریکا هنوز قانون فدرالی مشخصی برای حفاظت از حریم خصوصی ندارد، اما اقدامات قانونی اخیر علیه دلالان داده‌ها ممکن است محافظت‌های جدیدی برای اطلاعات شخصی شهروندان آمریکایی فراهم کند.

در سال 2025، این روندها همچنان به نفع شرکت‌های دفاعی مانند پالَنْتیر[55] و أَنْدوریل[56] خواهد بود که در حال حاضر از داده‌های نظامی محرمانه برای آموزش مدل‌های هوش مصنوعی استفاده می‌کنند. صنعت دفاعی که پول زیادی دارد، شرکت‌های هوش مصنوعی بزرگ را نیز ترغیب می‌کند که به این حوزه وارد شوند. در دسامبر، اوپن‌ای‌آی اعلام کرد که با أَنْدوریل برای یک برنامه مشترک همکاری می‌کند تا پهپادها را نابود کند. این شرکت از سیاست قبلی خود که مخالف همکاری با ارتش بود، فاصله گرفته است. حالا اوپن‌ای‌آی به جمع شرکت‌هایی مانند  مایکروسافت[57]، آمازون[58] و گوگل[59] پیوسته که سال‌هاست با پنتاگون همکاری می‌کنند. دیگر رقبا در حوزه هوش مصنوعی که میلیاردها دلار برای آموزش و توسعه مدل‌های جدید خرج می‌کنند، در سال 2025 با فشار بیشتری مواجه خواهند شد تا به درآمدزایی توجه کنند. ممکن است آن‌ها مشتریان غیرنظامی پیدا کنند که هزینه زیادی برای استفاده از عامل‌های هوش مصنوعی که وظایف پیچیده را انجام می‌دهند، بپردازند یا صنایع خلاقی[60] که می‌خواهند از ابزارهای تولید تصویر و ویدیو استفاده کنند. اما آن‌ها همچنین با وسوسه زیادی مواجه خواهند شد تا در پروژه‌های سودآور پنتاگون شرکت کنند. انتظار می‌رود که شاهد این باشیم که شرکت‌ها با این سؤال روبه‌رو شوند که آیا کار کردن در پروژه‌های دفاعی با ارزش‌های آن‌ها در تضاد است یا خیر. دلیل تغییر موضع اوپن‌ای‌آی این بود که این شرکت نوشت: «دموکراسی‌ها باید همچنان پیشگام توسعه هوش مصنوعی باشند»، و این که کمک به ارتش می‌تواند به پیشرفت این هدف کمک کند. در سال 2025، ما شاهد خواهیم بود که دیگر شرکت‌ها از این الگو پیروی کنند (جِیمز اُ’دانِل)[61].

5- شرکت اِن‌ویدیا با رقابت جدی روبه‌رو می‌شود

در بیشتر دوران رونق کنونی هوش مصنوعی، اگر یک استارتاپ فناوری بودید و می‌خواستید شانس خود را در ساخت یک مدل هوش مصنوعی امتحان کنید، جنسن هوانگ [62]مرد موردنظر شما بود. به‌عنوان مدیرعامل اِن‌ویدیا[63]، ارزشمندترین شرکت جهان، او این کمپانی را به رهبر بی‌چون‌وچرای تولید تراشه‌هایی تبدیل کرد که هم برای آموزش مدل‌های هوش مصنوعی و هم برای اجرای آن‌ها هنگام استفاده کاربران (فرایندی که “استنتاج” نام دارد) به کار می‌روند. اما چندین عامل ممکن است این وضعیت را در سال ۲۰۲۵ تغییر دهند. از یک سو، غول‌هایی مثل آمازون، برودکام[64]، ای‌ام‌دی[65] و دیگر شرکت‌ها سرمایه‌گذاری هنگفتی روی تراشه‌های جدید کرده‌اند و نشانه‌های اولیه حاکی از آن است که این تراشه‌ها می‌توانند رقابت نزدیکی با انویدیا داشته باشند به‌ویژه در حوزه استنتاج[66]، جایی که برتری انویدیا چندان مطلق نیست. از سوی دیگر، تعداد فزاینده‌ای از استارتاپ‌ها از زاویه‌ای متفاوت به رقابت با انویدیا می‌پردازند. به‌جای تلاش برای بهبود تدریجی طراحی‌های انویدیا، استارتاپ‌هایی مانند گْراک[67] روی معماری‌های کاملاً جدید تراشه سرمایه‌گذاری‌های پرریسکی انجام می‌دهند که در صورت موفقیت، می‌توانند در بلندمدت آموزش مدل‌های هوش مصنوعی را کارآمدتر و مؤثرتر کنند. این آزمایش‌ها در سال ۲۰۲۵ همچنان در مراحل اولیه خواهند بود، اما این احتمال وجود دارد که یک رقیب برجسته معادله را تغییر داده و این تصور را بشکند که مدل‌های برتر هوش مصنوعی وابسته به تراشه‌های انویدیا هستند. در کنار این رقابت، جنگ ژئوپلیتیکی بر سر تراشه‌ها نیز ادامه خواهد داشت. این جنگ تا کنون بر دو استراتژی تکیه داشته است:

  1. محدودیت‌های صادراتی: کشورهای غربی در تلاش هستند تا صادرات تراشه‌های پیشرفته و فناوری‌های ساخت آن‌ها به چین را محدود کنند.
  2. تقویت تولید داخلی: طرح‌هایی مانند “قانون چیپس[68] آمریکا” با هدف افزایش تولید نیمه‌هادی‌ها در داخل ایالات متحده اجرایی شده‌اند.

دونالد ترامپ ممکن است این محدودیت‌های صادراتی را تشدید کند و وعده داده است که تعرفه‌های سنگینی بر هرگونه کالای وارداتی از چین اعمال کند. چنین تعرفه‌هایی در سال ۲۰۲۵ تایوان را به مرکز جنگ‌های تجاری تبدیل خواهد کرد، زیرا ایالات متحده به‌شدت به تایوان وابسته است (به دلیل حضور شرکت تی-اِس-اِم-سی[69]، بزرگ‌ترین تولیدکننده تراشه در جهان). از سوی دیگر، تایوان اعلام کرده است که به شرکت‌های تایوانی مستقر در چین کمک خواهد کرد تا فعالیت‌های خود را به تایوان منتقل کنند تا از تعرفه‌های پیشنهادی ترامپ در امان بمانند. این موضوع می‌تواند انتقادات بیشتری را از سوی ترامپ برانگیزد، زیرا او از هزینه‌های آمریکا برای دفاع از تایوان در برابر چین ابراز نارضایتی کرده است. به عبارتی دیگر وقتی تولیدات تراشه‌ها از چین به تایوان منتقل می‌شود، شرکت‌های آمریکایی همچنان از تولیدات تراشه‌ها که در تایوان ساخته می‌شوند استفاده می‌کنند. در نتیجه حتی اگر بر چین تعرفه اعمال شود، همچنان آمریکا نمی‌تواند به‌طور کامل از واردات تراشه‌ها که در تایوان است، جلوگیری نماید.

هنوز مشخص نیست که این عوامل چگونه بر بازار تأثیر خواهند گذاشت، اما نتیجه قطعی این است که فشار برای کاهش وابستگی به تایوان افزایش خواهد یافت که دقیقاً همان هدف قانون چیبس است. با آغاز توزیع بودجه این برنامه، سال آینده ممکن است اولین نشانه‌های واقعی از تأثیر آن بر تولید داخلی تراشه‌ها آشکار شود (جیمز اُ’دانِل).

پایان پیام/


[1] Customized Chatbots.

[2] interactive helper apps powered by multimodal large language models.

[3] Generative Video.

[4] OpenAI.

[5] Google DeepMind.

[6] Sora.

[7] Veo.

[8] General-Purpose Robots.

[9] LLM.

[10] Robotics.

[11] AI-Generated Election Disinformation.

[12] Deepfakes.

[13] Generative Virtual Playgrounds.

[14] Generative Images.

[15] Generative Video.

[16] Generative Virtual Worlds.

[17] Google DeepMind.

[18] Genie.

[19] Still Image.

[20] 2D Platform Game.

[21] Starter Image.

[22] Entire Virtual World.

[23] Video Games.

[24] Generative 3D Models.

[25] Game Concepts.

[26] Sketch.

[27] Playable Environment.

[28] Robot Training.

[29] World Labs

[30] Spatial Intelligence.

[31] Robotics.

[32] Generative Virtual Worlds.

[33] GPT-4.

[34] Reasoning.

[35] reasoning

[36] AI tools.

[37] Mariner.

[38] Megha Goel.

[39] Gemini.

[40] Flash Thinking.

[41] Will Douglas Heaven.

[42] Demis Hassabis.

[43] John M. Jumper.

[44] AlphaFold.

[45] David Baker.

[46] Meta.

[47] Hugging Face.

[48] Entalpic.

[49] LeMaterial.

[50] Anthropic.

[51] Dario Amodei.

[52] Melissa Heikkilä.

[53] Replicator.

[54] Artificial Intelligence Rapid Capabilities Cell.

[55] Palantir.

[56] Anduril.

[57] Microsoft.

[58] Amazon.

[59] Google.

[60] Creative industries.

[61] James O’Donnell.

[62] Jensen Huang.

[63] Nvidia.

[64] Broadcom.

[65] AMD.

[66] Inference.

[67] Groq.

[68] CHIPS.

[69] TSMC.

برای نوشتن دیدگاه باید وارد بشوید.
keyboard_arrow_up