وكلاء الذكاء الاصطناعي.. تحولات جذرية قادمة في المستقبل القريب | تكنولوجيا
نحن الآن في مايو/أيار من عام 1997، وتحت أنظار وسائل الإعلام، ينتظر بطل الشطرنج الروسي الشهير غاري كاسباروف مواجهة خصمه الخارق للمرة الثانية؛ خصم لم يواجه مثله من قبل، ببساطة لأنه ليس خصمًا بشريا! في هذه المباراة كان خصمه جهاز الحاسوب الخارق “ديب بلو” الذي طورته شركة “آي بي إم” بهدف تعلم لعبة الشطرنج وإتقانها وهزيمة بطل العالم في ذلك الوقت.
بدأت المباراة وسط ترقب الجميع، فاز كاسباروف بالجولة الأولى، ثم خسر الثانية، وتعادل في الجولات الثلاث التالية، ولكن عندما انتصر “ديب بلو” في المباراة بالفوز بالجولة النهائية رفض كاسباروف التصديق؛ ليدخل “ديب بلو” التاريخ بوصفه أول حاسوب يهزم بطلا عالميا في مباراة من 6 جولات تحت ضوابط وقت قياسية.
أشعلت تلك المباراة ثورة تقنية جديدة، وظهر معها توقعات وتأويلات بأن الآلة على وشك هزيمة الإنسان. نعرف الآن بالطبع أن هذا لم يحدث، وأن حاسوب “ديب بلو” لم يعتمد على مفهوم الذكاء الاصطناعي أو تعلم الآلة، ولكنه كان مجرد منفذًا للأوامر البرمجية ومعالجًا لكمية ضخمة من البيانات بهدف إنجاز مهمة محددة هي هزيمة بطل العالم في لعبة الشطرنج.
نعود الآن إلى الحاضر، وبعد مرور أكثر من ربع قرن من الزمان، أصبحنا على أعتاب ثورة جديدة في عالم ذكاء الآلة، وهذه المرة ثورة حقيقية في تطور مجال الذكاء الاصطناعي. التطور الحالي قد يقودنا إلى ما يُعرف بالذكاء الاصطناعي العام “إيه جي آي” (AGI)، من خلال تطوير نماذج جديدة تعرف باسم “وكلاء الذكاء الاصطناعي” (AI Agents) التي يمكنها التفاعل مع البشر بأساليب معقدة، ويمكنها اتخاذ قرارات بصورة مستقلة في مجموعة مجالات متنوعة. ما بدأ بمباراة شطرنج بين بطل العالم وحاسوب خارق أصبح الآن جزءًا لا يتجزأ من كل تفاصيل حياتنا، وهذا يطرح سؤالًا مهما: كيف وصلنا إلى هنا؟
وكلاء الذكاء الاصطناعي
تسعى أوبن إيه آي، وغيرها من الشركات الكبرى في المجال، بكل جهدها للبحث عن منتج طموح آخر يمكنه أن يصبح ثوريا في المستقبل القريب، تمامًا كما فعل روبوت “شات جي بي تي” منذ بداية انطلاق رحلته. لذا، تعمل الشركة على تطوير اثنين من نماذج وكلاء الذكاء الاصطناعي بهدف أتمتة كل مهام العمل تقريبًا، بخاصة العمليات المعقدة، وهذا يقلل الاعتماد على العنصر البشري في هذه العمليات، وفقًا لتقرير صدر من موقع “ذا إنفورميشن” في شهر فبراير/شباط الماضي.
وفي مؤتمر “بيلد 2024” الذي تنظمه مايكروسوفت سنويا، كان أحد أهم الإعلانات هو تطوير المساعد الذكي “كوبايلوت” ليصبح ضمن وكلاء الذكاء الاصطناعي، إذ صممت الشركة هذا المساعد بأسلوب جديد يغير من شكل الأعمال عبر أداء المهام التي تتطلب عادة تدخل الإنسان. وبعكس الإصدارات السابقة، لن تظل نماذج وكلاء الذكاء الاصطناعي الجديدة في انتظار أوامر المستخدم، بل يمكنها إدارة المهام بصورة استباقية مثل مراقبة البريد الإلكتروني وأتمتة إدخال البيانات على جهاز المستخدم.
وفي هذا السياق، تصور تشارلز لامانا، نائب الرئيس التنفيذي لتطبيقات الأعمال والمنصات بمايكروسوفت، سيناريوهات يتولى فيها “كوبايلوت” استفسارات مكتب خدمة تكنولوجيا المعلومات بالشركة وتوجيه الموظفين الجدد، وغيرها من المهام. فمثلًا يمكن للمساعد الذكي “كوبايلوت” أن يستقبل موظفا جديدا في الشركة ويساعده في تسجيل بيانات الموارد البشرية، ويجيب عن أسئلته، ويعرفه بزملائه في الفريق، ويوفر له جداول التدريب، ويحدد له الاجتماعات خلال الأسبوع الأول، إذ ستتيح أتمتة تلك المهام لموظفي الموارد البشرية التركيز على مهام أكثر إستراتيجية وتعقيدًا.
وكذلك في مؤتمر غوغل آي/أو الماضي، عرضت الشركة نسخة أولية لما تأمل أن يصبح المساعد الشخصي الشامل، وأطلقت عليه “مشروع أسترا” (Project Astra)، وهو مساعد ذكي متعدد الوسائط يعمل بالذكاء الاصطناعي في الوقت الفعلي ليتمكن من رؤية العالم ومعرفة أماكن الأشياء وأين تركتها، كما بإمكانه الإجابة عن الأسئلة أو مساعدتك في القيام بأي شيء تقريبا، وهو نوع من وكلاء الذكاء الاصطناعي أيضًا، وهي روبوتات لا تكتفي بالردود على الأسئلة لكنها تنفذ المهام المختلفة نيابة عن المستخدم.
الهدف من تلك النماذج الجديدة التي تسعى لها شركات التقنية الكبرى هو تحويل منتجها الأساسي إلى مساعد شخصي ذكي وقوي يمكن أن يستفيد منه المستخدم في مختلف أمور عمله وحياته، ويساعده في تنفيذ معظم المهام التي كان يقضي فيها ساعات طويلة سابقًا. لذا، يبدو أننا نخطو نحو مستقبل سيتحول فيه “شات جي بي تي”، وغيره من تلك البرمجيات الذكية، إلى مساعد شخصي ينفذ مهام بأغراض عامة، بدلًا من استخدامه في مهام متخصصة، مثل كتابة المحتوى أو توليد الصور وغيرها. وبرأي بعض خبراء المجال، يمثل وكلاء الذكاء الاصطناعي خطوة محتملة نحو الوصول إلى الذكاء الاصطناعي العام. لكن لنفهم كيف يمكن أن يحدث هذا، علينا أن نشرح الأمر منذ بدايته!
استخدامات متعددة
تضم أنظمة الذكاء الاصطناعي مجموعة من النماذج، بدءًا من النماذج التأسيسية إلى النماذج اللغوية المتطورة ثم النماذج التي تتمتع ببعض الاستقلالية. أما النموذج التأسيسي فيمكن تعريفه بأنه نموذج لغوي مُجهز سابقًا، يتدرب على كثير من البيانات النصية المختلفة، ويُشكِّل الأساس الذي تعتمد عليه النماذج اللغوية الأصغر التي تُصمم وتُدرب لأداء مهام محددة، كالرد على الأسئلة مثلا. بهذه الطريقة يمكن بناء نماذج لغوية بدقة دون الحاجة إلى البدء من نقطة الصفر في كل مرة باستخدام النماذج التأسيسية الحالية، ومن أشهر أمثلتها نموذج “جي بي تي-4” الذي يعتمد عليه روبوت المحادثة “شات جي بي تي”، بجانب النماذج التي تُستخدم في توليد المحتوى المرئي مثل “ميدجيرني” و”دالي”.
يأتي في المرحلة التالية الوكلاء المستقلون، أو وكلاء الذكاء الاصطناعي، وهي أنظمة متطورة أكثر، تقدم مستوى أعلى من التعقيد في معالجة المهام، وهذا يعني إضافة طبقات جديدة من الميزات والقدرات المتطورة في كل نموذج. والاستقلالية هنا تعني أن هذا النموذج قادر على الاستجابة للمؤثرات والمحفزات الخارجية دون الحاجة إلى تدخل بشري، بمعنى امتلاكه لإمكانية التكيّف والتفاعل مع مختلف الظروف والأحداث دون برمجة سابقة، بينما يعمل في الوقت ذاته بما يخدم الهدف الأساسي لمطوره أو المستخدم الذي يتحكم به.
السمة المميزة لتلك الأنظمة هي قدرتها على العمل وفق حلقة برمجية مستمرة، لتوليد تعليمات وقرارات ذاتية باستمرار، لتتمكن من العمل باستقلالية دون الحاجة إلى التوجيه البشري المنتظم، كما الحال مع روبوتات المحادثة التي يجب أن تُدخل لها تعليمات مع كل سؤال لتمنحك الإجابة.
ينبغي ملاحظة أن هؤلاء الوكلاء المستقلين لا يتفوقون بالضرورة على النماذج التأسيسية عندما يتعلق الأمر بالمهام المحددة والبسيطة والمباشرة، ولكن ما يتفوقون فيه بدرجة أفضل هو تقسيم المهام المعقدة إلى مهام أصغر وتنفيذها وفق أقصى قدراتهم. وذلك لأن تلك النماذج التأسيسية فعالة وعادةً ما تكون دقيقة، ولكن يمكن التنبؤ بنتائجها، فمثلًا عندما تستخدم “شات جي بي تي” ستكتب له سؤالًا وتنتظر منه الرد في صورة نصية، ومن غير المحتمل أن يتصرف من تلقاء نفسه ويجيب بصورة أخرى، ثم سيتوقف بعدها في انتظار تعليماتك الجديدة. هذا عكس سلوك الوكلاء المستقلين، فغالبًا لا يمكن التنبؤ بأفعالهم، وبإمكانهم إنتاج سيناريوهات ومسارات عمل مختلفة والاختيار بينها لتحقيق الهدف النهائي الذي يرغب به المستخدم، وكل هذا دون الحاجة إلى تدخل منك بمزيد من التعليمات.
ببساطة، يمكن لتلك النماذج إدراك البيئة المحيطة بها ثم استنتاج الخطوة التالية، وبعدها تنفيذ القرارات من دون أي مساعدة بشرية لتحقيق أهدافها، حتى إن كانت تلك الظروف الخارجية متغيرة أو لا يمكن التنبؤ بها، أي إنها ليست مبرمجة سابقًا، وهذه هي ميزة التعلم والتكيّف. لذا، يمكن استخدامها في بيئات معقدة ومتغيرة مثل تصميم الروبوتات وألعاب الفيديو، وتحليل الخدمات المالية وأنظمة القيادة الذاتية، وخدمة العملاء، وإنتاج المساعد الشخصي الفائق الذكاء.
إن ما يميزها عن أنظمة الذكاء الاصطناعي الأخرى هو تعدد استخداماتها، فهي لا تقتصر على الاستفادة من النماذج اللغوية فقط، بل تتمتع بالقدرة على الوصول إلى نماذج تأسيسية مختلفة، مثل نماذج توليد أكواد البرمجة أو الصور أو الفيديو أو الصوت.
كذلك يمكنها استخدام محركات البحث والأدوات الحسابية لإنجاز أي نوع من المهام المسندة إليها، وذلك يقدم بعدًا جديدًا تمامًا لحل المشكلات، إذ تتعامل معها وتعالجها بأسلوب منهجي خطوة بخطوة، بما يشبه أسلوب التفكير البشري في هذا السياق. ومن ضمن إمكاناتها مثلًا تصفح الإنترنت واستخدام التطبيقات المختلفة على أجهزة المستخدم، والاحتفاظ بذاكرة قصيرة وطويلة الأمد، والتحكم في أنظمة تشغيل الحاسب، وإدارة المعاملات المالية، واستخدام النماذج اللغوية لتنفيذ مهام مثل التحليل والتلخيص وتقديم الآراء والإجابة عن الأسئلة.
تلك الإمكانات تؤهلها للتعامل مع المهام الرقمية كأنها مساعد بشري، وذلك يجعلها متعددة الاستخدامات وذات قيمة كبيرة في سياقات مختلفة داخل العمل. ولهذا يعدّها بعض الخبراء أول خطوة نحو وصولنا إلى مفهوم الذكاء الاصطناعي العام. لكن كيف تعمل تلك الأنظمة الحديثة تحديدًا؟
كيف تعمل؟
تعمل تلك الأنظمة عبر تلقي مدخلات المستخدم ومعالجتها، وهو الهدف الأساسي لها، ثم تستفيد من النماذج اللغوية الكبيرة (LLMs) لتقسيم الهدف إلى مهام أصغر يسهل التحكم فيها. ثم تعالج كل مهمة من هذه المهام بصورة منفردة، وتسجل نتائجها لإمكانية استخدامها في خطوات لاحقة.
سنحاول تبسيط كيفية عمل هذه الأنظمة؛ تبدأ تلك الحلقة البرمجية بإعطاء النظام هدفا ينفذه. بمجرد أن يتحدد الهدف، فإن النظام يلتقط صورة ذهنية ويخزنها في بنك الذاكرة. لا يتعلق الأمر هنا فقط بالاحتفاظ بالبيانات بل بمحاولته لفهم واستيعاب المهمة بعمق عبر ربطها بما يعرفه فعلًا. يشبه الأمر اعتمادنا على تجاربنا الخاصة لنفهم المعلومات الجديدة التي نتلقاها، وعندما يبدأ في تنفيذ المهمة يستعين بهذه الذاكرة، ليضمن أن كل فعل أو قرار يستند إلى الخبرة والمعرفة السابقة التي يحتفظ بها.
لكن العملية لا تنتهي عند هذا الحد، فغالبًا ما يؤدي إكمال مهمة واحدة إلى إنشاء مهام جديدة. يحدد النظام تلك المهام بنفسه ثم يضعها في قائمة الانتظار لتنفيذها، بما يضمن استمرار سير العمل دون انقطاع، بجانب تكيّف النظام دائمًا مع احتياجات المستخدم المتغيرة. ومع وجود قائمة انتظار المهام، يجب على النظام بعدها تحديد المهمة ذات الأولوية، وهنا تظهر قدرته على تحديد الأولويات، إذ يقيّم مدى ضرورة كل مهمة وأهميتها، ويرتبها وفقًا لما يحسّن كفاءة النظام ويناسب احتياجات المستخدم.
تتمثل الخطوة الأخيرة في إجراء عملية تنظيف بسيطة، إذ يرتب النظام قائمة المهام، ويمسح المهام المكتملة ويعيد تنظيمها حسب الحاجة للحفاظ على نظافة القائمة استعدادًا للجولة التالية من العمل. تتميز تلك الحلقة بأنها مستمرة وذاتية التنظيم وتعكس مستوى كبيرا من الاستقلالية، دون الحاجة لتدخل المستخدم في كل مهمة، بل إن النظام يتعلم ويطور نفسه كل مرة.
سنحاول شرح الأمر بمثال واقعي: لنفترض أنك تنوي قضاء إجازة وتحتاج إلى البحث عن أماكن جديدة وترغب في حجز رحلة الطيران والفندق وغيرها من التفاصيل، هنا ستلجأ إلى مساعدك الذكي الجديد لتخطيط الرحلة.
الخطوة الأولى أنك ستبلغه برغبتك في قضاء إجازة في شهر يوليو/تموز وتحدد له ميزانية معينة وتخبره بتفضيلاتك في الوجهة التي تريدها، وهذا هو هدف النظام. حينئذ سيبدأ المساعد في البحث داخل مواقع السفر المختلفة على الإنترنت، ويبحث في الوجهات المناسبة، ويقرأ آراء المسافرين وملاحظاتهم عنها، ثم يخزن المعلومات عن أفضل الأماكن التي ظهرت في تصنيفات المسافرين في هذا الوقت من العام.
بعدئذ سيقترح عليك ملخصًا بأفضل وجهات السفر التي وجدها لشهر يوليو/تموز وفقًا لتقييمات المسافرين وآرائهم، ويحدد لك أفضل الوجهات التي تناسب تفضيلاتك وميزانيتك الشخصية، ومنها أن يضع النظام قائمة يحدد فيها أولويات اختياراتك بناءً على تفضيلاتك، ويسألك: هل يبحث عن رحلات طيران وفنادق في هذه الوجهة؟
بعد موافقتك، ينتقل إلى التحقق من رحلات الطيران وحجوزات الفنادق وغيرها من التفاصيل الخاصة بالمكان، مع الحرص على أن كل التفاصيل تتوافق مع تفضيلاتك. وبمجرد تقليص نطاق الاختيارات، والوصول إلى أفضل فندق ورحلة، يعرضها لك ويخبرك بأنه وجد عرضا مميزًا في فندق 4 نجوم به شاطئ خاص، مع رحلة طيران بسعر مناسب. هنا ستمنحه الضوء الأخضر ليحجز الرحلة والفندق، وهذا ما سيفعله فعلًا، لينهي هذا الهدف بنجاح ويرسل لك تأكيدات الحجوزات على بريدك الإلكتروني. ثم في النهاية يستعد للمهمة التالية التي ستخبره بها بخصوص تلك الرحلة.
استخدام جديد!
هذا الاستخدام للذكاء الاصطناعي، الذي يملك فيه القدرة على التفكير بصورة مستقلة مع أداء مهام معقدة ومتنوعة، بدلًا من مجرد تخمين الإجابة، أصبح أمرًا واقعًا خلال المدة الماضية، ويتطور بصورة متسارعة للغاية. يوجد أكثر من مشروع طموح لشركات ناشئة بهدف تطوير مثل هذا المساعد الشخصي الفائق الذكاء مثل مشروع “أوتو جي بي تي” (AutoGPT) و”إيجنت جي بي تي” (AgentGPT) و”بيبي إيه جي آي” (BabyAGI)، وكما ذكرنا فقد شرعت الشركات العملاقة مثل مايكروسوفت وغوغل في تنفيذ خططها الخاصة لتطوير هذا المساعد فعلًا.
وذلك لأنه مع الإمكانات المتنوعة والشاملة للنماذج اللغوية الكبيرة، وعند دمجها داخل هذا المساعد الشخصي الذكي، يمكنها أن تصبح العقل المحرك لمختلف أنواع الأنظمة الآلية المستقلة والقادرة على التواصل مع مكونات البرمجيات والأجهزة المختلفة الأخرى بل التحكم فيها.
ومن أوجه التطور الأخرى في هذا المجال اعتماد “نماذج العالم الواقعي” التي تمكّن وكلاء الذكاء الاصطناعي من فهم تعقيدات البيئة الواقعية والتفاعل معها بوعي أفضل. مثلًا، يمكن استخدام تلك النماذج في أنظمة القيادة الذاتية عبر إنشاء صور في الوقت الفعلي للطريق والمركبات الأخرى والمشاة وعلامات المرور وغيرها، لكي يتنبأ النموذج بالحالات المحتملة لبيئته في المستقبل ويتّخذ قراراته بناء على هذا التنبؤ.
لقد صُمّمت نماذج العالم الواقعي لتمكّن الوكلاء من محاكاة السيناريوهات المستقبلية المحتملة، ومن ثمّ اتخاذ قرارات واعية لإنجاز أهداف النموذج المحددة، وكل ذلك يحدث بينما تستمر تلك النماذج في التعلّم والتكيّف بالاستفادة من تجاربها.
هذه التوجهات الجديدة في المجال تمثل نقلة كبيرة من مرحلة البرمجة التقليدية نحو اعتماد أساليب أكثر تكاملًا وشمولًا للتعلم والتفاعل مع البيئة المحيطة. وبذلك يمكنها أن تفسح المجال أمام عالم جديد من الفرص لأتمتة بعض مهام الأعمال بالكامل، من البداية إلى النهاية، دون أي تدخل بشري، وهذا قد يمنح الإنسان فرصة حقيقية للتركيز على مهام أكثر أهمية وإبداعًا.
تحولات جذرية
في عام 2017، وقبل أن تعقد مايكروسوفت شراكتها مع شركة ناشئة غير معروفة حينئذ تُدعى “أوبن إيه آي”، أرسل بيل غيتس مذكرة إلى الرئيس التنفيذي ساتيا ناديلا ومجموعة من كبار المسؤولين في الشركة.
تنبأ غيتس في رسالته تلك بظهور أنظمة جديدة تعتمد على ما يُعرف باسم “وكلاء الذكاء الاصطناعي”، وهي نسخ متطورة من المساعدات الشخصية الرقمية التي يمكنها التنبؤ برغبات المستخدم واحتياجاته.
وأشار غيتس إلى أن هؤلاء الوكلاء سيكونون أكثر تطورا من المساعدات الرقمية الحالية مثل سيري وأليكسا، وقد يمتلكون قدرات معرفية مذهلة. وذكر غيتس في مذكرته “لن يغير هؤلاء الوكلاء أسلوب تفاعل الجميع مع الحواسيب الشخصية فحسب، بل سيقلبون صناعة البرمجيات رأسا على عقب، وهو ما سيشكل أكبر ثورة في الحوسبة منذ انتقالنا من كتابة الأوامر إلى النقر على الأيقونات”.
كما ذكرنا، هذا التوظيف لنماذج الذكاء الاصطناعي التوليدي قد يمثل أفضل استفادة منها في مهام العمل، والأهم أنه سيحدث تأثيرًا كبيرًا في سلوكنا الرقمي. وكما ذكر بيل غيتس، في شهر مايو/أيار العام الماضي، أن هذه البرمجيات ستؤثر جذريا في سلوك المستخدم الرقمي، وأن الأمر المهم هو “مَن سيفوز بسباق المساعد الشخصي الفائق الذكاء، لأنك لن تستخدم أبدًا مواقع البحث على الإنترنت مرة أخرى، ولن تذهب أبدًا إلى مواقع الإنتاجية، ولن تطلب شراء احتياجاتك من موقع أمازون بعد الآن”. ببساطة، لأن غيتس يرى، كما ترى الشركات الكبرى في المجال، أن تلك المهام ستطلبها مباشرة من هذا المساعد الشخصي الفائق الذكاء.
وفي نوفمبر/تشرين الثاني العام الماضي، كتب بيل غيتس تدوينة مفصّلة يتحدث فيها عن شغفه بعالم البرمجيات، وعن توقعه بأنها ستصبح أكثر ذكاء في المستقبل القريب، إذ يصف الوضع الحالي للبرمجيات بأن إمكاناتها محدودة، وذلك يتطلب تطبيقات منفصلة لتنفيذ مهام مختلفة. ولكنه يتوقع أن تتطور البرمجيات في السنوات الخمس المقبلة إلى “وكلاء الذكاء الاصطناعي” التي تفهم لغة البشر وتتجاوب معها، وتدير مختلف الأنشطة الرقمية بناء على معرفتها بتفضيلات المستخدم الشخصية. فخلافًا لروبوتات المحادثة الحالية المنفصلة والمخصصة لمهام محددة، سيتعلم هؤلاء الوكلاء من تفاعلات المستخدم معهم ويتحسنون بمرور الوقت، بما يوفر تجربة استخدام متكاملة.
وبجانب تغيير سلوكنا الرقمي على الإنترنت، يتوقع غيتس تحولًا جذريا في مختلف المجالات بسبب هذه البرمجيات الجديدة، خاصة في مجالات الرعاية الصحية والتعليم والإنتاجية والترفيه. باختصار، يتوقع غيتس أن تلك البرمجيات ستحدث تغييرًا ثوريا في الحوسبة وفي حياتنا اليومية، ليمثل ذلك نقلة نوعية عمّا يشهده المجال التقني حاليا.
وما أكّده بيل غيتس أيضًا هو أنه مع التقدم والتطور في مجال الذكاء الاصطناعي، خاصة باستخدام النماذج اللغوية الكبيرة، فإننا نتجه نحو مستقبل ينتشر فيه التفاعل مع أجهزة الحاسب عبر المحادثات ويصبح أمرًا شائعًا ومألوفًا أكثر، مع اندماج كامل لهذه البرمجيات داخل مهامنا اليومية.