لاعب كرة قدم متعرق يسكب شرابه مباشرةً بجانب فمه. ثم تندمج الزجاجة مع أنفه. هذا الفيديو الغريب افتتح إعلانًا في Super Bowl لعام 2024. لم يكن الفيديو حقيقيًا. صانع مشروب رياضي أنشأه باستخدام الذكاء الاصطناعي التوليدي.
الذكاء الاصطناعي، أو AI، هو أي تقنية يمكنها أداء مهام تتطلب عادةً دماغًا بشريًا. المهام التي تتضمن إنشاء شيء ما – مثل فيديو أو صورة أو مقال أو أغنية – تندرج تحت فئة خاصة: الذكاء الاصطناعي التوليدي. كان إعلان Super Bowl يسخر من المحتوى المبكر الذي تم إنشاؤه بالذكاء الاصطناعي، والذي كان يظهر غالبًا بشكل غريب. قال الإعلان: "لا يوجد بديل للحقيقة". ومع ذلك، ينتشر المحتوى الذي يتم إنشاؤه بالذكاء الاصطناعي على نطاق واسع. كما أنه يصبح أكثر واقعية. أحيانًا يبدو حقيقيًا لدرجة أنه يمكن أن يُخطئ في كونه واقعًا.
يستخدم الناس الذكاء الاصطناعي التوليدي لإنشاء ميمات مضحكة على وسائل التواصل الاجتماعي والمساعدة في الواجبات المنزلية. كما يستخدمونه أيضًا لكتابة رموز برمجية، وإنشاء اختبارات، وتوضيح الكتب، وتلخيص الأبحاث العلمية، وحتى للمساعدة في تحديد أدوية جديدة محتملة. لكن الذكاء الاصطناعي التوليدي أثار الكثير من الجدل.
فهو يخطئ أحيانًا في الحقائق. وأحيانًا ينتج محتوى متحيزًا. وبعض الناس يستخدمونه للغش أو نشر معلومات مضللة. بالإضافة إلى ذلك، يشعر العديد من الفنانين والمبدعين بالغضب، حيث يشتكون من أن هذه التقنية الجديدة تستغل أعمالهم أو تقلل من قيمتها. مثل أي تقنية، يمتلك الذكاء الاصطناعي التوليدي جوانب إيجابية وسلبية. لنتعرف على كيفية عمله.
الذكاء الاصطناعي، أو AI، هو أي تقنية يمكنها أداء مهام تتطلب عادةً دماغًا بشريًا. المهام التي تتضمن إنشاء شيء ما – مثل فيديو أو صورة أو مقال أو أغنية – تندرج تحت فئة خاصة: الذكاء الاصطناعي التوليدي. كان إعلان Super Bowl يسخر من المحتوى المبكر الذي تم إنشاؤه بالذكاء الاصطناعي، والذي كان يظهر غالبًا بشكل غريب. قال الإعلان: "لا يوجد بديل للحقيقة". ومع ذلك، ينتشر المحتوى الذي يتم إنشاؤه بالذكاء الاصطناعي على نطاق واسع. كما أنه يصبح أكثر واقعية. أحيانًا يبدو حقيقيًا لدرجة أنه يمكن أن يُخطئ في كونه واقعًا.
يستخدم الناس الذكاء الاصطناعي التوليدي لإنشاء ميمات مضحكة على وسائل التواصل الاجتماعي والمساعدة في الواجبات المنزلية. كما يستخدمونه أيضًا لكتابة رموز برمجية، وإنشاء اختبارات، وتوضيح الكتب، وتلخيص الأبحاث العلمية، وحتى للمساعدة في تحديد أدوية جديدة محتملة. لكن الذكاء الاصطناعي التوليدي أثار الكثير من الجدل.
فهو يخطئ أحيانًا في الحقائق. وأحيانًا ينتج محتوى متحيزًا. وبعض الناس يستخدمونه للغش أو نشر معلومات مضللة. بالإضافة إلى ذلك، يشعر العديد من الفنانين والمبدعين بالغضب، حيث يشتكون من أن هذه التقنية الجديدة تستغل أعمالهم أو تقلل من قيمتها. مثل أي تقنية، يمتلك الذكاء الاصطناعي التوليدي جوانب إيجابية وسلبية. لنتعرف على كيفية عمله.
مرحبًا بك في حديقة الروبوتات
لاستخدام الذكاء الاصطناعي التوليدي، يبدأ شخص ما بطرح موجه. قد يكون هذا سؤالًا يريد إجابته، أو وصفًا لصورة أو فيديو أو أغنية يريد إنشائها. بعد ذلك، يقدم هذا الموجه إلى نموذج ذكاء اصطناعي، وهو نوع من الخوارزميات الحاسوبية الذكية. يستجيب النموذج للسؤال أو يُنشئ ما طلبه الشخص. قد يستغرق هذا الأمر بضع ثوانٍ فقط.
في السنوات الأخيرة، طورت الشركات عددًا هائلًا من الأدوات التي يمكن للناس استخدامها للتفاعل مع نماذج الذكاء الاصطناعي التوليدي. يُطلق على هذه الأدوات أحيانًا اسم الروبوتات.
يمكن لروبوتي Midjourney وStable Diffusion إنشاء صور فنية أو واقعية للغاية. يتيح Sora وRunway إنشاء مقاطع فيديو. يقوم MuseNet وAudiocraft بتأليف الموسيقى. أما روبوتات الدردشة مثل ChatGPT وClaude، فتنتج مقالات ورسائل إلكترونية وقصصًا ورموزًا برمجية والمزيد. بعض هذه الروبوتات مبنية على نماذج أساسية مثل GPT-4 أو BERT، والتي يمكنها الاستجابة وإنشاء مزيج من أنواع المحتوى المختلفة.
كان الذكاء الاصطناعي التوليدي موجودًا بشكل أو بآخر منذ عام 1961 على الأقل. ففي ذلك الوقت، تم تطوير روبوت محادثة يُدعى ELIZA يمكنه تبادل الرسائل مع الأشخاص. جعل نموذج ذكاء اصطناعي بسيط هذا الأمر ممكنًا، حيث كان يتبع قواعد لاختيار الردود من قائمة مكتوبة مسبقًا. أما روبوتات اليوم، فهي أكثر تعقيدًا بكثير.
في السنوات الأخيرة، طورت الشركات عددًا هائلًا من الأدوات التي يمكن للناس استخدامها للتفاعل مع نماذج الذكاء الاصطناعي التوليدي. يُطلق على هذه الأدوات أحيانًا اسم الروبوتات.
يمكن لروبوتي Midjourney وStable Diffusion إنشاء صور فنية أو واقعية للغاية. يتيح Sora وRunway إنشاء مقاطع فيديو. يقوم MuseNet وAudiocraft بتأليف الموسيقى. أما روبوتات الدردشة مثل ChatGPT وClaude، فتنتج مقالات ورسائل إلكترونية وقصصًا ورموزًا برمجية والمزيد. بعض هذه الروبوتات مبنية على نماذج أساسية مثل GPT-4 أو BERT، والتي يمكنها الاستجابة وإنشاء مزيج من أنواع المحتوى المختلفة.
كان الذكاء الاصطناعي التوليدي موجودًا بشكل أو بآخر منذ عام 1961 على الأقل. ففي ذلك الوقت، تم تطوير روبوت محادثة يُدعى ELIZA يمكنه تبادل الرسائل مع الأشخاص. جعل نموذج ذكاء اصطناعي بسيط هذا الأمر ممكنًا، حيث كان يتبع قواعد لاختيار الردود من قائمة مكتوبة مسبقًا. أما روبوتات اليوم، فهي أكثر تعقيدًا بكثير.
من التدريب إلى التحدث
على عكس ELIZA، لا تتبع نماذج الذكاء الاصطناعي التوليدي الحديثة قواعد مبرمجة مسبقًا. وبدلاً من ذلك، تتعلم من الأمثلة خلال عملية تُعرف باسم التدريب. (ينطبق هذا على معظم أنواع الذكاء الاصطناعي الشائعة اليوم، وليس فقط الذكاء الاصطناعي التوليدي).
بشكل عام، كلما زاد عدد الأمثلة التي يتدرب عليها نموذج الذكاء الاصطناعي، كان أداؤه أفضل. يُعد جمع مجموعات ضخمة من البيانات للتدريب جزءًا مهمًا من تطوير الذكاء الاصطناعي. على سبيل المثال، لتدريب سيارة ذاتية القيادة، يحتاج المطورون إلى الكثير من بيانات القيادة.
تدربت نماذج الذكاء الاصطناعي التوليدية الأكثر شيوعًا اليوم على مجموعات بيانات ضخمة بشكل مذهل. على سبيل المثال، تدرب نموذجا توليد الصور Stable Diffusion وMidjourney على نفس مجموعة البيانات، التي تحتوي على 2.3 مليار صورة مع تسميات توضيحية. مجموعة بيانات تدريب ChatGPT ليست علنية، لكنها على الأرجح احتوت على حوالي 300 مليار كلمة، جاءت بشكل أساسي من الكتب والمواقع الإلكترونية ومحتويات أخرى عبر الإنترنت.
أثناء التدريب، تعتمد معظم نماذج الذكاء الاصطناعي الحديثة على تقنية تُعرف باسم التعلم العميق. هذه الطريقة تُمكّن الذكاء الاصطناعي من معالجة كميات هائلة من البيانات لاكتشاف الأنماط. في جوهرها، تبني هذه العملية سلسلة من الخرائط. تُوضع العناصر التي تظهر معًا بشكل متكرر في البيانات بالقرب من بعضها البعض في هذه الخرائط.
إليك كيف يعمل ذلك مع نموذج ذكاء اصطناعي يحلل الصور: يبني النموذج خريطة أولية تُجمّع وحدات البكسل الفردية، ثم تُجمّع خرائط أخرى أنماط وحدات البكسل، بينما تتعقب الخرائط عالية المستوى أنماط وأسلوب الصور.
وبالمثل، فإن النموذج الذي يتعلم من الموسيقى سيقوم برسم خريطة لكل شيء بدءًا من النوتات الفردية وحتى نوع الأغنية.
بشكل عام، كلما زاد عدد الأمثلة التي يتدرب عليها نموذج الذكاء الاصطناعي، كان أداؤه أفضل. يُعد جمع مجموعات ضخمة من البيانات للتدريب جزءًا مهمًا من تطوير الذكاء الاصطناعي. على سبيل المثال، لتدريب سيارة ذاتية القيادة، يحتاج المطورون إلى الكثير من بيانات القيادة.
تدربت نماذج الذكاء الاصطناعي التوليدية الأكثر شيوعًا اليوم على مجموعات بيانات ضخمة بشكل مذهل. على سبيل المثال، تدرب نموذجا توليد الصور Stable Diffusion وMidjourney على نفس مجموعة البيانات، التي تحتوي على 2.3 مليار صورة مع تسميات توضيحية. مجموعة بيانات تدريب ChatGPT ليست علنية، لكنها على الأرجح احتوت على حوالي 300 مليار كلمة، جاءت بشكل أساسي من الكتب والمواقع الإلكترونية ومحتويات أخرى عبر الإنترنت.
أثناء التدريب، تعتمد معظم نماذج الذكاء الاصطناعي الحديثة على تقنية تُعرف باسم التعلم العميق. هذه الطريقة تُمكّن الذكاء الاصطناعي من معالجة كميات هائلة من البيانات لاكتشاف الأنماط. في جوهرها، تبني هذه العملية سلسلة من الخرائط. تُوضع العناصر التي تظهر معًا بشكل متكرر في البيانات بالقرب من بعضها البعض في هذه الخرائط.
إليك كيف يعمل ذلك مع نموذج ذكاء اصطناعي يحلل الصور: يبني النموذج خريطة أولية تُجمّع وحدات البكسل الفردية، ثم تُجمّع خرائط أخرى أنماط وحدات البكسل، بينما تتعقب الخرائط عالية المستوى أنماط وأسلوب الصور.
وبالمثل، فإن النموذج الذي يتعلم من الموسيقى سيقوم برسم خريطة لكل شيء بدءًا من النوتات الفردية وحتى نوع الأغنية.
يتبع نموذج الذكاء الاصطناعي التوليدي هذه الخرائط لإنشاء شيء ما. عندما تطرح سؤالًا على ChatGPT، فإنه يبحث عن أقرب التطابقات لكلماتك في خرائطه، ثم ينظر إلى ما حولها. من هناك، يتنبأ بالكلمة أو العبارة التي من المرجح أن تأتي بعد ذلك. ثم يكرر هذه العملية مرارًا وتكرارًا لاختيار الكلمات أو العبارات التالية بشكل جيد، واحدة تلو الأخرى. ولإنشاء صورة، يتنبأ Midjourney باللون الأكثر احتمالًا للبكسل التالي أو لمجموعة من البكسلات، مرة بعد مرة.
تنطوي هذه التنبؤات على درجة معينة من العشوائية. لذلك يتبع النموذج مسارًا مختلفًا قليلًا في خريطته في كل مرة. وهذا يعني أن نفس الموجه سيعطي نتائج مختلفة قليلًا في كل مرة.
الضبط الدقيق من أجل الأمان والصدق
لا يفهم نموذج الذكاء الاصطناعي التوليدي الكلمات أو الصور أو الأصوات التي يُنشئها حقًا. وبدون تدريب إضافي، يمكنه بسهولة إنتاج محتوى مسيء أو غير صحيح أو ضار. يعمل مطورو الذكاء الاصطناعي على منع ذلك، وتُعرف هذه العملية باسم الضبط الدقيق.
الطريقة الأكثر شيوعًا لضبط نموذج الذكاء الاصطناعي التوليدي هي استخدام ملاحظات البشر. في هذه العملية، يقوم الأشخاص بمراجعة استجابات الذكاء الاصطناعي لموجه معين، ثم يختارون الردود التي يفضلونها. يؤدي هذا إلى جعل مسارات معينة داخل خريطة النموذج أسهل في التتبع، بينما تصبح مسارات أخرى أكثر صعوبة.
وبمجرد تدريب النموذج بالكامل، قد يضيف المطورون أيضًا قواعد أو مرشحات لمراجعة الموجهات التي يقدمها المستخدمون. يمكن لهذه المرشحات منع النموذج من الرد على موجهات غير آمنة أو إشكالية.
ومع ذلك، فإن فرض قيود كثيرة على الروبوت يمكن أن يقلل من فائدته وإبداعه. لذلك يسعى المطورون إلى إيجاد توازن. يجب على مستخدمي الذكاء الاصطناعي التوليدي أن يكونوا على دراية بعيوبه إلى جانب فرصه.
الطريقة الأكثر شيوعًا لضبط نموذج الذكاء الاصطناعي التوليدي هي استخدام ملاحظات البشر. في هذه العملية، يقوم الأشخاص بمراجعة استجابات الذكاء الاصطناعي لموجه معين، ثم يختارون الردود التي يفضلونها. يؤدي هذا إلى جعل مسارات معينة داخل خريطة النموذج أسهل في التتبع، بينما تصبح مسارات أخرى أكثر صعوبة.
وبمجرد تدريب النموذج بالكامل، قد يضيف المطورون أيضًا قواعد أو مرشحات لمراجعة الموجهات التي يقدمها المستخدمون. يمكن لهذه المرشحات منع النموذج من الرد على موجهات غير آمنة أو إشكالية.
ومع ذلك، فإن فرض قيود كثيرة على الروبوت يمكن أن يقلل من فائدته وإبداعه. لذلك يسعى المطورون إلى إيجاد توازن. يجب على مستخدمي الذكاء الاصطناعي التوليدي أن يكونوا على دراية بعيوبه إلى جانب فرصه.