نشرة حوسبة 41#: المحتوى هو الذهب الأسود في عصر الذكاء الاصطناعي
الذكاء الاصطناعي لا يأتي من عدم، بل من تدريبه على محتوى الآخرين.
السلام عليكم ورحمة الله وبركاته،
حيّاكم الله مشتركي نشرة حوسبة البريدية لعلوم الحاسوب. الحياة المعاصرة قد تكون صعبةً على كلٍ منا، لكننا ولله الحمد ما نزال هنا ومستمرين في مشروع حوسبة وهناك انطلاقات ومبادرات قوية مقبلة قريبًا في المشروع بإذن الله.
💌 كإعلانٍ صغير: ستتحول نشرة حوسبة من كونها تصدر مرة كل أسبوعين (وهو الموعد الذي لم نتمكن من الالتزام به كثيرًا) إلى كونها تصدر على حسب المستجدات الجديدة في المجال كل شهر؛ لا تتوقع أكثر من نشرتين أو ثلاثة منّا في شهر، لكننا قد نباغتك بنشرة بريدية جديدة دون أن تشعر، لهذا احرص دومًا على الاشتراك في قائمتنا البريدية لتكون على علمٍ بالمستجدات.
ستبقى النشرة تصدر حصرًا في يوم جمعة الذي هو عيد كل مسلم، وهو ما يعبّر عن هويتنا وقيمنا التي نعتز بها ومجتمعنا الذي ننتمي إليه❤️🔥 فلا تتوقع منّا نشرة بريدية خارج يوم الجمعة.
لقد مرّ وقتٌ طويل على بداية نشرنا لهذه النشرات البريدية ولهذا أود إعادة تذكيركم هنا بهدف نشرة حوسبة ولماذا ننشرها، والفرق بينها وبين المحتوى على موقعنا:
النشرات البريدية مثل نشرة حوسبة هي لمتابعة الأخبار والمستجدات، وليست للمحتوى دائم الخضرة (Evergreen Content) أو المحتوى الشرحي المفيد عمومًا. المحتوى الكبير والمفيد ننشره كمقالات على موقعنا.
هدف نشرة حوسبة أن يظل المتابع على إلمامٍ عام بمجريات الأحداث الكبرى وارتباطاتها بالمجالات الأخرى عندما يتعلق الأمر بعلوم الحاسوب، وأن يرى أمام عينيه كيف تؤثر كل هذه القوى على عالمنا المعاصر الذي نعيش فيه، وهو بدوره ما قد يفتّح ذهنه على العمل في مبادرات أو مشاريع أو وظائف في هذا المجال.
ابقى متقدمًا بخطوتين على أقرانك عندما يتعلق الأمر بمستجدات علوم الحاسوب، أو منعكساتها الجيوسياسية والاجتماعية والاقتصادية على الحياة المعاصرة؛ فبينما ينشغل البعض بمتابعة الأخبار التقنية العادية مثل هواتف الجالكسي والآيفون، تتابع أنت محتوى عالي الجودة مع تحليلاتٍ لما وراء الخبر عن علوم الحاسوب.
يظل المتابع لمبادرة حوسبة عمومًا قريبًا منّا ومن أعمالنا عبر التفاعل مع المحتوى الذي ننشره في النشرة البريدية، وهو ما يضمن وصولهم مستقبلًا إلى المحتوى الضخم والحقيقي الذي نخطط لنشره في المستقبل إن شاء الله.
دونكم العدد 41 من نشرة حوسبة.
📬 نقاش العدد: المحتوى هو الذهب الأسود في عصر الذكاء الاصطناعي
قبل أن ندخل في موضوع العدد علينا أن نشرح بعض المصطلحات للقرّاء الذين ربما لا يعرفونها.
الذكاء الاصطناعي ليس شيئًا واحدًا، هناك ذكاء اصطناعي متخصص بالتقاط عمليات التزوير وهناك ذكاء اصطناعي يحاول التنبأ بحالة الطقس وهناك ذكاء اصطناعي على شكل نماذج لغوية (LLM - Large Language Models) مثل ChatGPT وGemini وهناك عدة أشكال أخرى له. كل واحدٍ من هذه الأنواع بحاجة إلى عملية تدريب (Training) خاصة به.
تدريب نماذج الذكاء الاصطناعي هو عملية عرض كميّات مناسبة من البيانات المصّنفة عليها بهدف جعلها تعرف عبر عمليات الإحصاء ما هي النتيجة المتوقعة أو المطلوبة لأي بيانات مستقبلية قد تمرّ عليها. فمثلًا، يمكن تمرير جميع البيانات التاريخية لأحد البنوك فيما يتعلق بعمليات التزوير السابقة التي حصلت مع العملاء بهدف جعل الذكاء الاصطناعي يلتقط أي نمط مشابه لهذه البيانات مستقبلًا مع أي عميل محتمل.
كلما كانت البيانات أكثر دقة، ومصنّفة بوضوح، وعالية الجودة، كانت النتائج القادمة من نموذج الذكاء الاصطناعي هذا أفضل وأحسن.
وبالتالي، امتلاك بيانات التدريب المناسبة لكل نموذج هو عاملٌ أساسي لجودة ذلك النموذج.
ما هي البيانات التي تحتاجها النماذج اللغوية مثل ChatGPT وGemini وغيرها من النماذج؟ ببساطة هي المحتوى النصّي، بل وأطنانٌ من المحتوى النصّي. ولهذا فإن مطوري هذه النماذج بحاجة ملحّة للحصول على المحتوى لتدريب هذه النماذج بأي طريقة.
لهذا تجد في الأخبار الأخيرة:
توقيع موقع ريديت صفقة بقيمة 60 مليون دولار لتدريب نماذج جوجل اللغوية على كامل محتوى الموقع
إعلان شركة Slack عن أنها ستدرّب نماذجها اللغوية على بيانات المستخدمين إلا أن طلبوا عدم فعل ذلك
توقيع شركة Dotdash Meredith، وهي أكبر ناشر للمحتوى في أمريكا، صفقة بيانات مع OpenAI
تلجأ شركات مثل Google وOpenAI إلى عقد شراكاتٍ مع أصحاب المحتوى الضخم هؤلاء لأنهم يريدون تفادي المشاكل القانونية الناتجة عن تدريب نماذجهم اللغوية على محتواهم دون إذنهم. تسمح لهم هذه الصفقات بفعل ذلك قانونيًا دون مشاكل.
هكذا يتبيّن لك إذًا، كيف أن المحتوى هو الذهب الأسود في عصر الذكاء الاصطناعي.
ولهذا فإن من يمتلك أكبر وصولٍ إلى هذا المحتوى، هو أكبر الرابحين اليوم. وهو بالطبيعة الحال سيكون الشركات التقنية الكبرى.
أعلنت جوجل مثلًا في مؤتمرها الأخير عن أطنانٍ من مميزات الذكاء الاصطناعي على امتداد خدماتها، لكن أهم واحدة في سياقنا كانت ما يسمّى بـSGE أو “الذكاء الاصطناعي داخل البحث”؛ ومن اسمها ببساطة هي ميزة تجعل محرك البحث جوجل يجاوب عن السؤال الذي تبحث عنه في مربع البحث مباشرةً دون أن تحتاج استعراض مواقع الإنترنت الواحد تلو الآخر، أي أنه مثل ChatGPT لكن داخل مربع بحث جوجل نفسه وتلقائيًا عندما تبحث عن أي شيء.
من أين يحضر جوجل كل هذه الأجوبة على جميع أسئلة الدنيا؟ ببساطة من جميع مواقع الإنترنت التي هو قادرٌ بالفعل على الوصول إليها، فيقوم ببساطة بتلخيصها وتعديلها بطريقة معينة ثم عرضها للمستخدمين في محرك البحث، دون أن يقوم بدفع أي قرش لأصحاب المحتوى هذا بالطبع.
هناك عدة مشاكل اقتصادية واجتماعية تحصل وستحصل بسبب هذا الأمر، منها مثلًا:
أصحاب المدونات والمواقع الصغيرة لا يُلتفت إليهم غالبًا، فتجد شركات الذكاء الاصطناعي تدرّب نماذجها خلسةً على محتواهم دون عقد شراكاتٍ معهم من أي نوع. هذا الأمر مُشكل، لأنه يعني مستقبلًا موت هذه المواقع الصغيرة والمستقلة لأسباب كـ: ضعف عوائد الإعلانات، وبرامج حجب الإعلانات، وعدم قدرتها على منافسة المواقع الضخمة لأن لديها موارد لا يمكن لها امتلاكها بسبب الصفقات التي وقّعتها، وغير ذلك من الأسباب.
سيصبح الإنترنت - بل هو بالفعل - ملعبًا للشركات التقنية الكبرى ومؤسسات المحتوى الكبرى والمواقع الضخمة، وسيختفي تدريجيًا وجود المدونات المستقلة والمشاريع الفردية أو التطوعية، فهي غير قادرة على المنافسة بأي شكلٍ من الأشكال.
بدوره هذا قد يؤدي إلى ازدياد عدد مواقع المحتوى التي تجبر القارئ على الدفع مقابل الوصول إلى المحتوى؛ إن كان الجميع يستعمل مانع إعلانات، والشركات الكبرى تدرّب نماذجها الضخمة على محتواهم مجانًا، ولا أحد يريد التبرّع… فحينها من المتوقع أن تكون هناك موجة كبيرة من المحتوى المدفوع مستقبلًا.
نماذج الذكاء الاصطناعي غير دقيقة لأنه في الكثير من الأحيان، تكون هناك إما مشاكل تقنية أو مشاكل في بيانات التدريب الخاصة بهذه النماذج. انظر مثلًا كيف تعطي ميزة الذكاء الاصطناعي في البحث من جوجل معلوماتٍ قانونية خاطئة للناس عندما يبحثون عن بعض الأمور. انتشار هذه النماذج وسطوتها على نتائج البحث الأولى التي يراها الناس سيؤدي إلى انتشار المعلومات الزائفة والكاذبة وغير الدقيقة بين الناس، خصوصًا في المحتوى الحساس مثل السياسة والدين وغيرها.
ستتحول هذه المشاكل إلى مشاكل مُطّردة وتراكمية؛ لأنه إن كانت مواقع المحتوى تستخدم الذكاء الاصطناعي لكتابة المحتوى، ثم تأتي شركات الذكاء الاصطناعي مثل OpenAI وجوجل لتدريب نماذجها على هذا المحتوى، ثم تعرض محركات البحث مثل جوجل وBing ملخصاتٍ بالذكاء الاصطناعي داخل عمليات البحث… فهذه تصبح حلقة مفرغة؛ الذكاء الاصطناعي هو المدخل وهو المخرج.
دخول الذكاء الاصطناعي على مجال مواقع الإنترنت ومواقع المحتوى له تأثير اقتصادي واجتماعي؛ آلاف أصحاب الأعمال والمواقع فقدوا مدخولهم الأساسي بسبب تحديثات جوجل على خوارزمية بحثها، والآن يصبح الوضع أكثر صعوبةً مع عدم احتياج الناس للدخول إلى مواقعهم أصلًا… هؤلاء سيذهبون لمجالات أخرى ويبحثون عن أرازقهم بطريقة أخرى، فهذا يعني خللًا ملموسًا في النظم الاجتماعية والاقتصادية في مختلف الدول على الأقل للسنوات الخمس المقبلة.
يمكنك هكذا أن ترى الآن كيف أن هذه التطورات التقنية ليست مجرد مميزات عادية تُضاف إلى بعض البرامج والمواقع وانتهى الأمر، بل لها تداعيات على جميع نواحي الحياة.
لأجل هذا أسسنا حوسبة، ولأجل هذا قلنا سابقًا أن علوم الحاسوب من أكبر وسائل خلاص الأمة.
لعل هذا يدفع الجيل المقبل من الشباب العربي المهتمين بالتقنية ألا يكتفوا بالمجالات السطحية مثل التدوين والتصميم وبرمجة مواقع PHP… بل ينتقلوا إلى مجالاتٍ أكثر أهمية وأكثر عمقًا وأكثر تأثيرًا على الواقع.
سيكون لهذا مردودٌ كبير سواءٌ على حيواتهم الخاصة أو على حال الأمة الإسلامية ككل.
🌍 أخبار ومواد سريعة
ستجد في هذا القسم بعض الأخبار والمواد السريعة عن مختلف مجالات علوم الحاسوب والتقنية.
أعلنت شركة OpenAI عن نموذج GPT-4o، وهو نموذج ذكاء اصطناعي قادر على التفاعل بالوقت الحقيقي (Real time) مع المستخدم عبر الصوت والرؤية. يسمح هذا بعمل خدمات وأمور جديدة مع الذكاء الاصطناعي لم تكن ممكنةً من قبل.
أما شركة ميتا فقد أطلقت الإصدار 3.0 من نموذج LLAMA، وهو أضخم من السابق ويأتي بتحسينات أكثر.
جوجل بدورها أعلنت عن نموذج Veo، وهو نموذج يسمح بتوليد مقاطع فيديو عالية الجودة بدقة 1080p، ومدة هذه المقاطع يمكن أن تتجاوز الدقيقة.
أعلنت شركة آبل عن معمارية M4، وقد يصل أداؤها إلى 30-50% من التحسين فوق المعماريات السابقة. اهتمامنا بهذه المعمارية ليس لأجل آبل ولا منتجاتها، لكن المعالجات ورقائق الحاسوب المبنية على معمارية ARM ستكون هي المستقبل إن استمرت هذه التطورات بهذا الشكل.
أُطلقت منصة مرئية لبناء تطبيقات الذكاء الاصطناعي بالتعاون بين جوجل وموقع HuggingFace. يمكنك أن ترى كيف تُبنى هذه التطبيقات وتُوصَلُ النماذج بالمُدخلات لتحقيق المُخرجات المطلوبة. لعل هذه الطريقة تصبح طريقة رئيسية مستقبلًا في بناء تطبيقات الذكاء الاصطناعي دون الحاجة للبرمجة.
اكتُشفت ثغرة أمنية في معيار IEEE 802.11 للشبكات اللاسلكية تسمح بانتحال هوية هذه الشبكات من شبكات مزورة ومن ثم اختراق الاتصال. جميع أنظمة التشغيل للهاتف والحواسيب ستحتاج إلى تحديث لإصلاحها.
💔 زاوية غزة
لا ننسى إخواننا وأحباءنا الذين يعانون الأمرّين في غزة المحاصرة على مدار نحو 8 أشهر، وتغطيتنا لهذه الأخبار والأحداث عن علوم الحاسوب لا يعني أننا نسيناهم أو عدنا إلى الوضع الطبيعي.
في آخر الأخبار فيما يخص الجانب التقني، كشفت بعض وسائل الإعلام أن أكثر من 100 رجل أعمال وملياردير وصاحب شركة في أمريكا يتواصلون بشكلٍ سريّ على جروب واتساب لمتابعة أخبار إسرائيل وبحث سبل دعمها على مختلف الوسائل. تشكّلت هذه المجموعة بعد وقتٍ قصير من السابع من أكتوبر، وتبيّن أن له نشاطًا قويًا في التواصل مع مدراء الجامعات الأمريكية لحثّهم على قمع الطلاب المتظاهرين من أجل فلسطين.
نشر عددٌ من التقنيين رسالة مفتوحة يطالبون فيها بإيقاف إطلاق النار في غزة وإيصال المساعدات وإدانة ما تفعله إسرائيل من جرائم. وقّع عليها موظفون من مختلف الشركات التقنية بما في ذلك ميتا وجوجل ومايكروسوفت وسيكو وغيرها، ووقعنا نحن عليها أيضًا (ابحث عن FOSS Post).
نسأل الله تعالى أن يكشف الكرب والبلاء عنهم وينصرهم على عدوهم، وأن يطعم جائعهم ويسقي عطشانهم ويشفي جريحهم ويرحم ميّتهم.
***
تابعونا على وسائل التواصل لتبقوا على اطلاعٍ بجديدنا:
هنا ينتهي هذا العدد من نشرة حوسبة، ونلقاكم في العدد المقبل بإذن الله. لا تنسوا مشاركة النشرة مع معارفكم وأصدقائكم ليطّلعوا على المحتوى الرائع الذي نعدّه ❤️
لا بالفعل: شاركوا العدد فهذه أدنى وسيلةٍ مؤنةً للمساهمة في نشر هذا المجهود!
جزاكم الله خير
بخصوص النقطة التي تقول
"هناك عدة مشاكل اقتصادية واجتماعية تحصل وستحصل بسبب هذا الأمر، منها مثلًا:
• أصحاب المدونات والمواقع الصغيرة لا يُلتفت إليهم غالبًا، فتجد شركات الذكاء الاصطناعي تدرّب نماذجها خلسةً على محتواهم دون عقد شراكاتٍ معهم من أي نوع. هذا الأمر مُشكل، لأنه يعني مستقبلًا موت هذه المواقع الصغيرة والمستقلة لأسباب كـ: ضعف عوائد الإعلانات، وبرامج حجب الإعلانات، وعدم قدرتها على منافسة المواقع الضخمة لأن لديها موارد لا يمكن لها امتلاكها بسبب الصفقات التي وقّعتها، وغير ذلك من الأسباب."
أتفق أنه سيكون هناك تأثير بسيط على تلك المواقع والمدونات، لكنه ليس بالتأثير الكبير بل قد يكون محفز لإنشاء محتوى أكثر جودة من الحالي ..
أنت افترضت أن الكل سيستخدم الإنترنت بطريقة سؤال وجواب، أي أن المستخدم يكتب سؤاله أو عبارة بحثه وينتظر إجابة مباشرة، وهذا ليس صحيح دائما، قد تفعل ذلك إذا أردت أن تعرف موعد وقت الصلاة أو نتيجة مباراة أو حالة الطقس، لكن في أغلب عمليات البحث أنت تبحث عن مصادر لتبحر فيها في موضوع بحثك .. مثلاً كيف أفتح عمل تجاري في السعودية .. أنت هنا لا تريد إجابة مباشرة، تريد مصادر تدخل بتفاصيلها وتعرف الإجراءات والاشتراطات والأنظمة حسب تفاصيل مشروعك .. لإن حتى سؤالك يتطلب أن يتم الرد عليه غالباً بسؤال .. مثل تبحث عن، كيف أفتح شركة في السعودية، الإجابة لن تكون اعمل كذا وكذا، بل هي من قبيل، ما نوع الشركة التي تريد فتحها ؟ ثم تقوم بالإجابة، ثم يسألك سؤال آخر ليعرف السياق وهذا ..
محركات البحث من الصعب أن تخوض في أعماق تلك الأسئلة، بل حتى نماذج الدردشة الحية ..
غالباً المستخدم لا يعرف ما يريده بالضبط بشكل دقيق، هو يريد طرف خيط ومصادر ليبحر ويقرأ ويتوجه حسب متطلباته أثناء القراءة وليس أن يكون لديه سؤال محدد واضح ويريد إجابة واضحة مثلاً كم نتيجة مباراة كرة قدم ..
لهذا أرى أن الخطر منها في هذا الجانب تحديداً لا يدعو للقلق، ليس لأنها غير جيدة بما فيه الكفاية بل لإن الطريقة البشرية للبحث ليست بهذه الآلية دائماً أي وكأنه حل لمشكلة جزئية تعترضني وليس حل للمشكلة الحقيقة التي جئت للبحث عن حل لها ..