الجمعة, مارس 20, 2026
30 °c
Istanbul
Turkish Post Arabic
Sonuç bulunamadı
Tüm sonuçları göster
  • أحدث الأخبار
  • الشؤون الجارية
  • تركيا
  • العالم
  • الاقتصاد
  • الرياضة
  • نمط الحياة
  • الثقافة-الفن
  • العلوم-التكنولوجيا
  • Language
    • Türkçe
    • English
  • أحدث الأخبار
  • الشؤون الجارية
  • تركيا
  • العالم
  • الاقتصاد
  • الرياضة
  • نمط الحياة
  • الثقافة-الفن
  • العلوم-التكنولوجيا
  • Language
    • Türkçe
    • English
Sonuç bulunamadı
Tüm sonuçları göster
Turkish Post Arabic
Sonuç bulunamadı
Tüm sonuçları göster
Anasayfa العلوم-التكنولوجيا

شريان الحياة للذكاء الاصطناعي.. كيف تواجه شركات التقنية معضلة انتهاء البيانات؟

20 يوليو 2024
Okuma süresi: 1 dk. okuma
A A
شريان الحياة للذكاء الاصطناعي.. كيف تواجه شركات التقنية معضلة انتهاء البيانات؟
Share on FacebookShare on Twitter

(The Turkish Post) – تحول السباق نحو ريادة مجال الذكاء الاصطناعي التوليدي إلى مطاردات يائسة للوصول إلى أكبر قدر من البيانات الرقمية اللازمة لتطوير تلك التقنيات (بيكسلز)

في نهاية عام 2021، وبينما تدرب شركة أوبن إيه آي نماذجها للذكاء الاصطناعي، واجهت حينها أزمة في الإمداد. إذ استهلكت كل مخزون النصوص الإنجليزية الموثوقة على الإنترنت أثناء تطويرها لأحدث أنظمتها للذكاء الاصطناعي، وكانت بحاجة إلى المزيد من البيانات الجيدة لتدريب النسخة التالية من نظامها؛ احتاجت للكثير جدا من تلك البيانات.

لذا، ابتكر باحثو أوبن إيه آي، أداة للتعرّف على الكلام تُسمى “ويسبر” (Whisper)، يمكنها نسخ الأصوات من مقاطع فيديو يوتيوب، مما ينتج عنه نصوص محادثة جديدة قد تجعل نظام الذكاء الاصطناعي أكثر ذكاءً. وبحسب ما ذكرته صحيفة نيويورك تايمز، فقد ناقش بعض موظفي الشركة كيف تتعارض تلك الخطوة مع قواعد يوتيوب، إذ يحظر الموقع المملوك لشركة غوغل استخدام مقاطعه في التطبيقات المنفصلة عن المنصة.

في النهاية، فرّغ فريق أوبن إيه آي، أكثر من مليون ساعة من مقاطع فيديو يوتيوب، مستخدما تلك البيانات في تدريب نموذج “جي بي تي-4″، وهو أقوى نموذج للذكاء الاصطناعي تملكه الشركة.

غوغل استفادت من محتوى مقاطع الفيديو على يوتيوب لاستخراج نصوص لتدريب نماذجها للذكاء الاصطناعي (شترستوك)

مطاردات يائسة

تحول السباق نحو ريادة مجال الذكاء الاصطناعي التوليدي إلى مطاردات يائسة للوصول إلى أكبر قدر من البيانات الرقمية اللازمة لتطوير تلك التقنيات. وفي سبيل اقتناص هذا الكم الهائل من البيانات، اختصرت شركات التقنية مثل أوبن إيه آي وغوغل وميتا، كل السبل وتجاهلت سياسات الشركات وبحثت في تجاوز القانون، وفقًا لما ذكرته صحيفة نيويورك تايمز.

مثلا في شركة ميتا، التي تمتلك فيسبوك وإنستغرام، تشاور المسؤولون بشأن جمع البيانات المحمية بحقوق الطبع والنشر عبر شبكة الإنترنت، حتى إن كان يعني ذلك مواجهة دعاوى قضائية، وأضافوا أن التفاوض للحصول على تراخيص استخدام المحتوى مع الناشرين والفنانين والموسيقيين وصناعة الأخبار سيستغرق مدة زمنية طويلة.

وعلى غرار ما فعلته شركة أوبن إيه آي، استفادت غوغل من محتوى مقاطع الفيديو على يوتيوب لاستخراج نصوص لتدريب نماذجها للذكاء الاصطناعي، وهو فعل قد ينتهك حقوق النشر الخاصة بصانعي هذا المحتوى.

شريان الحياة للذكاء الاصطناعي

توضح إجراءات تلك الشركات كيف أصبحت البيانات على الإنترنت، من أخبار ومؤلفات روائية ومنشورات على وسائل التواصل الاجتماعي ومقالات ويكيبيديا والصور ومقاطع الفيديو والبودكاست والأفلام وغيرها، شريان الحياة لصناعة الذكاء الاصطناعي الناشئة. إذ يعتمد تطوير أنظمة قوية وتنافسية على وجود ما يكفي من البيانات اللازمة لتعليم تلك النماذج كيفية إنتاج نصوص وصور وأصوات ومقاطع فيديو تشبه ما ينتجه الإنسان بصورة لحظية.

هنا يجب ملاحظة أن حجم البيانات أمر بالغ الأهمية، فقد تعلمت روبوتات المحادثة الرائدة، مثل “شات جي بي تي”، من مجموعات هائلة من النصوص الرقمية التي تصل إلى 3 تريليونات كلمة، أو ما يقرب من ضعف عدد الكلمات المخزنة في مكتبة بودلي، وهي المكتبة البحثية الرئيسية بجامعة أكسفورد، التي تُجمع بها المخطوطات منذ عام 1602. وأوضح الباحثون في مجال الذكاء الاصطناعي أن أكثر البيانات قيمة هي تلك المعلومات فائقة الجودة، كالكتب والمقالات المنشورة التي كتبها وحررها بعناية أفراد متخصصون في مجالاتهم.

في يناير/كانون الثاني عام 2020، نشر جاريد كابلان، عالم الفيزياء النظرية في جامعة جونز هوبكنز، ورقة بحثية رائدة عن الذكاء الاصطناعي أثارت شهية الشركات أكثر للبيانات على شبكة الإنترنت. كان استنتاجه واضحًا وصريحًا: كلما زادت البيانات المتوفرة لتدريب أحد النماذج اللغوية الكبيرة، وهي النماذج التي توجه روبوتات المحادثة، كان أداؤها أفضل. تمامًا كما يتعلّم الطالب الكثير عبر قراءة المزيد من الكتب، يمكن للنماذج اللغوية الكبيرة أن تحدد الأنماط في النصوص على نحو أفضل وتكون أكثر دقة عند حصولها على المزيد من المعلومات.

لسنوات طويلة، كانت شبكة الإنترنت، بمواقع مثل ويكيبيديا وريديت وغيرهما، تبدو مصدرا لا ينضب من البيانات، ولكن مع تطور نماذج الذكاء الاصطناعي، نقّبت شركات التقنية في المزيد من المستودعات. وكانت شركتا غوغل وميتا، بامتلاكهما مليارات المستخدمين ممن ينتجون طلبات بحث ومنشورات على وسائل التواصل الاجتماعي كل يوم، مقيَّدتين بقوانين الخصوصية وسياساتهما الخاصة، مما يمنعهما من الاعتماد على كثير من هذا المحتوى لتدريب نماذج الذكاء الاصطناعي.

لذا، أصبح وضعهم خاصا؛ يمكن لشركات التقنية أن تستنفذ البيانات ذات الجودة العالية على شبكة الإنترنت بحلول عام 2026، وفقًا لمعهد “إيبوك” (Epoch) للأبحاث. فأصبحنا الآن في وضع تستهلك فيه تلك الشركات البيانات بوتيرة أسرع مما يجري إنتاجها من العالم أجمع على الإنترنت.

بيانات اصطناعية

أصبحت شركات التقنية متعطشة للبيانات الجديدة لدرجة أن بعضها بدأ في تطوير البيانات “الاصطناعية”. ليست بيانات طبيعية ينتجها البشر، بل هي نصوص وصور وأكواد برمجية تنتجها نماذج الذكاء الاصطناعي، أي أن الأنظمة تتعلم مما تنتجه بنفسها.

مثلا ذكرت شركة أوبن إيه آي، أن كل نموذج من نماذجها للذكاء الاصطناعي يمتلك مجموعة بيانات فريدة من نوعها، تنظمها وتجمعها الشركة بهدف مساعدة النموذج على فهم العالم لكي تحافظ على قدرتها التنافسية في المجال.

وذكر سام ألتمان، سابقا، أن الشركات التي تعمل مثل شركته على تطوير نماذجها، ستضطر في النهاية إلى تدريب تلك النماذج على النصوص التي يولدها الذكاء الاصطناعي أو ما يعرف بالبيانات الاصطناعية. النظرية التي يقترحها السيد ألتمان، والآخرون في هذا المجال، أنه نظرًا لقدرة نموذج الذكاء الاصطناعي على إنتاج نصوص شبيهة بالبشر، فيمكن للأنظمة أن تنتج بيانات إضافية لتطوير إصدارات أفضل من نفسها. وهذا الأمر سيساعد المطورين على ابتكار تقنيات أكثر قوة ويقلل من اعتمادهم على البيانات المحمية بحقوق الطبع والنشر.

استكشف الباحثون في المجال فكرة استخدام البيانات الاصطناعية منذ سنوات، ولكن تطوير نماذج الذكاء الاصطناعي القادرة على تدريب نفسها أسهل قولا مما يبدو عليه فعلا. لأن تلك النماذج التي تتعلم من نتائجها الخاصة قد تقع في دائرة مفرغة بحيث تعزز من عيوبها وأخطائها وقيودها الحالية.

ولمواجهة ذلك، تبحث شركة أوبن إيه آي وغيرها في كيفية عمل نموذجين مختلفين للذكاء الاصطناعي معًا لتوليد بيانات اصطناعية مفيدة وموثوقة أكثر. ينتج أحد النظامين البيانات، بينما يتولى النظام الآخر الحكم على تلك البيانات لفرز الجيد منها عن السيئ. لكن حتى هذا الحل لم يتفق الباحثون حول مدى إمكانية نجاحه من عدمها.

Post Views: 136
Kaynak: aljazeera
Etiketler: Üst Manşetبيانات اصطناعيةذكاء الاصطناعيشريان الحياة للذكاء الاصطناعيعالم الفيزياء النظرية
PaylaşTweet
Osman

Osman

ÖnerilenlerHaberler

أردوغان: اغتيال هنية يهدف إلى كسر إرادة الشعب الفلسطينى
تركيا

أردوغان: اغتيال هنية يهدف إلى كسر إرادة الشعب الفلسطينى

فنربهتشه يتأهل للدور التمهيدي الثالث بدوري أبطال أوروبا
الرياضة

فنربهتشه يتأهل للدور التمهيدي الثالث بدوري أبطال أوروبا

من هو فؤاد شكر؟.. المستهدف في الضربة الإسرائيلية على بيروت
العالم

من هو فؤاد شكر؟.. المستهدف في الضربة الإسرائيلية على بيروت

كيف بدأ الذهب والدولار  اليوم في تركيا ؟
الاقتصاد

كيف بدأ الذهب والدولار  اليوم في تركيا ؟

أخبار شعبية

استخدام جوالك لمدة ساعتين يومياً يهدد صحتك.. ماذا يحدث؟

استخدام جوالك لمدة ساعتين يومياً يهدد صحتك.. ماذا يحدث؟

منها سرطان الجلد.. مخاطر الأشعة فوق البنفسجية تفوق الخيال

منها سرطان الجلد.. مخاطر الأشعة فوق البنفسجية تفوق الخيال

“الخدمات الرقمية” و”حراس البوابة”.. قانونان جديدان لترويض عمالقة التكنولوجيا

“الخدمات الرقمية” و”حراس البوابة”.. قانونان جديدان لترويض عمالقة التكنولوجيا

سامسونغ الأولى في السباق.. تفاصيل “الخاتم الذكي” الجديد

سامسونغ الأولى في السباق.. تفاصيل “الخاتم الذكي” الجديد

صلاح بين مطرقة البيع وسندان التجديد لليفربول في أغسطس

صلاح بين مطرقة البيع وسندان التجديد لليفربول في أغسطس

الكويت: قطع مؤقت للكهرباء للمرة الأولى بسبب الحر الشديد

الكويت: قطع مؤقت للكهرباء للمرة الأولى بسبب الحر الشديد

على خلفية توترات حرب غزة.. بروكسل ترفض استضافة منتخب إسرائيل

على خلفية توترات حرب غزة.. بروكسل ترفض استضافة منتخب إسرائيل

مغربي يجلد أمه حتى الموت.. “تطهيرا لها من الذنوب”

مغربي يجلد أمه حتى الموت.. “تطهيرا لها من الذنوب”

أمم أوروبا: بعد فوزها الافتتاحي على النمسا.. مبابي يصاب بكسر في أنفه

أمم أوروبا: بعد فوزها الافتتاحي على النمسا.. مبابي يصاب بكسر في أنفه

تركيا.. ما حقيقة ادعاءات سحب الجنسية من آلاف الأجانب؟

تركيا.. ما حقيقة ادعاءات سحب الجنسية من آلاف الأجانب؟

هونر تطلق “ماجيك في فلب” القابل للطي

هونر تطلق “ماجيك في فلب” القابل للطي

تركيا تعزي الكويت في ضحايا حريق المبنيين

تركيا تعزي الكويت في ضحايا حريق المبنيين

بشكتاش بطلاً لكأس تركيا على حساب طرابزون ببصمة غزال والمصراتي

بشكتاش بطلاً لكأس تركيا على حساب طرابزون ببصمة غزال والمصراتي

فيدان وبلينكن يلتقيان في الرياض.. حرب غزة أبرز المحاور

فيدان وبلينكن يلتقيان في الرياض.. حرب غزة أبرز المحاور

تركيا تدشن وساطتها بين حماس وإسرائيل بـ”نزع السلاح”

تركيا تدشن وساطتها بين حماس وإسرائيل بـ”نزع السلاح”

تركيا : إسرائيل ترفض طلب أنقرة إسقاط مساعدات في غزة

تركيا : إسرائيل ترفض طلب أنقرة إسقاط مساعدات في غزة

الذهب يواصل ارتفاعاته القياسية.. والنفط يعزز مكاسبه

الذهب يواصل ارتفاعاته القياسية.. والنفط يعزز مكاسبه

Hakkında

Amacımız, haberlerde tarafsızlık, bağımsızlık ve doğruluk ilkelerine bağlı kalarak, okuyucularımıza en güvenilir ve en nitelikli haberi sunmaktır. Türkiye'de ve dünyada sağlık, ekonomi, siyaset, yaşam, spor, teknoloji, tarih ve gündeme ait gibi birçok alanda geniş bir haber yelpazesi sunarak, okuyucularımıza çeşitli konularda farklı bir bakış açısı kazandırmayı, Türkiye'de, dünyada neler oluyor, Dünyada da Türkiye'de neler oluyor diye merak eden insanların doğru habere zamanında, yazılı ve görsel olarak ulaşacağı büyük bir medya grubu olmayı hedefliyoruz.

Bizi takip edin

Kategoriler

  • Bilim-Teknoloji
  • Çalışma Hayatı
  • Dünya
  • Eğitim
  • Ekonomi
  • Gündem
  • Günün Yazarı
  • Haber Analiz
  • Haber Kulis
  • Haber Portre
  • Haber Yorum
  • Köşe Yazarı
  • Kültür-Sanat
  • Magazin
  • Manşet
  • Özel Haber
  • Politika
  • Son Haberler
  • Spor
  • Tarım-Hayvancılık
  • Türkiye
  • Yaşam
  • أحدث الأخبار
  • أخبار المشاهير
  • الاقتصاد
  • الثقافة-الفن
  • الرياضة
  • الشؤون الجارية
  • العالم
  • العلوم-التكنولوجيا
  • تركيا
  • تعليق الأخبار
  • تقرير خاص
  • صحة
  • نمط الحياة

Son Haberler

  • أردوغان: اغتيال هنية يهدف إلى كسر إرادة الشعب الفلسطينى
  • لحظة اغتيال هنية.. قيادي بارز آخر كان في المبنى ذاته
  • أنقرة: ندين مقتل هنية بعملية اغتيال دنيئة في طهران
  • حماس: اغتيال إسماعيل هنية بطهران

Gizlilik ve Güvenlik

  • Gizlilik Politikası
  • Kullanım Koşulları
  • Çerez Politikası
  • Künye

 


 

İletişim
[email protected]
Whatsapp
+1 (224) 817-1794

Tekrar hoş geldiniz!

Aşağıdan hesabınıza giriş yapın

Parolanızı mı unuttunuz?

Parolanızı alın

Parolanızı sıfırlamak için lütfen kullanıcı adınızı veya e-posta adresinizi girin.

Giriş yap

Yeni çalma listesi ekle

Sonuç bulunamadı
Tüm sonuçları göster
  • أحدث الأخبار
  • الشؤون الجارية
  • تركيا
  • العالم
  • الاقتصاد
  • الرياضة
  • نمط الحياة
  • الثقافة-الفن
  • العلوم-التكنولوجيا
  • Language
    • Türkçe
    • English

© 2023 Turkish Post Haber - Tüm hakları saklıdır.

Sitemizde deneyimlerinizi geliştirmek için çerezler kullanıyoruz. Web sitemizde gezinmeye devam ederek bu çerezlerin kullanımına izin vermiş olursunuz. Gizlilik Politikası & Çerez Politikası.