نئے اوپن سورس چیٹ جی پی ٹی کلون - ڈالی کے نام سے

dolly-chatgpt-clone.jpg

ڈیٹابرکس اینٹرپرائز سافٹ وئیر کمپنی کے ذریعہ تشکیل دیا گیا ڈالی لارج لینگویج ماڈل (DLL) کی ریلیس کے ساتھ اوپن سورس جی پی ٹی چیٹ نے ایک اور قدم آگے بڑھا۔

نئی ChatGPT کلون کو ڈالی نام دیا گیا ہے، جو مشہور بکری کے نام پر نامزد کیا گیا ہے، یہ وہ پہلی ممالک ہے جو کلون کیا گیا.

اوپن سورس بڑے زبانی ماڈلز

ڈالی لی إل إم ، بڑی شرکتوں کے اختیار اور کنٹرول کو منوپولائز نہ کرنے کیلئے ، موجودہ اوپن سورس ای آئی تحریک کی تازہ ترین مظاہر ہے جو ٹیکنالوجی کو زیادہ تک رسائی مہیا کرنے کیلئے مشترکہ قابو بنا کر نہیں رکھتی۔

اوپن سورس ای آئی کے اندراج کرنے والی پریشانیوں میں سے ایک یہ ہے کہ کاروباریں آئی آئی ٹیکنالوجی کو کنٹرول کرنے والی تیسری طرف کو اہم معلومات کو اعطا کرنے سے ہچکچاہٹ کا اظہار کر سکتی ہیں۔

اوپن سورس پر مبنی

ڈالی نے ایچتی پیلی ڈالی نے کھولی ماڈل سے پیدا ہوئی جو کہ غیر منافع پذیر الیوتھر آئی تحقیقاتی ادارہ اور ہی خود سٹینفرڈ یونیورسٹی ایلپاکا ماڈل سے پیدا ہوئی، جو کہ 65 ارب پیرامیٹر والی کھولی ماڈل ایل لّا ما کی بنیاد پر ہے پیدا ہوئی۔

LLaMA، جو کہ لارج لینگویج ماڈل میٹا اے آئی کی تشکیل کرتا ہے، ایک لینگویج ماڈل ہے جو عوامی طور پر دستیاب ڈیٹا پر تربیت پاتا ہے.

ایک مضمون کے مطابق Weights & Biases کے مطابق، LLaMA متعدد برتر زبانی ماڈلز (OpenAI GPT-3، Deep Mind کی Gopher اور DeepMind کی Chinchilla) سے زیادہ کارآمد ہو سکتا ہے، یعنی عمده ہوتا ہے۔

ایک بہترین ڈیٹا سیٹ تیار کرنا

دوسری توحید کی وحی سے ایک دوسری کامیابی حاصل ہوئی جو ایک تعلیمی تحقیقی پیپر (خود خانہ درست: خود خودخانہ خود حاگری بندوبست کی بنوائی) سے نکلی تھی اس پر واضح کیا گیا تھا کہ کیسے ایک ایسا طریقہ تیار کیا جا سکتا ہے جو کہ محدود عوامی ڈیٹا سے بہتر جوالاڑو کوئز اور جواب تربیتی ڈیٹا بنا سکتا ہے۔

خود سکھائی ۔ تحقیقی کاغذ کا موضوع بیان کرتا ہے:

「… ہم ”ناول کیلئے تقنیں“ کی تشکیل کرتے ہیں، جو خبرہ کار تحریری ہدایات کا مجموعہ ہوتا ہے اور انسانی تشخیص کے ذریعے ثابت کرتے ہیں کہ سیلف-انسٹرکٹ کو جیپی ٹی 3 کو سب سے زیادہ بہتر بنانے کے لئے ، موجودہ عوامی ہدایاتی کا نمونہ استعمال کرنے سے بہتر ہے۔ محتاط ان سے صرف 5 فیصد مطلق فاصلہ رہتا ہے ، جبکہ اناسٹرکٹ جیپی ٹی 3 کے پیچیدہ صارفین کی معاشی معلومات اور انسانی تشریحات کے ساتھ تربیت پانے والا ماڈل ہے ... ۔ „

「ہمارا طریقہ کار ونیلا جیپی ٹی 3 پر لگانے کا نتیجہ ہے، ہم SUPERNATURALINSTRUCTIONS پر اصل ماڈل کی 33 فیصد مطلق ترقی کا ثبوت دیتے ہیں، اس کی آپریشن "انسٹرکٹ جیپی ٹی" کی تراقی کے برابر ہے ... جو نجی صارفین کی معلومات اور انسانی تشریحات کے ساتھ تربیت پانے کے لئے تربیت یافتہ ہے۔」

ڈالی کی اہمیت یہ ہے کہ یہ ثابت کرتی ہے کہ ایک مفید بڑی زبانی ماڈل کو ایک چھوٹے لیکن اعلیٰ معیار کے ڈیٹا سیٹ کے ساتھ تیار کیا جا سکتا ہے۔

ڈیٹابرِکس کے مطابق:

“ڈالی کا طریقہ کار ہے کہ یہ موجودہ اوپن سورس 6 ارب پیرامیٹر ماڈل کو الیوتھیرAI سے لے کر اسے چھوٹے سے چھوٹے تبدیلیوں کے ذریعے ترتیب کرتا ہے تاکہ اس کے پاس بریان اسٹارم اور متن کی تشکیل کی مثالی صلاحیتیں پیدا ہوں جو اصل ماڈل میں نہیں تھیں، الپاکا سے ڈیٹا استعمال کرتے ہوئے۔

ہم دکھاتے ہیں کہ کوئی بھی تاریخی خارج شدہ چھوٹے سے مستقل مفت زبان ماڈل (LLM) لے سکتا ہے اور 30 منٹ میں ایک مشین پر اسے تربیت دے کر اس کو جادوئی ChatGPT جیسی ہدایت اختیار کرنے کی صلاحیت دی جا سکتی ہے ، اچھی کوالٹی کی تربیتی ڈیٹا استعمال کرتے ہوئے۔

حیرت انگیز طور پر، ہدایتوں پر عمل بندی کے لئے تازہ ترین یا بڑے ترین ماڈلز کی ضرورت نہیں ہوتی: ہمارا ماڈل صرف 6 بلین پیرامیٹرز کا ہے ، جبکہ GPT-3 کے لئے 175 بلین ہوتے ہیں.

ڈیٹا برِکس کھلے سورس AI

ڈالی کو کہتے ہیں کہ یہ AI کو جمہوری بناتی ہے. یہ ایک لونگ کی موج کا حصہ کہا جاتا ہے جس میں معشوقہ غیر منافع بخش غیر سرکاری تنظیم موزلا نے حال ہی موزیلا.AI کی بنیاد رکھی ہے. موزلا فائرفاکس براؤزر اور دیگر کھلے ماخذ سافٹ ویئر کے منتشر کنندہ ہے.

متعلقہ مضامین

مزید دیکھیں >>

HIX.AI کے ساتھ AI کی طاقت کو غیر مقفل کریں!