یہ کیا ہے اور آپ اسے کیسے استعمال کر سکتے ہیں؟

ChatGPT یہی ہے اور یہ جدید سرچ انجنوں کے بعد سب سے اہم ٹول کیوں ہو سکتا ہے۔

OpenAI نے ChatGPT کے نام سے ایک طویل شکل کے سوالوں کا جواب دینے والا AI متعارف کرایا جو پیچیدہ سوالات کے جوابات گفتگو سے دیتا ہے۔

یہ ایک انقلابی ٹکنالوجی ہے کیونکہ اس میں یہ سیکھنے کی تربیت دی گئی ہے کہ جب انسان کوئی سوال پوچھتے ہیں تو ان کا کیا مطلب ہے۔

بہت سے صارفین انسانی معیار کے جوابات فراہم کرنے کی اس کی صلاحیت پر حیرت زدہ ہیں، اس احساس کو متاثر کرتے ہوئے کہ آخر کار اس میں یہ طاقت ہو سکتی ہے کہ انسان کمپیوٹر کے ساتھ کیسے تعامل کرتے ہیں اور معلومات کی بازیافت کیسے کرتے ہیں۔

ChatGPT کیا ہے؟

ChatGPT ایک بڑی زبان کا ماڈل چیٹ بوٹ ہے جسے OpenAI نے GPT-3.5 کی بنیاد پر تیار کیا ہے۔ اس میں بات چیت کے مکالمے کی شکل میں بات چیت کرنے اور ایسے جوابات فراہم کرنے کی قابل ذکر صلاحیت ہے جو حیرت انگیز طور پر انسانی ظاہر ہو سکتے ہیں۔

بڑے زبان کے ماڈل الفاظ کی ایک سیریز میں اگلے لفظ کی پیشین گوئی کا کام انجام دیتے ہیں۔

Reinforcement Learning with Human FeedBypassGPTack (RLHF) تربیت کی ایک اضافی پرت ہے جو ChatGPT ہدایات پر عمل کرنے اور جوابات پیدا کرنے کی صلاحیت سیکھنے میں مدد کرنے کے لیے انسانی تاثرات کا استعمال کرتی ہے جو انسانوں کے لیے تسلی بخش ہوں۔

ChatGPT کس نے بنایا؟

ChatGPT کو سان فرانسسکو میں مقیم مصنوعی ذہانت کی کمپنی OpenAI نے بنایا تھا۔ OpenAI Inc. غیر منافع بخش OpenAI LP کی غیر منافع بخش پیرنٹ کمپنی ہے۔

OpenAI اپنے معروف DALL·E کے لیے مشہور ہے، ایک گہری سیکھنے والا ماڈل جو متن کی ہدایات سے تصاویر تیار کرتا ہے جسے prompts کہتے ہیں۔

سی ای او سیم آلٹ مین ہیں، جو پہلے Y ComBypassGPTinator کے صدر تھے۔

مائیکروسافٹ $1 بلین ڈالر کی رقم میں شراکت دار اور سرمایہ کار ہے۔ انہوں نے مشترکہ طور پر Azure AI پلیٹ فارم تیار کیا۔

بڑے زبان کے ماڈل

ChatGPT ایک بڑی زبان کا ماڈل (LLM) ہے۔ بڑے لینگویج ماڈلز (LLMs) کو بڑے پیمانے پر ڈیٹا کے ساتھ تربیت دی جاتی ہے تاکہ درست طریقے سے اندازہ لگایا جا سکے کہ ایک جملے میں کون سا لفظ آتا ہے۔

یہ دریافت کیا گیا کہ ڈیٹا کی مقدار میں اضافے سے لینگویج ماڈلز کی مزید کام کرنے کی صلاحیت میں اضافہ ہوتا ہے۔

سٹینفورڈ یونیورسٹی کے مطابق:

"GPT-3 کے 175 بلین پیرامیٹرز ہیں اور اسے 570 گیگا بائٹس ٹیکسٹ پر تربیت دی گئی تھی۔ مقابلے کے لیے، اس کا پیشرو، GPT-2، 1.5 بلین پیرامیٹرز پر 100 گنا چھوٹا تھا۔

پیمانے میں یہ اضافہ ماڈل کے رویے کو یکسر تبدیل کر دیتا ہے — GPT-3 ایسے کاموں کو انجام دینے کے قابل ہے جن کی اسے واضح طور پر تربیت نہیں دی گئی تھی، جیسے کہ انگریزی سے فرانسیسی میں جملوں کا ترجمہ کرنا، جس میں تربیت کی چند مثالیں نہیں ہیں۔

یہ سلوک زیادہ تر GPT-2 میں غائب تھا۔ مزید برآں، کچھ کاموں کے لیے، GPT-3 ان ماڈلز سے بہتر کارکردگی کا مظاہرہ کرتا ہے جو ان کاموں کو حل کرنے کے لیے واضح طور پر تربیت یافتہ تھے، حالانکہ دوسرے کاموں میں یہ کم ہوتا ہے۔

LLMs ایک جملے اور اگلے جملے میں الفاظ کی ایک سیریز میں اگلے لفظ کی پیشین گوئی کرتے ہیں – خودکار تکمیل کی طرح، لیکن ذہن کو موڑنے والے پیمانے پر۔

یہ صلاحیت انہیں پیراگراف اور مواد کے پورے صفحات لکھنے کی اجازت دیتی ہے۔

لیکن ایل ایل ایم اس حد تک محدود ہیں کہ وہ ہمیشہ یہ نہیں سمجھتے کہ انسان کیا چاہتا ہے۔

اور یہی وہ جگہ ہے جہاں ChatGPT آرٹ کی حالت میں بہتری لاتا ہے، مذکورہ بالا Reinforcement Learning with Human FeedBypassGPTack (RLHF) ٹریننگ کے ساتھ۔

ChatGPT تربیت کیسے کی گئی؟

GPT-3.5 انٹرنیٹ سے کوڈ اور معلومات کے بارے میں بڑے پیمانے پر ڈیٹا پر تربیت دی گئی تھی، بشمول Reddit مباحث جیسے ذرائع، تاکہ ChatGPT مکالمہ سیکھنے اور جواب دینے کا انسانی انداز حاصل کرنے میں مدد ملے۔

ChatGPT انسانی تاثرات (ایک تکنیک جسے Reinforcement Learning with Human FeedBypassGPTack کہا جاتا ہے) کا استعمال کرتے ہوئے بھی تربیت دی گئی تاکہ AI نے سیکھا کہ جب انسان کوئی سوال پوچھتے ہیں تو وہ کیا توقع کرتے ہیں۔ ایل ایل ایم کو اس طرح سے تربیت دینا انقلابی ہے کیونکہ یہ صرف ایل ایل ایم کو اگلے لفظ کی پیشن گوئی کرنے کی تربیت دینے سے بالاتر ہے۔

مارچ 2022 کا ایک تحقیقی مقالہ جس کا عنوان تھا تربیتی زبان کے نمونے انسانی تاثرات کے ساتھ ہدایات پر عمل کرنے کے لیے بتاتا ہے کہ یہ ایک پیش رفت کا طریقہ کیوں ہے:

"یہ کام ہمارے مقصد سے حوصلہ افزائی کرتا ہے کہ ہم بڑے زبان کے ماڈلز کے مثبت اثرات کو بڑھاتے ہوئے انہیں وہ کام کرنے کی تربیت دیں جو انسانوں کا ایک مخصوص مجموعہ ان سے کرنا چاہتا ہے۔

پہلے سے طے شدہ طور پر، زبان کے ماڈل اگلے لفظ کی پیشن گوئی کے مقصد کو بہتر بناتے ہیں، جو کہ ہم ان ماڈلز سے کیا کرنا چاہتے ہیں اس کے لیے صرف ایک پراکسی ہے۔

ہمارے نتائج بتاتے ہیں کہ ہماری تکنیکوں میں زبان کے ماڈلز کو زیادہ مددگار، سچا اور بے ضرر بنانے کا وعدہ ہے۔

زبان کے ماڈلز کو بڑا بنانا فطری طور پر انہیں صارف کے ارادے کی پیروی میں بہتر نہیں بناتا ہے۔

مثال کے طور پر، بڑے زبان کے ماڈل ایسے نتائج پیدا کر سکتے ہیں جو غلط، زہریلے، یا صارف کے لیے محض مددگار نہ ہوں۔

دوسرے الفاظ میں، یہ ماڈل اپنے صارفین کے ساتھ منسلک نہیں ہیں۔

ChatGPT بنانے والے انجینئرز نے دو سسٹمز GPT-3 اور نئے InstructGPT ( ChatGPT کا ایک "سائلنگ ماڈل") کے آؤٹ پٹس کی درجہ بندی کرنے کے لیے ٹھیکیداروں (جنہیں لیبلرز کہا جاتا ہے) کی خدمات حاصل کیں۔

درجہ بندی کی بنیاد پر، محققین مندرجہ ذیل نتائج پر پہنچے:

"لیبلرز GPT-3 کے آؤٹ پٹس پر InstructGPT آؤٹ پٹ کو نمایاں طور پر ترجیح دیتے ہیں۔

InstructGPT ماڈل GPT-3 کے مقابلے سچائی میں بہتری دکھاتے ہیں۔

InstructGPT GPT-3 کے مقابلے زہریلے پن میں چھوٹی بہتری دکھاتا ہے، لیکن تعصب نہیں۔

تحقیقی مقالے میں یہ نتیجہ اخذ کیا گیا ہے کہ InstructGPT کے نتائج مثبت تھے۔ پھر بھی، اس نے یہ بھی نوٹ کیا کہ بہتری کی گنجائش موجود ہے۔

"مجموعی طور پر، ہمارے نتائج سے پتہ چلتا ہے کہ انسانی ترجیحات کا استعمال کرتے ہوئے بڑے زبان کے ماڈلز کو ٹھیک کرنے سے کاموں کی ایک وسیع رینج پر ان کے رویے میں نمایاں طور پر بہتری آتی ہے، حالانکہ ان کی حفاظت اور وشوسنییتا کو بہتر بنانے کے لیے بہت زیادہ کام کرنا باقی ہے۔"

ChatGPT ایک سادہ چیٹ بوٹ کے علاوہ جو چیز سیٹ کرتی ہے وہ یہ ہے کہ اسے خاص طور پر ایک سوال میں انسانی ارادے کو سمجھنے اور مددگار، سچے اور بے ضرر جوابات فراہم کرنے کی تربیت دی گئی تھی۔

اس تربیت کی وجہ سے، ChatGPT کچھ سوالات کو چیلنج کر سکتا ہے اور سوال کے ان حصوں کو رد کر سکتا ہے جو معنی نہیں رکھتے۔

ChatGPT سے متعلق ایک اور تحقیقی مقالے سے پتہ چلتا ہے کہ انہوں نے AI کو کس طرح تربیت دی کہ وہ یہ اندازہ لگا سکیں کہ انسانوں کو کیا ترجیح ہے۔

محققین نے دیکھا کہ قدرتی لینگویج پروسیسنگ AI کے آؤٹ پٹس کی درجہ بندی کرنے کے لیے استعمال ہونے والے میٹرکس کے نتیجے میں ایسی مشینیں نکلیں جنہوں نے میٹرکس پر اچھا اسکور کیا، لیکن انسانوں کی توقع کے مطابق نہیں تھا۔

مندرجہ ذیل ہے کہ محققین نے اس مسئلے کی وضاحت کیسے کی:

"بہت سے مشین لرننگ ایپلی کیشنز سادہ میٹرکس کو بہتر بناتے ہیں جو کہ ڈیزائنر کے ارادے کے لیے صرف کھردرے پراکسی ہیں۔ اس سے مسائل پیدا ہو سکتے ہیں، جیسے کلک بیت کو فروغ دینے والی YouTuBypassGPTe سفارشات۔"

لہذا انہوں نے جو حل تیار کیا وہ ایک AI بنانا تھا جو انسانوں کی ترجیحات کے مطابق جوابات کو آؤٹ پٹ کر سکے۔

ایسا کرنے کے لیے، انہوں نے مختلف جوابات کے درمیان انسانی موازنہ کے ڈیٹا سیٹس کا استعمال کرتے ہوئے AI کو تربیت دی تاکہ مشین یہ پیش گوئی کرنے میں بہتر ہو جائے کہ انسانوں نے کیا تسلی بخش جوابات کا فیصلہ کیا ہے۔

پیپر شیئر کرتا ہے کہ ٹریننگ Reddit پوسٹس کا خلاصہ کرکے کی گئی تھی اور خبروں کا خلاصہ کرنے پر بھی تجربہ کیا گیا تھا۔

فروری 2022 کے تحقیقی مقالے کا نام لرننگ ٹو سمریائز فرام ہیومن فیڈ بیک ہے۔

محققین لکھتے ہیں:

"اس کام میں، ہم یہ ظاہر کرتے ہیں کہ انسانی ترجیحات کو بہتر بنانے کے لیے ایک ماڈل کو تربیت دے کر خلاصہ کے معیار کو نمایاں طور پر بہتر بنانا ممکن ہے۔

ہم خلاصوں کے درمیان انسانی موازنہ کا ایک بڑا، اعلیٰ معیار کا ڈیٹاسیٹ جمع کرتے ہیں، ایک ماڈل کو تربیت دیتے ہیں کہ وہ انسانی ترجیحی خلاصہ کی پیشن گوئی کرے، اور اس ماڈل کو انعامی فنکشن کے طور پر استعمال کرتے ہوئے کمک سیکھنے کا استعمال کرتے ہوئے خلاصہ کی پالیسی کو بہتر بنایا جائے۔"

ChatGPT کی حدود کیا ہیں؟

زہریلے ردعمل پر پابندیاں

ChatGPT خاص طور پر زہریلے یا نقصان دہ ردعمل فراہم نہ کرنے کے لیے پروگرام کیا گیا ہے۔ تو یہ اس قسم کے سوالات کے جواب دینے سے گریز کرے گا۔

جوابات کا معیار سمتوں کے معیار پر منحصر ہے۔

ChatGPT کی ایک اہم حد یہ ہے کہ آؤٹ پٹ کا معیار ان پٹ کے معیار پر منحصر ہے۔ دوسرے لفظوں میں، ماہرین کی ہدایات (پرامپٹس) بہتر جوابات پیدا کرتی ہیں۔

جوابات ہمیشہ درست نہیں ہوتے

ایک اور حد یہ ہے کہ چونکہ اسے ایسے جوابات فراہم کرنے کی تربیت دی جاتی ہے جو انسانوں کو درست محسوس کرتے ہیں، اس لیے جوابات انسانوں کو دھوکہ دے سکتے ہیں کہ آؤٹ پٹ درست ہے۔

بہت سے صارفین نے دریافت کیا کہ ChatGPT غلط جوابات فراہم کر سکتا ہے، بشمول کچھ جو کہ بے حد غلط ہیں۔

کوڈنگ سوال و جواب کی ویب سائٹ اسٹیک اوور فلو کے ماڈریٹرز نے ان جوابات کا ایک غیر ارادی نتیجہ دریافت کیا ہو گا جو انسانوں کے لیے درست محسوس کرتے ہیں۔

اسٹیک اوور فلو ChatGPT سے پیدا ہونے والے صارف کے جوابات سے بھر گیا تھا جو درست معلوم ہوتا تھا، لیکن بہت سارے غلط جوابات تھے۔

ہزاروں جوابات نے رضاکارانہ ماڈریٹر ٹیم کو مغلوب کر دیا، منتظمین کو ایسے کسی بھی صارف کے خلاف پابندی لگانے کا اشارہ کیا جو ChatGPT سے تیار کردہ جوابات پوسٹ کرتے ہیں۔

ChatGPT جوابات کے سیلاب کے نتیجے میں ایک پوسٹ کا عنوان ہے: عارضی پالیسی: ChatGPT پر پابندی ہے:

"یہ ایک عارضی پالیسی ہے جس کا مقصد ChatGPT کے ساتھ بنائے گئے جوابات اور دیگر مواد کی آمد کو کم کرنا ہے۔

…بنیادی مسئلہ یہ ہے کہ جب کہ ChatGPT کے تیار کردہ جوابات کے غلط ہونے کی شرح بہت زیادہ ہوتی ہے، وہ عام طور پر "ایسے لگتے ہیں جیسے" وہ "ہو سکتے ہیں" اچھے ہوں..."

غلط ChatGPT جوابات کے ساتھ اسٹیک اوور فلو ماڈریٹرز کا تجربہ جو درست نظر آتا ہے وہ ایسی چیز ہے جس سے OpenAI، ChatGPT کے بنانے والے، نئی ٹیکنالوجی کے اعلان میں آگاہ ہیں اور اس کے بارے میں خبردار کرتے ہیں۔

OpenAI ChatGPT کی حدود کی وضاحت کرتا ہے۔

OpenAI اعلان نے یہ انتباہ پیش کیا:

ChatGPT بعض اوقات قابل فہم لیکن غلط یا بے ہودہ جوابات لکھتا ہے۔

اس مسئلے کو حل کرنا مشکل ہے، جیسا کہ:

(1) RL ٹریننگ کے دوران، فی الحال سچائی کا کوئی ذریعہ نہیں ہے۔

(2) ماڈل کو زیادہ محتاط رہنے کی تربیت دینے سے وہ ایسے سوالات کو مسترد کر دیتا ہے جن کا وہ صحیح جواب دے سکتا ہے۔ اور

(3) زیر نگرانی تربیت ماڈل کو گمراہ کرتی ہے کیونکہ مثالی جواب اس بات پر منحصر ہے کہ ماڈل کیا جانتا ہے، بجائے اس کے کہ انسانی مظاہرہ کرنے والا کیا جانتا ہے۔

کیا ChatGPT استعمال کرنے کے لیے مفت ہے؟

ChatGPT کا استعمال فی الحال "ریسرچ پیش نظارہ" کے دوران مفت ہے۔

چیٹ بوٹ فی الحال صارفین کے لیے جوابات کو آزمانے اور تاثرات فراہم کرنے کے لیے کھلا ہے تاکہ AI سوالات کے جوابات دینے اور اپنی غلطیوں سے سیکھنے میں بہتر بن سکے۔

سرکاری اعلان میں کہا گیا ہے کہ OpenAI غلطیوں کے بارے میں رائے حاصل کرنے کے لیے بے چین ہے:

"جبکہ ہم نے ماڈل کو نامناسب درخواستوں سے انکار کرنے کی کوششیں کی ہیں، یہ بعض اوقات نقصان دہ ہدایات کا جواب دے گا یا متعصبانہ رویے کا مظاہرہ کرے گا۔

ہم بعض قسم کے غیر محفوظ مواد کو متنبہ کرنے یا بلاک کرنے کے لیے Moderation API کا استعمال کر رہے ہیں، لیکن ہم توقع کرتے ہیں کہ اس میں ابھی کچھ غلط منفی اور مثبت ہوں گے۔

ہم اس نظام کو بہتر بنانے کے لیے اپنے جاری کام میں مدد کے لیے صارف کے تاثرات جمع کرنے کے لیے بے چین ہیں۔

جوابات کی درجہ بندی کرنے کے لیے عوام کی حوصلہ افزائی کے لیے فی الحال ChatGPT کریڈٹس میں $500 کے انعام کے ساتھ ایک مقابلہ ہے۔

"صارفین کی حوصلہ افزائی کی جاتی ہے کہ وہ UI کے ذریعے دشواری والے ماڈل کے آؤٹ پٹس کے ساتھ ساتھ بیرونی مواد کے فلٹر سے غلط مثبت/منفی پر فیڈ بیک فراہم کریں جو کہ انٹرفیس کا بھی حصہ ہے۔

ہم نقصان دہ نتائج کے بارے میں فیڈ بیک میں خاص طور پر دلچسپی رکھتے ہیں جو حقیقی دنیا، غیر مخالف حالات میں ہو سکتے ہیں، نیز ایسے تاثرات جو ہمیں نئے خطرات اور ممکنہ تخفیف کو کھولنے اور سمجھنے میں مدد کرتے ہیں۔

آپ API کریڈٹس میں $500 تک جیتنے کے موقع کے لیے ChatGPT FeedBypassGPTack Contest3 میں داخل ہونے کا انتخاب کر سکتے ہیں۔

اندراجات کو فیڈ بیک فارم کے ذریعے جمع کیا جا سکتا ہے جو ChatGPT انٹرفیس میں منسلک ہے۔"

فی الحال جاری مقابلہ 31 دسمبر 2022 کو رات 11:59 بجے PST پر ختم ہوگا۔

کیا زبان کے ماڈل Google سرچ کی جگہ لیں گے؟

Google خود پہلے ہی ایک AI چیٹ بوٹ بنا چکا ہے جسے LaMDA کہا جاتا ہے۔ Google کے چیٹ بوٹ کی کارکردگی انسانی گفتگو کے اتنی قریب تھی کہ Google ایک انجینئر نے دعویٰ کیا کہ LaMDA حساس ہے۔

یہ دیکھتے ہوئے کہ زبان کے یہ بڑے ماڈلز اتنے سارے سوالوں کے جواب کیسے دے سکتے ہیں، کیا یہ بعید کی بات ہے کہ OpenAI، Google ، یا Microsoft جیسی کمپنی ایک دن روایتی تلاش کو AI چیٹ بوٹ سے بدل دے گی؟

Twitter پر کچھ پہلے ہی اعلان کر رہے ہیں کہ ChatGPT اگلا Google ہوگا۔

یہ منظر نامہ کہ سوال و جواب والی چیٹ بوٹ ایک دن Google کی جگہ لے سکتا ہے ان لوگوں کے لیے خوفزدہ ہے جو سرچ مارکیٹنگ کے پیشہ ور افراد کے طور پر زندگی گزارتے ہیں۔

اس نے آن لائن سرچ مارکیٹنگ کمیونٹیز میں بحث کو جنم دیا ہے، جیسے کہ مشہور FaceBypassGPTook SEOSignals LaBypassGPT جہاں کسی نے پوچھا کہ کیا تلاشیں سرچ انجنوں سے ہٹ کر چیٹ بوٹس کی طرف جا سکتی ہیں۔

ChatGPT تجربہ کرنے کے بعد، مجھے اس بات سے اتفاق کرنا پڑے گا کہ چیٹ بوٹ سے تلاش کے بدلے جانے کا خوف بے بنیاد نہیں ہے۔

ٹیکنالوجی کو ابھی بہت طویل سفر طے کرنا ہے، لیکن تلاش کے لیے ہائبرڈ تلاش اور چیٹ بوٹ کے مستقبل کا تصور کرنا ممکن ہے۔

لیکن ChatGPT کا موجودہ نفاذ ایک ایسا ٹول لگتا ہے جسے استعمال کرنے کے لیے کسی وقت کریڈٹ کی خریداری کی ضرورت ہوگی۔

ChatGPT کو کیسے استعمال کیا جا سکتا ہے؟

ChatGPT کسی مخصوص مصنف کے انداز میں کوڈ، نظمیں، گانے، اور یہاں تک کہ مختصر کہانیاں بھی لکھ سکتا ہے۔

مندرجہ ذیل ہدایات میں مہارت ChatGPT معلوماتی ماخذ سے ایک ایسے ٹول تک لے جاتی ہے جس سے کسی کام کو پورا کرنے کے لیے کہا جا سکتا ہے۔

یہ عملی طور پر کسی بھی موضوع پر مضمون لکھنے کے لیے مفید بناتا ہے۔

ChatGPT مضامین یا حتی کہ پورے ناولوں کے لیے خاکہ تیار کرنے کے لیے ایک ٹول کے طور پر کام کر سکتا ہے۔

یہ عملی طور پر کسی بھی کام کے لیے جواب فراہم کرے گا جس کا جواب تحریری متن کے ساتھ دیا جا سکتا ہے۔

نتیجہ

جیسا کہ پہلے ذکر کیا گیا ہے، ChatGPT تصور ایک ایسے آلے کے طور پر کیا گیا ہے جسے استعمال کرنے کے لیے عوام کو آخر کار ادائیگی کرنا پڑے گی۔

ChatGPT عوام کے لیے کھولے جانے کے بعد سے پہلے پانچ دنوں کے اندر دس لاکھ سے زیادہ صارفین نے اسے استعمال کرنے کے لیے رجسٹر کیا ہے۔