ChatGPT کیسے کام کرتا ہے؟

ChatGPT AI سے چلنے والے سب سے چمکدار نئے ٹولز میں سے ایک ہے، لیکن پس منظر میں کام کرنے والے الگورتھم دراصل 2020 سے ایپس اور سروسز کی ایک پوری رینج کو طاقت دے رہے ہیں۔ لہٰذا یہ سمجھنے کے لیے کہ ChatGPT کیسے کام کرتا ہے، ہمیں بنیادی زبان کے بارے میں بات کر کے شروع کرنے کی ضرورت ہے۔ انجن جو اسے طاقت دیتا ہے۔

ChatGPT میں GPT زیادہ تر GPT-3، یا جنریٹو پری ٹرینڈ ٹرانسفارمر 3 ہے، حالانکہ GPT-4 اب ChatGPT پلس سبسکرائبرز کے لیے دستیاب ہے — اور شاید جلد ہی زیادہ وسیع ہو جائے گا۔ GPT ماڈلز OpenAI (ChatGPT اور امیج جنریٹر DALL·E 2 کے پیچھے والی کمپنی) نے تیار کیے تھے، لیکن وہ Bing کی AI خصوصیات سے لے کر Jasper اور Copy.ai جیسے تحریری ٹولز تک ہر چیز کو طاقت دیتے ہیں۔ درحقیقت، اس وقت دستیاب زیادہ تر AI ٹیکسٹ جنریٹرز GPT-3 استعمال کرتے ہیں، اور ممکنہ طور پر اگلے مرحلے کے طور پر GPT-4 پیش کریں گے۔

ChatGPT نے GPT-3 کو لائم لائٹ میں لایا کیونکہ اس نے AI ٹیکسٹ جنریٹر کے ساتھ تعامل کے عمل کو آسان اور سب سے اہم بات - سب کے لیے مفت بنا دیا۔ اس کے علاوہ، یہ ایک چیٹ بوٹ ہے، اور لوگوں نے SmarterChild کے بعد سے ایک اچھا چیٹ بوٹ پسند کیا ہے۔

جبکہ GPT-3 اور GPT-4 اس وقت سب سے زیادہ مقبول لارج لینگویج ماڈلز (LLMs) ہیں، اگلے چند سالوں میں، بہت زیادہ مقابلہ ہونے کا امکان ہے۔ مثال کے طور پر، Google کے پاس Bard — اس کا AI چیٹ بوٹ — ہے جو اس کے اپنے لینگویج انجن پاتھ ویز لینگویج ماڈل (PaLM 2) سے چلتا ہے۔ لیکن ابھی کے لیے، OpenAI کی پیشکش ڈی فیکٹو انڈسٹری کا معیار ہے۔ لوگوں کے لیے یہ سب سے آسان ٹول ہے۔

تو اس کا جواب "ChatGPT کیسے کام کرتا ہے؟" بنیادی طور پر ہے: GPT-3 اور GPT-4۔ لیکن آئیے تھوڑا گہرا کھودتے ہیں۔

ChatGPT کیا ہے؟

ChatGPT ایک ایپ ہے جسے OpenAI نے بنایا ہے۔ GPT زبان کے ماڈلز کا استعمال کرتے ہوئے، یہ آپ کے سوالوں کے جواب دے سکتا ہے، کاپی لکھ سکتا ہے، ای میلز کا مسودہ بنا سکتا ہے، گفتگو کر سکتا ہے، مختلف پروگرامنگ زبانوں میں کوڈ کی وضاحت کر سکتا ہے، قدرتی زبان کو کوڈ میں ترجمہ کر سکتا ہے، اور بہت کچھ — یا کم از کم کوشش کر سکتا ہے — یہ سب کچھ قدرتی زبان پر مبنی ہے۔ آپ کو اسے کھلانے کا اشارہ کرتا ہے۔ یہ ایک چیٹ بوٹ ہے، لیکن واقعی، واقعی اچھا ہے۔

اگر آپ اپنے پالتو جانور کے بارے میں شیکسپیئر کا سانیٹ لکھنا چاہتے ہیں یا کچھ مارکیٹنگ ای میلز کے لیے سبجیکٹ لائنز کے لیے کچھ آئیڈیاز حاصل کرنا چاہتے ہیں تو اس کے ساتھ کھیلنا اچھا لگتا ہے، یہ OpenAI کے لیے بھی اچھا ہے۔ یہ حقیقی صارفین سے بہت زیادہ ڈیٹا حاصل کرنے کا ایک طریقہ ہے اور GPT کی طاقت کے لیے ایک فینسی ڈیمو کے طور پر کام کرتا ہے، جو بصورت دیگر تھوڑا سا مبہم محسوس کر سکتا ہے جب تک کہ آپ مشین لرننگ میں گہری نہ ہوں۔

ابھی، ChatGPT دو GPT ماڈل پیش کرتا ہے۔ پہلے سے طے شدہ، GPT-3.5، کم طاقتور ہے لیکن سب کے لیے مفت دستیاب ہے۔ زیادہ جدید GPT-4 ChatGPT Plus سبسکرائبرز تک ہی محدود ہے، اور یہاں تک کہ وہ ہر روز صرف محدود تعداد میں سوالات حاصل کرتے ہیں۔

ChatGPT کی ایک بڑی خصوصیت یہ ہے کہ یہ آپ کے ساتھ ہونے والی گفتگو کو یاد رکھ سکتا ہے۔ اس کا مطلب ہے کہ یہ جو کچھ بھی آپ نے اس سے پہلے پوچھا ہے اس سے سیاق و سباق اکٹھا کر سکتا ہے اور پھر آپ کے ساتھ اس کی گفتگو کو مطلع کرنے کے لیے اسے استعمال کر سکتا ہے۔ آپ دوبارہ کام اور تصحیح کے لیے بھی پوچھ سکتے ہیں، اور یہ ان چیزوں کا حوالہ دے گا جس پر آپ پہلے بحث کر رہے تھے۔ یہ AI کے ساتھ بات چیت کو ایک حقیقی آگے پیچھے محسوس کرتا ہے۔

اگر آپ واقعی اس کا احساس حاصل کرنا چاہتے ہیں، تو جائیں اور ابھی ChatGPT کے ساتھ کھیلنے میں پانچ منٹ گزاریں (یہ مفت ہے!)، اور پھر یہ پڑھنے کے لیے واپس آئیں کہ یہ کیسے کام کرتا ہے۔

ChatGPT کیسے کام کرتا ہے؟

اس بڑے ڈیٹاسیٹ کو انسانی دماغ کے مطابق ایک گہری سیکھنے والے ] نیٹ ورک کی تشکیل کے لیے استعمال کیا گیا [ ] جس [ ChatGPT کو ٹیکسٹ ڈیٹا میں پیٹرن اور تعلقات سیکھنے کی اجازت دی تھی .

ChatGPT آپ کے پرامپٹ کو سمجھنے کی کوشش کرکے اور پھر الفاظ کے تار تھوک کر کام کرتا ہے جس کی یہ پیش گوئی کرتا ہے کہ آپ کے سوال کا بہترین جواب دے گا، اس ڈیٹا کی بنیاد پر جس پر اسے تربیت دی گئی تھی۔

چلو اصل میں اس تربیت کے بارے میں بات کرتے ہیں. یہ ایک ایسا عمل ہے جہاں نوزائیدہ AI کو کچھ بنیادی اصول دیے جاتے ہیں، اور پھر اسے یا تو حالات میں ڈالا جاتا ہے یا اس کے اپنے الگورتھم تیار کرنے کے لیے کام کرنے کے لیے ڈیٹا کا بوجھ دیا جاتا ہے۔

GPT-3 کو تقریباً 500 بلین "ٹوکنز" پر تربیت دی گئی تھی، جو اس کے زبان کے ماڈلز کو زیادہ آسانی سے معنی تفویض کرنے اور قابل فہم فالو آن ٹیکسٹ کی پیش گوئی کرنے کی اجازت دیتے ہیں۔ بہت سے الفاظ سنگل ٹوکن پر نقشہ بناتے ہیں، حالانکہ لمبے یا زیادہ پیچیدہ الفاظ اکثر ایک سے زیادہ ٹوکن میں ٹوٹ جاتے ہیں۔ اوسطاً، ٹوکن تقریباً چار حروف کے ہوتے ہیں۔ اوپن اے آئی نے GPT-4 کے اندرونی کام کے بارے میں خاموشی اختیار کی ہے، لیکن ہم محفوظ طریقے سے یہ فرض کر سکتے ہیں کہ اسے اسی ڈیٹاسیٹ پر تربیت دی گئی تھی کیونکہ یہ اور بھی زیادہ طاقتور ہے۔

تمام ٹوکنز انسانوں کے لکھے ہوئے ڈیٹا کے ایک بڑے کارپس سے آئے ہیں۔ اس میں کتابیں، مضامین، اور تمام مختلف عنوانات، طرزوں اور انواع کی دیگر دستاویزات شامل ہیں — اور کھلے انٹرنیٹ سے مواد کی ایک ناقابل یقین مقدار کو ختم کیا گیا ہے۔ بنیادی طور پر، اسے انسانی علم کے مجموعی طور پر کم کرنے کی اجازت تھی۔

اس بڑے ڈیٹاسیٹ کو ایک گہرے سیکھنے والے نیورل نیٹ ورک کی تشکیل کے لیے استعمال کیا گیا تھا — ایک پیچیدہ، کئی پرتوں والا، وزنی الگورتھم جسے انسانی دماغ کے مطابق بنایا گیا تھا — جس نے ChatGPT کو متنی ڈیٹا میں پیٹرن اور تعلقات سیکھنے اور انسان جیسا تخلیق کرنے کی صلاحیت پر ٹیپ کرنے کی اجازت دی۔ کسی بھی جملے میں آگے کیا متن آنا چاہیے اس کی پیشن گوئی کر کے جوابات۔

اگرچہ واقعی، یہ چیزوں کو بڑے پیمانے پر کم کرتا ہے۔ ChatGPT جملے کی سطح پر کام نہیں کرتا — اس کے بجائے، یہ متن تیار کر رہا ہے کہ کون سے الفاظ، جملے، اور یہاں تک کہ پیراگراف یا سٹینز بھی پیروی کر سکتے ہیں۔ یہ آپ کے فون پر دو ٹوک انداز میں اگلے لفظ کا اندازہ لگا کر پیش گوئی کرنے والا متن نہیں ہے۔ یہ کسی بھی اشارے پر مکمل طور پر مربوط ردعمل پیدا کرنے کی کوشش کر رہا ہے۔

مختلف قسم کے اشارے پر جواب دینے کے لیے ChatGPT کی صلاحیت کو مزید بہتر بنانے کے لیے، اسے انسانی تاثرات کے ساتھ Reinforcement Learning (RLHF) نامی تکنیک کے ساتھ مکالمے کے لیے بہتر بنایا گیا تھا۔ بنیادی طور پر، انسانوں نے موازنہ کے اعداد و شمار کے ساتھ ایک انعامی ماڈل بنایا (جہاں AI ٹرینرز کے ذریعہ دو یا زیادہ ماڈل کے جوابات کی درجہ بندی کی گئی تھی)، تاکہ AI یہ جان سکے کہ کون سا بہترین ردعمل تھا۔

اس کے بنائے گئے عصبی نیٹ ورک پر واپس جائیں۔ اس تمام تربیت کی بنیاد پر، GPT-3 کے نیورل نیٹ ورک میں 175 بلین پیرامیٹرز یا متغیرات ہیں جو اسے ایک ان پٹ لینے کی اجازت دیتے ہیں — آپ کا اشارہ — اور پھر، مختلف پیرامیٹرز (اور بے ترتیب ہونے کی ایک چھوٹی سی مقدار) کو دی جانے والی اقدار اور وزن کی بنیاد پر۔ )، جو کچھ بھی لگتا ہے اسے آپ کی درخواست سے میل کھاتا ہے۔ OpenAI نے یہ نہیں بتایا ہے کہ GPT-4 کے کتنے پیرامیٹرز ہیں، لیکن یہ ایک محفوظ اندازہ ہے کہ یہ 175 بلین سے زیادہ ہے اور ایک بار چلنے والے 100 ٹریلین پیرامیٹرز سے کم ہے۔ قطع نظر درست تعداد کے، مزید پیرامیٹرز کا خود بخود بہتر مطلب نہیں ہے۔ GPT-4 کی بڑھتی ہوئی طاقت میں سے کچھ شاید GPT-3 سے زیادہ پیرامیٹرز رکھنے سے آتی ہے، لیکن اس کی تربیت کے طریقہ کار میں بہتری کے لیے شاید بہت کچھ کم ہے۔

آخر میں، اس کا تصور کرنے کا آسان ترین طریقہ ان "جملے کو ختم کریں" گیمز میں سے ایک جیسا ہے جو آپ نے بچپن میں کھیلا تھا۔

آخر میں، اس کا تصور کرنے کا آسان ترین طریقہ ان "جملے کو ختم کریں" گیمز میں سے ایک جیسا ہے جو آپ نے بچپن میں کھیلا تھا۔ مثال کے طور پر، جب میں نے GPT-3 کا استعمال کرتے ہوئے ChatGPT دیا، "Zapier is…" اس نے جواب دیا:

"Zapier ایک ویب پر مبنی آٹومیشن ٹول ہے جو صارفین کو مختلف ویب ایپلیکیشنز کو ایک ساتھ جوڑنے کی اجازت دیتا ہے تاکہ بار بار ہونے والے کاموں کو خودکار بنایا جا سکے اور ورک فلو کو بہتر بنایا جا سکے۔"

یہ اس قسم کا جملہ ہے جو آپ کو سینکڑوں مضامین میں مل سکتا ہے جو بیان کرتا ہے کہ Zapier کیا کرتا ہے، اس لیے یہ سمجھ میں آتا ہے کہ یہ اس قسم کی چیز ہے جو یہاں تھوکتی ہے۔ لیکن جب میرے ایڈیٹر نے اسے وہی اشارہ دیا تو اس نے کہا:

"Zapier ایک ویب پر مبنی آٹومیشن ٹول ہے جو صارفین کو مختلف ویب ایپلیکیشنز کو جوڑنے اور ان کے درمیان ورک فلو کو خودکار کرنے کی اجازت دیتا ہے۔"

یہ کافی مماثل ہے، لیکن یہ بالکل ایک جیسا جواب نہیں ہے۔ وہ بے ترتیب پن (جسے آپ "درجہ حرارت" نامی ترتیب کے ساتھ کچھ GPT-3 ایپس میں کنٹرول کر سکتے ہیں) اس بات کو یقینی بناتا ہے کہ ChatGPT صرف ہر ایک جواب کا جواب نہیں دے رہا ہے کہ اسٹاک جواب کی مقدار کیا ہے۔ یہ ہر بار پورے نیورل نیٹ ورک کے ذریعے ہر ایک پرامپٹ کو چلا رہا ہے، اور چیزوں کو تازہ رکھنے کے لیے یہاں اور وہاں کچھ نرد گھوم رہا ہے۔ یہ دعویٰ شروع کرنے کا امکان نہیں ہے کہ زپیئر مریخ کا رنگ ہے، لیکن یہ ان کے متعلقہ امکانات کی بنیاد پر درج ذیل الفاظ کو ملا دے گا۔

(جی پی ٹی-4 پر چلتے وقت، ChatGPT نے کہا: " Zapier ایک ویب پر مبنی آٹومیشن ٹول ہے جو صارفین کو مختلف آن لائن ایپلی کیشنز اور سروسز کے درمیان کاموں کو مربوط اور خودکار کرنے کی اجازت دیتا ہے۔" بہت کچھ ایسا ہی!)

الفاظ کو تھوکنا، علم نہیں۔

ChatGPT بنانے والوں نے سب سے پہلے کہا ہے کہ یہ غلط (اور ممکنہ طور پر نقصان دہ) معلومات پیدا کر سکتا ہے، حالانکہ وہ اسے ٹھیک کرنے کے لیے سخت محنت کر رہے ہیں۔

یہاں ایک شائستہ مثال ہے۔ جب میں نے ChatGPT کو GPT-3 اور GPT-4 کا استعمال کرتے ہوئے "Harry Guinness is…" کا جواب دینے کے لیے کہا تو GPT-3 نے سب سے پہلے یہ پوچھ کر جواب دیا کہ کون سا ہیری گنیز ہے۔ بہت اچھا سوال — لفظی طور پر ہم میں سے دو ہیں! تو میں نے کہا، "ہیری گنیز مصنف" (یہ میں ہوں)۔ GPT-4 نے فوراً اندازہ لگایا کہ میں کون تھا، حالانکہ دونوں جوابات دلکش تھے:

GPT-3: ہیری گنیز آئرلینڈ میں مقیم ایک آزاد مصنف اور صحافی ہیں۔ انہوں نے متعدد اشاعتوں کے لیے لکھا ہے، جن میں دی نیویارک ٹائمز، دی گارڈین، دی ہفنگٹن پوسٹ، اور پاپولر میکینکس شامل ہیں۔ وہ ٹیکنالوجی اور فوٹو گرافی سے لے کر سفر اور ثقافت تک کے موضوعات کا احاطہ کرتا ہے۔

GPT-4: ہیری گنیز ایک آئرش مصنف، فوٹوگرافر، اور ٹیکنالوجی کے ماہر ہیں۔ اس نے مختلف اشاعتوں کے لیے لکھا ہے، بشمول How-to Geek، Lifehacker، اور Tuts+۔ اس کا کام بنیادی طور پر ٹیکنالوجی، سبق، اور تجاویز کے ساتھ ساتھ فوٹو گرافی اور تصویری ترمیم پر مرکوز ہے۔ گنیز نے تفصیلی گائیڈز بنانے کے لیے ایک شہرت بنائی ہے جو قارئین کو پیچیدہ مضامین کو سمجھنے یا مسائل کو سیدھے طریقے سے حل کرنے میں مدد کرتی ہے۔

GPT-3 کی پہلی اور آخری سطریں میری مختلف ویب سائٹس اور ویب پر موجود مصنفین کے بائیو سے تقریباً لفظی طور پر کھینچی جاتی ہیں (حالانکہ میں عام طور پر اپنے آپ کو ایک آزاد مصنف اور فوٹوگرافر کے طور پر درج کرتا ہوں، صحافی نہیں)۔ لیکن اشاعتوں کی فہرست بنیادی طور پر بنائی گئی ہے۔ میں نے The New York Times کے لیے لکھا ہے، لیکن The Guardian ، The Huffington Post ، یا Popular Mechanics کے لیے نہیں (میں پاپولر سائنس کے لیے باقاعدگی سے لکھتا ہوں، اس لیے شاید یہ وہیں سے آیا ہے)۔

GPT-4 فوٹوگرافر کا حصہ ٹھیک کرتا ہے اور درحقیقت کچھ اشاعتوں کی فہرست دیتا ہے جن کے لیے میں نے لکھا ہے، جو متاثر کن ہے، حالانکہ وہ وہ نہیں ہیں جن پر مجھے سب سے زیادہ فخر ہوگا۔ یہ ایک عمدہ مثال ہے کہ کس طرح OpenAI GPT-3 کی نسبت GPT-4 کی درستگی کو بڑھانے میں کامیاب رہا ہے، حالانکہ یہ ہمیشہ درست جواب نہیں دے سکتا ہے۔

لیکن آئیے GPT-3 پر واپس چلتے ہیں کیونکہ اس کی خرابی ایک دلچسپ مثال فراہم کرتی ہے کہ ChatGPT میں پردے کے پیچھے کیا ہو رہا ہے۔ یہ دراصل میرے بارے میں کچھ نہیں جانتا۔ یہ انٹرنیٹ سے کاپی/پیسٹ کرنا اور معلومات کے ماخذ پر بھروسہ کرنا بھی نہیں ہے۔ اس کے بجائے، یہ صرف الفاظ کی ایک تار کی پیش گوئی کر رہا ہے جو اس کے پاس موجود اربوں ڈیٹا پوائنٹس کی بنیاد پر آگے آئے گا۔

مثال کے طور پر: The New York Times کو The Guardian اور The Huffington Post کے ساتھ زیادہ کثرت سے گروپ کیا جاتا ہے ان جگہوں کے ساتھ جو میں نے لکھا ہے، جیسے Wired , Outside , The Irish Times , اور یقیناً Zapier۔ اس لیے جب یہ کام کرنا ہے کہ نیویارک ٹائمز سے کیا فالو کرنا چاہیے، تو یہ میرے بارے میں شائع شدہ معلومات سے نہیں نکالتا۔ یہ اس کے پاس موجود تمام تربیتی ڈیٹا سے بڑی اشاعتوں کی اس فہرست کو کھینچتا ہے۔ یہ بہت ہوشیار ہے اور قابل فہم لگتا ہے، لیکن یہ سچ نہیں ہے۔

GPT-4 بہت بہتر کام کرتا ہے اور اشاعتوں کو ناخن بناتا ہے، لیکن باقی جو کچھ یہ کہتا ہے وہ واقعی قابل فہم پیروی جملوں کی طرح محسوس ہوتا ہے۔ مجھے نہیں لگتا کہ اس میں میری ساکھ کی کوئی بڑی تعریف ہے: یہ صرف اس قسم کی بات کہہ رہا ہے جو بائیو کہتا ہے۔ GPT-3 کے مقابلے میں یہ کس طرح کام کرتا ہے اسے چھپانے میں کہیں بہتر ہے، حالانکہ یہ اصل میں ایک ہی تکنیک کا استعمال کر رہا ہے۔

پھر بھی، یہ بہت متاثر کن ہے کہ GPT پہلے سے ہی کتنا بہتر ہوا ہے۔ ابھی کے لیے، GPT-4 ایک پریمیم سبسکرپشن کے پیچھے بند ہے، لہذا آپ کو نظر آنے والا زیادہ تر ChatGPT مواد GPT-3 پر انحصار کرے گا، لیکن یہ اگلے وقت میں تبدیل ہو سکتا ہے۔ کون جانتا ہے کہ GPT-5 کیا لائے گا۔

ChatGPT API کیا ہے؟

اوپن اے آئی کا اپنی ٹیکنالوجی کے ساتھ انصاف پسندانہ رویہ نہیں ہے۔ کمپنی کے پاس ایک API پلیٹ فارم ہے جو ڈویلپرز کو ChatGPT کی طاقت کو ان کی اپنی ایپس اور سروسز میں ضم کرنے کی اجازت دیتا ہے (یقینا قیمت کے لیے)۔

Zapier اپنے ChatGPT انضمام کو طاقت دینے کے لیے ChatGPT API کا استعمال کرتا ہے، جو آپ کو ChatGPT کو ہزاروں دیگر ایپس سے منسلک کرنے اور آپ کے کاروبار کے لیے اہم ورک فلو میں AI شامل کرنے دیتا ہے۔ آپ کو شروع کرنے کے لیے یہاں کچھ مثالیں ہیں، لیکن آپ بنیادی طور پر کسی بھی ایپ سے ChatGPT کو ٹرگر کر سکتے ہیں۔

آپ Zapier کے OpenAI انضمام کے ساتھ OpenAI کے دوسرے ماڈلز جیسے DALL·E اور Whisper کا بھی استعمال کر سکتے ہیں۔ ورک فلوز کو خودکار بنائیں جس میں امیج جنریشن اور آڈیو ٹرانسکرپشن شامل ہے، سیدھے ان ایپس سے جو آپ پہلے سے استعمال کر رہے ہیں۔

ChatGPT کیسے کام کرتا ہے؟

ChatGPT کیا ہے؟

ChatGPT کیسے کام کرتا ہے؟

الفاظ کو تھوکنا، علم نہیں۔

ChatGPT API کیا ہے؟

متعلقہ مضامین