چیٹ جی پی ٹی واٹر مارک کیسے کام کرتا ہے اور اسے کیوں شکست دی جا سکتی ہے۔ HIX AI

اوپن اے آئی کے چیٹ جی پی ٹی نے خود بخود مواد بنانے کا ایک طریقہ متعارف کرایا لیکن اس کا پتہ لگانا آسان بنانے کے لیے واٹر مارکنگ فیچر متعارف کرانے کا منصوبہ کچھ لوگوں کو پریشان کر رہا ہے۔ ChatGPT واٹر مارکنگ اس طرح کام کرتی ہے اور اسے شکست دینے کا کوئی طریقہ کیوں ہوسکتا ہے۔

ChatGPT ایک ناقابل یقین ٹول ہے جس سے آن لائن پبلشرز، ملحقہ اور SEOs بیک وقت پیار اور ڈرتے ہیں۔

کچھ مارکیٹرز اسے پسند کرتے ہیں کیونکہ وہ مواد کے مختصر، خاکہ اور پیچیدہ مضامین تیار کرنے کے لیے اسے استعمال کرنے کے نئے طریقے تلاش کر رہے ہیں۔

آن لائن پبلشرز اس امکان سے خوفزدہ ہیں کہ AI مواد کی تلاش کے نتائج میں سیلاب آ جائے، انسانوں کے لکھے ہوئے ماہر مضامین کی جگہ لے لے۔

نتیجتاً، ایک واٹر مارکنگ فیچر کی خبر جو ChatGPT کے تصنیف کردہ مواد کی کھوج کو کھول دیتی ہے اسی طرح بے چینی اور امید کے ساتھ متوقع ہے۔

کرپٹوگرافک واٹر مارک

واٹر مارک ایک نیم شفاف نشان (لوگو یا متن) ہے جو کسی تصویر پر سرایت کرتا ہے۔ واٹر مارک اشارہ کرتا ہے کہ کام کا اصل مصنف کون ہے۔

یہ زیادہ تر تصاویر میں اور ویڈیوز میں تیزی سے دیکھا جاتا ہے۔

ChatGPT میں واٹر مارکنگ ٹیکسٹ میں خفیہ کوڈ کی شکل میں الفاظ، حروف اور اوقاف کے پیٹرن کو سرایت کرنے کی شکل میں خفیہ نگاری شامل ہے۔

سکاٹ ایرونسن اور چیٹ جی پی ٹی واٹر مارکنگ

Scott Aaronson نامی ایک بااثر کمپیوٹر سائنسدان کو OpenAI نے جون 2022 میں AI سیفٹی اور الائنمنٹ پر کام کرنے کے لیے رکھا تھا۔

AI سیفٹی ایک تحقیقی شعبہ ہے جس کا تعلق ان طریقوں کا مطالعہ کرنے سے ہے جن سے AI انسانوں کو نقصان پہنچا سکتا ہے اور اس قسم کے منفی خلل کو روکنے کے طریقے پیدا کرتا ہے۔

ڈسٹل سائنسی جریدہ، جس میں OpenAI سے وابستہ مصنفین شامل ہیں، AI سیفٹی کی وضاحت اس طرح کرتا ہے:

"طویل مدتی مصنوعی ذہانت (AI) کی حفاظت کا مقصد اس بات کو یقینی بنانا ہے کہ جدید ترین AI سسٹمز قابل اعتماد طریقے سے انسانی اقدار کے ساتھ منسلک ہیں - کہ وہ قابل اعتماد طریقے سے وہ کام کرتے ہیں جو لوگ ان سے کرنا چاہتے ہیں۔"

AI الائنمنٹ مصنوعی ذہانت کا شعبہ ہے جس کا تعلق اس بات کو یقینی بنانے سے ہے کہ AI مطلوبہ اہداف کے ساتھ ہم آہنگ ہے۔

ایک بڑے لینگویج ماڈل (LLM) جیسے ChatGPT کو اس طرح استعمال کیا جا سکتا ہے جو OpenAI کی طرف سے بیان کردہ AI الائنمنٹ کے اہداف کے برعکس ہو سکتا ہے، جو کہ AI بنانا ہے جو انسانیت کو فائدہ پہنچائے۔

اس کے مطابق، واٹر مارکنگ کی وجہ AI کے غلط استعمال کو روکنا ہے جس سے انسانیت کو نقصان پہنچتا ہے۔

ایرونسن نے واٹر مارکنگ ChatGPT آؤٹ پٹ کی وجہ بتائی:

"یہ علمی ادبی سرقہ کو روکنے کے لیے مددگار ثابت ہو سکتا ہے، ظاہر ہے، لیکن یہ بھی، مثال کے طور پر، بڑے پیمانے پر پروپیگنڈے کی نسل..."

ChatGPT واٹر مارکنگ کیسے کام کرتی ہے؟

چیٹ جی پی ٹی واٹر مارکنگ ایک ایسا نظام ہے جو اعداد و شمار کے پیٹرن، ایک کوڈ کو الفاظ کے انتخاب اور حتی کہ اوقاف کے نشانات میں شامل کرتا ہے۔

مصنوعی ذہانت کے ذریعے تخلیق کردہ مواد الفاظ کے انتخاب کے کافی اندازے کے ساتھ تیار کیا جاتا ہے۔

انسانوں اور AI کے لکھے ہوئے الفاظ شماریاتی نمونہ کی پیروی کرتے ہیں۔

تیار کردہ مواد میں استعمال ہونے والے الفاظ کے پیٹرن کو تبدیل کرنا ٹیکسٹ کو "واٹر مارک" کرنے کا ایک طریقہ ہے تاکہ سسٹم کے لیے یہ معلوم کرنا آسان ہو کہ آیا یہ AI ٹیکسٹ جنریٹر کی پیداوار ہے۔

وہ چال جو AI مواد کے واٹر مارکنگ کو ناقابل شناخت بناتی ہے وہ یہ ہے کہ الفاظ کی تقسیم اب بھی عام AI سے تیار کردہ متن کی طرح بے ترتیب شکل رکھتی ہے۔

اسے الفاظ کی چھدم تقسیم کہا جاتا ہے۔

Pseudorandomness اعداد و شمار کے لحاظ سے الفاظ یا اعداد کی ایک بے ترتیب سیریز ہے جو حقیقت میں بے ترتیب نہیں ہیں۔

ChatGPT واٹر مارکنگ فی الحال استعمال میں نہیں ہے۔ تاہم اوپن اے آئی میں سکاٹ ایرونسن ریکارڈ پر ہیں کہ یہ منصوبہ بندی کی گئی ہے۔

ابھی ChatGPT پیش نظارہ میں ہے، جو OpenAI کو حقیقی دنیا کے استعمال کے ذریعے "غلط ترتیب" دریافت کرنے کی اجازت دیتا ہے۔

ممکنہ طور پر واٹر مارکنگ کو ChatGPT کے آخری ورژن میں یا اس سے پہلے متعارف کرایا جا سکتا ہے۔

سکاٹ ایرونسن نے لکھا کہ واٹر مارکنگ کیسے کام کرتی ہے:

"میرا اہم پروجیکٹ اب تک جی پی ٹی جیسے ٹیکسٹ ماڈل کے آؤٹ پٹس کو شماریاتی طور پر واٹر مارک کرنے کا ایک ٹول رہا ہے۔
بنیادی طور پر، جب بھی جی پی ٹی کچھ لمبا متن تیار کرتا ہے، تو ہم چاہتے ہیں کہ اس کے الفاظ کے انتخاب میں ایک دوسری صورت میں ناقابل توجہ خفیہ سگنل ہو، جسے آپ بعد میں یہ ثابت کرنے کے لیے استعمال کر سکتے ہیں کہ، ہاں، یہ جی پی ٹی سے آیا ہے۔"

ایرونسن نے مزید وضاحت کی کہ ChatGPT واٹر مارکنگ کیسے کام کرتی ہے۔ لیکن پہلے، ٹوکنائزیشن کے تصور کو سمجھنا ضروری ہے۔

ٹوکنائزیشن ایک ایسا مرحلہ ہے جو قدرتی زبان کی پروسیسنگ میں ہوتا ہے جہاں مشین الفاظ کو کسی دستاویز میں لیتی ہے اور انہیں الفاظ اور جملوں کی طرح معنوی اکائیوں میں توڑ دیتی ہے۔

ٹوکنائزیشن متن کو ایک منظم شکل میں تبدیل کرتی ہے جسے مشین لرننگ میں استعمال کیا جا سکتا ہے۔

ٹیکسٹ جنریشن کا عمل وہ مشین ہے جس کا اندازہ لگایا جاتا ہے کہ پچھلے ٹوکن کی بنیاد پر کون سا ٹوکن اگلا آتا ہے۔

یہ ایک ریاضیاتی فنکشن کے ساتھ کیا جاتا ہے جو اس امکان کا تعین کرتا ہے کہ اگلا ٹوکن کیا ہوگا، جسے امکانی تقسیم کہا جاتا ہے۔

اگلا کون سا لفظ ہے اس کی پیشین گوئی کی گئی ہے لیکن یہ بے ترتیب ہے۔

واٹر مارکنگ بذات خود وہی ہے جسے آرون نے سیوڈورنڈم کے طور پر بیان کیا ہے، اس میں کسی خاص لفظ یا اوقاف کے نشان کے موجود ہونے کی ایک ریاضیاتی وجہ ہے لیکن یہ اب بھی شماریاتی طور پر بے ترتیب ہے۔

جی پی ٹی واٹر مارکنگ کی تکنیکی وضاحت یہ ہے:

"جی پی ٹی کے لیے، ہر ان پٹ اور آؤٹ پٹ ٹوکنز کی ایک تار ہے، جو کہ الفاظ ہو سکتے ہیں بلکہ اوقاف کے نشانات، الفاظ کے حصے، یا اس سے بھی زیادہ۔ مجموعی طور پر تقریباً 100,000 ٹوکنز ہیں۔
اپنے بنیادی طور پر، GPT مسلسل اگلے ٹوکن پر ممکنہ تقسیم پیدا کر رہا ہے، جو پچھلے ٹوکنز کی سٹرنگ پر مشروط ہے۔
نیورل نیٹ ڈسٹری بیوشن تیار کرنے کے بعد، اوپن اے آئی سرور اصل میں اس ڈسٹری بیوشن کے مطابق ٹوکن کا نمونہ لیتا ہے—یا ڈسٹری بیوشن کے کچھ ترمیم شدہ ورژن، 'درجہ حرارت' نامی پیرامیٹر پر منحصر ہوتا ہے۔
جب تک درجہ حرارت غیر صفر ہے، اگرچہ، عام طور پر اگلے ٹوکن کے انتخاب میں کچھ بے ترتیب پن ہو گا: آپ ایک ہی پرامپٹ کے ساتھ بار بار دوڑ سکتے ہیں، اور ہر بار ایک مختلف تکمیل (یعنی آؤٹ پٹ ٹوکن کی تار) حاصل کر سکتے ہیں۔ .
اس کے بعد واٹر مارک پر، اگلے ٹوکن کو تصادفی طور پر منتخب کرنے کے بجائے، خیال یہ ہوگا کہ اسے خفیہ طریقے سے منتخب کیا جائے، ایک کرپٹوگرافک سیوڈورنڈم فنکشن کا استعمال کرتے ہوئے، جس کی کلید صرف OpenAI کو معلوم ہے۔

متن پڑھنے والوں کے لیے واٹر مارک بالکل فطری لگتا ہے کیونکہ الفاظ کا انتخاب دوسرے تمام الفاظ کی بے ترتیبی کی نقل کر رہا ہے۔

یہ تکنیکی وضاحت ہے:

"واضح کرنے کے لیے، خاص صورت میں کہ GPT کے پاس ممکنہ ٹوکنز کا ایک گروپ تھا جسے اس نے یکساں طور پر ممکنہ طور پر سمجھا، آپ آسانی سے جو بھی ٹوکن زیادہ سے زیادہ جی کا انتخاب کر سکتے ہیں۔ انتخاب کسی ایسے شخص کے لیے یکساں طور پر بے ترتیب نظر آئے گا جو کلید کو نہیں جانتا تھا، لیکن جو شخص کلید کو جانتا ہے وہ بعد میں تمام n-گراموں کا مجموعہ کر سکتا ہے اور دیکھ سکتا ہے کہ یہ غیر معمولی طور پر بڑا ہے۔

واٹر مارکنگ ایک رازداری کا پہلا حل ہے۔

میں نے سوشل میڈیا پر بحثیں دیکھی ہیں جہاں کچھ لوگوں نے مشورہ دیا کہ اوپن اے آئی اپنے پیدا کردہ ہر آؤٹ پٹ کا ریکارڈ رکھ سکتا ہے اور اسے پتہ لگانے کے لیے استعمال کر سکتا ہے۔

سکاٹ ایرونسن نے تصدیق کی کہ OpenAI ایسا کر سکتا ہے لیکن ایسا کرنے سے رازداری کا مسئلہ پیدا ہوتا ہے۔ ممکنہ استثناء قانون نافذ کرنے والی صورت حال کے لیے ہے، جس کی اس نے وضاحت نہیں کی۔

ChatGPT یا GPT واٹر مارکنگ کا پتہ لگانے کا طریقہ

کچھ دلچسپ جو ابھی تک اچھی طرح سے معلوم نہیں ہے وہ یہ ہے کہ سکاٹ ایرونسن نے نوٹ کیا کہ واٹر مارکنگ کو شکست دینے کا ایک طریقہ ہے۔

انہوں نے یہ نہیں کہا کہ واٹر مارکنگ کو شکست دینا ممکن ہے ، انہوں نے کہا کہ اسے شکست دی جا سکتی ہے ۔

"اب، اس سب کو کافی کوشش سے شکست دی جا سکتی ہے۔
مثال کے طور پر، اگر آپ نے GPT کے آؤٹ پٹ کو بیان کرنے کے لیے کوئی اور AI استعمال کیا ہے — ٹھیک ہے، ہم اس کا پتہ لگانے کے قابل نہیں ہوں گے۔

ایسا لگتا ہے کہ واٹر مارکنگ کو شکست دی جا سکتی ہے، کم از کم نومبر میں جب اوپر بیان کیے گئے تھے۔

اس بات کا کوئی اشارہ نہیں ہے کہ واٹر مارکنگ فی الحال استعمال میں ہے۔ لیکن جب یہ استعمال میں آتا ہے، تو یہ معلوم نہیں ہو سکتا ہے کہ آیا یہ خامی بند تھی۔

حوالہ

سکاٹ ایرونسن کی بلاگ پوسٹ یہاں پڑھیں۔

ChatGPT واٹر مارک کیسے کام کرتا ہے اور اسے کیوں شکست دی جا سکتی ہے۔