Python استعمال کرتے ہوئے AI آواز اسسٹنٹ بنانے کا طریقہ

Build-an-AI-Voice-Assistant.png

کیا آپ اپنی خود کی AI آواز اسسٹنٹ بنانے میں دلچسپی رکھتے ہیں؟ اس ٹیوٹوریل میں، ہم آپ کو بتائیں گے کہ پائتھن استعمال کرتے ہوئے OpenAI ChatGPT API کا استعمال کر کے AI آواز اسسٹنٹ کیسے بنایا جاتا ہے. ہم ہر لائن کو چلانے کے طریقے پر چلتے ہیں کوڈ کے لئے، یوں حتی کہ آپ OpenAI سے واقف نہیں ہیں، تو آپ لحاظ کر سکوں گے۔

ماحول کی تشکیل دینا

کوڈ میں ڈوبنے سے پہلے ہمیں ضروری اوزار کے ساتھ اپنا ماحول تیار کرنا ہوگا۔ پہلے، چارج پی اے، اوپن اے آئی وسپر اور کو کیو ای ٹی ٹی ایس ٹو اسپیچ جیسے کچھ کتاب خانوں کو ہم انسٹال کریں گے۔ ہمیں اپنی ایپلیکیشن کے انٹرفیس کو بنانے میں مدد کرنے والے گراڈیو میں بھی سب کچھ بنائیں گے۔

اگلا، ہم ٹیکسٹ سے بولنے والے ماڈل، بولنے والے سے ٹیکسٹ ماڈل اور ہماری اوپن ای آئی کی تشکیل کریں گے۔ ہم آوازی نظام تشریف لائیں گے برائے شناخت آواز اور جی پی ٹی-3 کمپلیشن کے لئے اوپن ای آئی ای پی ای استفادہ کریں گے۔

لائبریریوں کی انسٹال کرنے

شروع کرنے کے لئے ہمیں ضروری لائبریریز انسٹال کرنی ہوگی۔ ہم ٹی ٹی ایس کا استعمال کر رہے ہیں، یہ ایک متن سے بولنے والے لائبریری ہے، اس کے علاوہ ہم نمپائی، اوپن ای ای وسپر، گریڈیو اور اوپن ای ای استعمال کر رہے ہیں۔

فرق

!pip ٹی اے ایسٹ ال نصب کریں
!pip نمپی==1.21 نصب کریں
!pip اوپن ای ای==0.10.2 نصب کریں
!pip گریڈیو نصب کریں
!pip اوپن ای ای_وسپر نصب کریں

کتابخانوں کو درآمد کرنا

یک بار جب ہم نسبت پندازی کی کتابخانیں انسٹال کرلیں تو ہم تمام ضروری ماڈلز کو امپورٹ کریں گے۔ ہم وسپیریئس، وسپیر، گریڈیو، اوپن اے آئی، اور ٹی ٹی ایس کو امپورٹ کریں گے۔ یہ کتابخانیاں ہمیں ہمارے ای آئی وائس اسسٹنٹ کے مختلف حصوں کو تشکیل دینے میں مدد کریں گی۔

پائتھن

import whisperous.whisper  تنسیم میں وھسپرطریقہ کو تنسیم میں وھسپر
import gradio as gr تنسیم میں گریڈیو کو تنسیم میں گریڈیو
import openai.api as api   تنسیم میں اوپن ایپ آئیپی کو تنسیم میں اوپن ایپی
import TTS تنسیم میں ٹی ٹی ایس کو تنسیم میں ٹی ٹی ایس 

ٹیکسٹ سے بولنے والا ماڈل کو تشکیل دینا

اب ، ہم ٹیکسٹ سے بولنے والا نمونہ تشکیل دیں گے۔ ہم نمونے بنانے کے لئے ٹی ٹی ایس لائبریری استعمال کریں گے۔ یہ ہمارے AI آوازی سہایت دینے والے معاون کو ٹیکسٹ کو بولنے میں تبدیل کرنے کی اجازت دیتا ہے۔

میک فائل

# ٹی ٹی ایس ماڈل ترتیب دیں
ٹی ٹی ایس = ٹی ٹی ایس.ٹی ٹی ایس()
ٹی ٹی ایس.ماڈل_لوڈ(اینجن="ٹی ٹی ایس", زبان="انگریزی")

سپیچ سے ٹیکسٹ ماڈل کی تشکیل کرنا

ہمیں بھی بولنے سے متن تک کی ماڈل کو تشکیل دینے کی ضرورت ہوگی۔ ہم اس ماڈل کو بنانے کے لئے اوپن اے آئی وسپر لائبریری استعمال کریں گے۔ یہ ہمارے ای آئی معاون آواز کو مکالمے کو متن میں تبدیل کرنے کی اجازت دے گا۔

Csharp

# وسپر تشکیل دیں
wh = whisper.Whisper()
wh.init(whisper.DeviceType.GPU, "ur-PK")

آپنی OpenAI API کلید ترتیب دینا

آخر کار ہم اپنی OpenAI API کی سیٹنگ کریں گے۔ یہ ہمیں GPT-3 کو زبان کی تکمیل کے لئے استعمال کرنے کی اجازت دے گا۔

میک فائل

# اوپن اے آئی پی کے کنیکشن کی تشکیل کریں
اے پی آئی_ذریعہ_اصول = "آپکی_ای_پی_آئی کی"
api.api_key = api_key

ایے آئی وائس اسسٹنٹ کا تعمیر کرنا

اب جب ہمارا ماحول تیار ہو گیا ہے، ہمیں اپنے AI آوازی معاون کو تعمیر کرنا شروع کرنے کے لئے تیار ہوں ہیں. ہم اپنے درخواست کو جواب دینے والے AI آوازی معاون سے سوالات پوچھنے اور جوابات حاصل کرنے کے لئے گراس دیو کا استعمال کریں گے.

پائتھن

ترجمہ کا ردِعمل دریافت کریں (متن)
     
     # متن کو ٹیکسٹ سے تحویل دیں
    audio = tts.get_tts(text, "خواتین")

    # آواز کو ٹیکسٹ میں تحویل دیں
    text = wh.transcribe(audio, "en-US")

    # GPT-3 استعمال کرتے ہوئے ردِعمل تیار کریں
    prompt = "نیچے دیئے گئے سوال کا جواب دیں: " + text
    response = api.Completion.create(engine="text-davinci-002", prompt=prompt, max_tokens=1000)

    # ردِعمل کو ٹیکسٹ میں تحویل دیں
    answer = response.choices[0].text

    # متن کو آواز میں تحویل دیں
    audio = tts.get_tts(answer, "خواتین")

خلاصہ

اختتامی طور پر، کھولیں ای آئی ڈی چیٹ جی پی ٹی ای پی اور پائTHON کا استعمال کرکے ایک اہم تعاون ہے جو ای ای تکنالوجی کے ممکنات کا تحقیق کرنے کا ایک عظیم طریقہ ہے۔ دستیاب کتب خانے اور اوزار استعمال کرتے ہوئے تشکیل کرنے اور استعمال کرنے میں آسان ہے، ایک ای آئی آوازی معاونت خلق کریں جو صارف کی سوالوں کا جواب دے سکتی ہے اور مختلف کام کرسکتی ہے۔

آپ ٹیوٹوریل میں ایک ماحول تشکیل دینے کی عملیات سے گزر گئے جس کے تحت ہم نے ضروری کتابخانہ اور نمونوں کی تنصیب کی. پھر ہم نے ٹیکسٹ سے آواز بنانے اور آواز سے ٹیکسٹ بنانے کے نمونے تیار کیے اور OpenAI API کا استعمال شروع کیا. آخر کار, ہم نے Gradio کا استعمال کرتے ہوئے ہمارے AI آوازی معاون کے لئے صارف وسيلہ کی تشکیل کی.

اس ٹیوٹوریل ایک عمدہ شروعاتی نقطہ ہے، مگر آپ کے AI وائس اسسٹنٹ کو بہت سارے اور ترقی کرنے اور ترتیب دینے کے دوسرے طریقے بھی موجود ہیں۔ مثلاً آپ مزید کامیابیوں کو شامل کر سکتے ہیں مثلاً ای میلز بھیجنے کی صلاحیت, میوزک چلانے کی صلاحیت یا آپ بھی ہوم ڈیوائسز کو کنٹرول کرنے کی صلاحیت شامل کر سکتے ہیں۔ علاوہ ازیں, آپ خاص ڈومینز پر آپ کے AI ماڈل کو ٹرین کر سکتے ہیں یا لائن آکھر کرکے اس کی درستگی کو بہتر بنا سکتے ہیں۔

عموماً، ایک AI آواز اسسٹنٹ تشکیل دینا ایک مزیدار اور تعریف کی بات ہے جو صارفین کو کافی قدر فائدہ فراہم کر سکتا ہے۔ OpenAI ChatGPT API اور پائتھن کی طاقت کے ساتھ، ممکنات بے حد ہیں۔

اکثر پوچھے گئے سوالات

یقینی طور پر، یہاں چند مفید سوالات کے جوابات ہیں جو پایتھن میں AI آواز سہاٹنٹ بنانے کے لئے آپنیسافٹ ویئر ChatGPT API استعمال کرتے ہوئے مددگار ہونگے:

سوال 1: ایک AI آواز اسسٹنٹ کیا ہوتا ہے؟

A1: ایک AI آوازی معاون ہے جو عالمی ہوشیاری اور طبیعی زبان کے استعمال کرتے ہوئے صارفین کے ساتھ بات چیت کرنے کے لئے مصنوعی ذہانت کا استعمال کرتی ہے۔

سوال 2: پیتھن میں ایک AI آوازی معاون کو بنانے کے لئے کون سی لائبریریاں درکار ہوتی ہیں، جو اوپن اے آئی چیٹ جی پی ٹی آئی استعمال کرتی ہیں؟

A2: آپ کو Chargpt APA ، OpenAI Whisper ، CoQE TTS ٹیکسٹ سے بولنے کی تصویریت ، Gradio اور Numpy جیسی لائبریریاں انسٹال کرنی ہوں گی۔

سوال 3: Gradio کیا ہے اور ایک AI آواز اسسٹنٹ کو بنانے میں اس کا استعمال کیسے کیا جاتا ہے؟

A3: Gradio ایک آسان استعمال واجبی ہے جو آپ کے AI وائس اسسٹنٹ کی صارف واجہ تعمیر کرنے کے لئے استعمال کیا جاسکتا ہے۔ یہ صارفوں کو سوال کرنے اور AI وائس اسسٹنٹ سے جوابات حاصل کرنے کی اجازت دیتا ہے۔

پ4: ایک AI آوازی معاونت کے لئے ٹیکسٹ سے آواز کا نمونہ کیسے تشکیل دیتے ہیں؟

A4: تم اپنی AI آوازی اسسٹنٹ کے لئے ٹی ٹی ایس کتابخانے کا استعمال کرسکتے ہیں۔ پائتھن میں ٹیکسٹ سے بولنے کا نمونہ تیار کرنے کے لئے۔

سوال 5: ایک AI آوازی وساطت کے لئے تقریر سے متن تک ماڈل کو کیسے ترتیب دیتے ہیں؟

A5: آپ اپنے AI آوازی معاون کے لئے سپیچ-ٹو-ٹیکسٹ ماڈل تشکیل دینے کے لئے پائتھن میں OpenAI Whisper کتابخانہ استعمال کرسکتے ہیں۔

سوال 6: آپ ایک AI آوازی معاون کے لئے OpenAI API کی کیسے تشکیل دیتے ہیں؟

A6: آپ کو OpenAI API کے لئے ایک کلید حاصل کرنا ہوگا اور اسے آپ کے پائتھن ماحول میں ترتیب دینا ہوگا تاکہ زبان کامل کرنے کے لئے GPT-3 استعمال کیا جا سکے۔

Q7: کیا آپ AI آوازی معاون کو خاص کام کے لئے تبدیل کرسکتے ہیں؟

A7: جی ہاں، آپ AI آوازی معاون کو مہارتیں شامل کرسکتے ہیں تاکہ وہ کام میں ای میل بھیجنا، موسیقی چلانا یا سمارٹ ہوم ڈیوائسز کو کنٹرول کرنا جیسے کام کرسکے۔

Q8: کیا آپ AI آوازی معاون کی صحت کو بہتر بنا سکتے ہیں؟

A8: جی ہاں ، آپ AI ماڈل کو مخصوص ڈومینز پر میں فائن ٹیون کرسکتے ہیں یا اس کی درستگی کو بہتر کرنے کیلئے دوسرے تکنیک استعمال کرسکتے ہیں۔

متعلقہ مضامین

مزید دیکھیں >>

HIX.AI کے ساتھ AI کی طاقت کو غیر مقفل کریں!