Categories
அறிவியல் தமிழ்

செயற்கை நுண்ணறிவு – எப்படி வேலை செய்கிறது?

கட்டைவிரலின் தனிச்சிறப்பு அதன் எதிர்மறைச் சிக்கல் திறன் ஆகும். இது என்னவென்றால், நம் கட்டைவிரல், மற்ற நான்கு விரல்களுடன் எதிர்திசையில் நகர்ந்து, பொருட்களை பிடிக்க முடியும். மனிதனை மனிதனாக்கும் இந்த வேறுபாடு பரிணாம வளர்ச்சியின் ஒரு முக்கிய புள்ளியாக கருதப்படுகிறது. 

ஒரு பொருளை கையில் எடுத்து பார்க்கும் திறன் வந்துவிட்டால் குனிந்து தரையோடு நடக்க வேண்டியது இல்லை. நுட்பமாக பொருட்களை பற்றி ஆராயவும், கருவிகள் உருவாக்கத்திலும், இதனாலான மூளை வளர்ச்சியிலும் கட்டை விரலின் பங்கு உண்டு. 

இது போல மனிதனை விலங்கில் இருந்து வேறுபடுத்தும் மொழியை இன்று மனிதன் உருவாக்கிய இயந்திரங்களும் கற்று விட்டன. AI எனப்படும் செயற்கை நுண்ணறிவு எப்படி உருவாக்கப்படுகிறது, இதனால் ஆன பயன்களும், பயங்களும் என்ன என்பதை இந்த கட்டுரையில் பார்க்கலாம். 

AI என்று பொதுவாக கூறப்படுபவை GPT (Generative Pre-trained Transformer) எனப்படும் பெரிய மொழி மாதிரிகள் (Large Language Models, LLM). ஒரு பொருளின் தன்மைகளை வெளிப்படுத்தும் பொம்மையை போல், மொழியின் தன்மையை வெளிப்படுத்தும் மாதிரி.  

மொழியின் மாதிரியை எப்படி உருவாக்குவது? இன்டர்நெட்டில் சேகரித்த மனித பேச்சுக்களை கொண்டு உருவானது. இதில் லட்சகணக்கான blog போஸ்ட்களும், forum எனப்படும் இணைய மன்றங்களின் பேச்சுக்களும் அடக்கம். புத்தகங்கள், கையேடுகள், உரைகள் எல்லாம் அடங்கியிருக்கலாம். இதையெல்லாம் மிக்ஸியில் அரைத்தால் கிடைக்கும் சட்னி, போன்றது பெரிய மொழி மாதிரிகள். (Large Language Models, LLM). 

சொற்களை மனப்பாடம் செய்வது மட்டுமல்லாது ஒவ்வொரு சொல்லுக்கும் மற்ற சொர்க்களுக்கும் உள்ள உறவு பதிவுசெய்து ஆராயப்படுகிறது. 

ஒரு சொற்றொடரை பதிவு செய்யும் பொழுது அதற்கு அடுத்து என்ன வரலாம் என்று மாதிரி கணிக்கும். பதிலான அந்த சொல்லையும் சேர்த்து, மறுபடியும் சொற்றொடரை ஆராய்ந்து, அடுத்து என்ன சொல் வரலாம் என்று கணிக்கும். இவ்வாறு பல்லாயிரம் முறை கணிப்பு செய்து நமக்கு ஒரு பதில் அளிக்கும். நாம் தொடர்ந்து கேள்வி கேட்டால், மேலே உள்ள அத்தனையும் திரும்ப நடைபெறும். 

அது சரியாகத்தான் சொல்லும் என்று என்ன நிச்சயம்? இது போன்ற உருவாக்க (generative) மாதிரிகள் கொடுக்கும் பதில்கள் சரியா தவறா என்று அதற்கு சொல்லிக்கொடுப்பார்கள் (pretrained). 

நாம் உள்ளே செலுத்தும் ஒவ்வொரு சொல்லும், அதன் இடம், பொருள், ஏவல், அறிந்து, பல்லாயிரம் நுனுக்கங்களாக பிரிக்கப்பட்டு அட்டவணையில் சேமிக்கப்படும். 1000 x 1000 அட்டவணை என்று வைத்துக்கொள்வோம் (வரிசை x நெடுவரிசை), அடுத்த சொல்லுக்கும் ஒரு அட்டவணை இருக்கும் 1000 x 1000. இவை இரண்டும் சேர்ந்தால் ஒரு அட்டவணை 1000×1000. இந்த இரண்டும் எப்படி கலக்க வேண்டும் என்று குறிக்க சில அட்டவணையும் உண்டு. 

அட்டவனைகள் இரண்டு பரிணாமங்களில் மட்டும் அல்ல, பல்லாயிரம் பரிணாமங்கள் (dimensions) கொண்ட tensor களாகவும் இருக்கலாம். அதாவது 1000×1000 அடுகுக்கு செங்குத்தாக சில 1000 பரிணாமங்கள் இருக்கலாம். 3க்கு மேல் செங்குத்தான பரிணாமங்களை நம்மால் கற்பனை செய்ய முடியாது. ஆனால் கம்ப்யூட்டருக்கு எல்லாம் 0 வும் 1 உம் தானே. 

இப்படி மாற்றி மாற்றி 1000 முறை ஒட்டி கடைசியாக கிடைக்கும் அட்டவணையில் உள்ள முதல் வரிசை, முதல் நெடுவரிசை இணையும் சொல், பதிலின் முதல் சொல். 

கேள்வியான சொற்றொடருடன் இந்த முதல் சொல்லும் இணைத்து மறுபடியும் உள்ளே போகும். இப்படியே அடுத்த அடுத்த சொற்களையும் அவைகளின் தொடர்ச்சியையும் கணிக்கும். இந்த அட்டவணை மாற்றங்களை செய்யும் நுண்ணறிவு கருவிக்கு பெயர் transformer. 

இந்த கருவிகளின் உள் அமைப்பு யாருக்கும் தெரியாது. அதாவது GPT இயந்திரங்கள் கருப்பு பெட்டி (black box) எனப்படுகின்றன. வெளியில் இருந்து அறிவுரை கொடுக்க மட்டுமே முடியும். அது சரியாக ஓடவில்லை என்றால் ஏன் என்று சொல்ல முடியாது. ரிப்பேர் செய்ய முடியாது.

சொல் அச்சுக்கு எப்படியோ, audio மற்றும் வீடியோவுக்கும் டிரான்ஸ்பார்மர்கள் உண்டு. பல குரல் பதிவுகளை கம்ப்யூட்டரில் பதிவு செய்வது மூலம் நமக்கு வேண்டிய சொற்கள் அந்த குரலில் வடிவமைத்துக்கொள்ளலாம். கதையை கேட்டு, அதற்கு பின்னணி இசை வடிவமைக்கவும் இன்று மாதிரிகள் இருக்கின்றன.

முகமாற்றம் என்னும் Deepfakes, Generative Adversarial Networks (GAN) என்னும் தொழில்நுட்பத்தால் செய்யப்படுகிறது. அதாவது உருவாக்கும் எதிர்மறையான வலைப்பாடு. 

ஜெனரேட்டர் ஒரு தரவுத்தொகுப்பில் இருந்து கற்றுக்கொள்வதன் மூலம் போலியான படங்களை (அல்லது வீடியோக்களை) உருவாக்குகிறது, அதே நேரத்தில், எதிரி (adversarial) போலிகளைக் கண்டறிய முயற்சிக்கும்.

இந்த எதிர்விளைவு செயல்முறை யதார்த்தமான வீடியோக்களை உருவாக்கும் ஜெனரேட்டரின் திறனை மேம்படுத்துகிறது. இதன் மூலம் போதிய பதிவேடுகள் இருந்தால் ஒருவரின் குரலையோ, உருவத்தையோ போலியாக உருவாக்க முடியும். 

“Generative Transformer” என்ற தலைப்பில் chatGPT உருவாக்கிய படம்

செயற்கை நுண்ணறிவின் விளைவுகள், நன்மைகள், கேடுகள் போன்றவற்றை அடுத்த கட்டுரையில் பார்ப்போம். அதுவரையில், நினைவுகள்.

தொடர்ந்து வாசிக்க, சென்ற மாத பதிவுகளுக்கான முன்னோட்டம்,  நினைவுகள் பதிப்பாசிரியர்குறிப்பு – 02

புதிய பதிவுகள் பற்றிய அறிவிப்புகள் பெற நினைவுகள் whatsapp சேனல்

நினைவுகள்

நினைவுகளை வார இதழாக மின்னஞ்சலில் பெற தங்கள் முகவரியை இங்கே பதிவு செய்யலாம்

We don’t spam! Read our privacy policy for more info.