சமீப காலமாக செயற்கை நுண்ணறவின் வளர்ச்சி எல்லா துறையிலும் ஒருவித பீதியை ஏற்படுத்தி வருகிறது. இதனால் பலரது வேலைவாய்ப்புகள் பறிபோகும் வாய்ப்புள்ளதாக அஞ்சப்படுகிறது.
இந்நிலையில் மைக்ரோசாஃப்ட் நிறுவனம் சமீபத்தில் செயற்கை நுண்ணறிவு (AI) செயலி ஒன்றை அறிமுகபடுத்தியுள்ளது. இது மனித முகங்களை வாயசைத்து பேசுவது போன்ற மிகை யதாரத்த வீடியோக்களை உருவாக்கி ஆச்சர்யப்படுத்துகிறது.
VASA-1 என்ற பெயரில் அழைக்கப்படும் இந்த செயலி, செயற்கை நுண்ணறிவை பயன்படுத்தி புகைப்படத்தில் உள்ள மனித முகங்களை பேசக்கூடிய, பாடக்கூடிய வீடியோக்களாக மாற்றுகிறது.
இந்த வீடியோக்கள் ஆடியோவிற்கு ஏற்ற உதட்டசைவுகளையும் முக வெளிப்பாடுகளையும் தலை அசைவுகளையும் கொண்டிருப்பதால் பார்ப்பதற்கு அப்படியே தத்ரூபமாக இருக்கின்றன.
சமீபத்தில் இந்த செயலியின் திறன்களை வெளிப்படுத்தும் வீடியோ சோசியல் மீடியாவில் பெரும் வைரலானது. செயற்கை நுண்ணறிவு மூலம் உருவான அந்த வீடியோவில் லியோனார்டோ டாவின்ஸி வரைந்த உலகப் புகழ்பெற்ற மோனலிசா ஓவியம் அன்னி ஹேத்வேயின் Paparazzi பாடலுக்கு வாயசைத்து பாடுகிறது.
இந்த வீடியோவை பார்த்த பலரும் இது எப்படி சாத்தியம் என ஆச்சர்யமடைகின்றனர்.
புகைப்படங்களில் இருக்கும் முகங்களை VAS மூலம் நிஜ மனிதர்கள் போல் பேசும் கட்டமைப்பை VASA கொண்டுள்ளதாக மைக்ரோசாஃப்ட் நிறுவனம் கூறுகிறது.
VASA-1 செயலி ஆடியோவோடு நன்றாக ஒத்திசையும் உதடு அசைவுகளை உற்பத்தி செய்வதோடு வெவ்வேறு வகையான முக பாவனைகளையும் இயற்கையான தலை அசைவுகளையும் உருவாக்குகிறது.
Microsoft just dropped VASA-1.
This AI can make single image sing and talk from audio reference expressively. Similar to EMO from Alibaba
10 wild examples:
1. Mona Lisa rapping Paparazzi pic.twitter.com/LSGF3mMVnD
— Min Choi (@minchoi) April 18, 2024