கடந்த 2008ம் ஆண்டின் இறுதியில் உருவாக்கப்பட்ட டேட்டா சயின்ஸ் என்ற
பதம், இன்றைய நிலையில் பெரிய வரவேற்பை பெற்றுள்ளது. போர்ப்ஸ் மற்றும்
சி.என்.என்., போன்ற முக்கிய சர்வேக்கள், டேட்டா சயின்டிஸ்ட் பணியை, இன்றைய
நிலையில், மிகுந்த வளர்ச்சியடைந்த பணிகளுள் ஒன்றாக மதிப்பிட்டுள்ளன.
கடந்தாண்டில் நடந்த அமெரிக்க
அதிபர் தேர்தலில், ஒபாமா வெற்றி பெற்றதற்கும் கூட, டேட்டா சயின்டிஸ்டுகள்
அடங்கிய குழுவின் பணி மகத்தானது என்று கூறப்படுகிறது.
தகவல் என்ற சக்தி
உலகெங்கிலுமுள்ள நிறுவனங்கள், கடந்த சில,பல ஆண்டுகளின் தகவல்களை திரட்டி
வைத்திருப்பதை பெரிய பொக்கிஷமாக கருதுகின்றன. ஏனெனில், அவற்றை அடிப்படையாக
வைத்து, பல முக்கிய முடிவுகள் எடுக்கப்பட்டு, போட்டி உலகில்
அந்நிறுவனங்கள் நிலைத்து நிற்க ஏதுவாக அமைகிறது. தேவையான டேட்டாக்களை
எடுத்து சேகரிக்கும் பணிக்கு அதீத தனித்திறமை தேவைப்படுகிறது. அத்திறமையைப்
பெற்றவர்கள்தான் டேட்டா சயின்டிஸ்ட்.
டேட்டாக்களின் வகைகள்
Facebook, LinkedIn மற்றும் Twitter போன்ற நிறுவனங்கள், பெரியளவிலான
டேட்டா செயல்பாட்டில் முக்கியத்துவம் வகிக்கின்றன. நாம் ஒரு நாளைக்கு, 2.5
quintillion வரையிலான டேட்டா பைட்ஸ்களை உருவாக்குகிறோம் என்று ஒரு
புள்ளிவிபரம் தெரிவிக்கிறது. இவற்றில் கட்டமைக்கப்பட்ட மற்றும்
கட்டமைக்கப்படாத டேட்டாக்கள் என்ற இரு வகைகள் உண்டு. சர்வேக்கள் மற்றும்
feedback forms போன்றவை கட்டமைக்கப்பட்ட டேட்டா வகைகளிலும், வீடியோக்கள்,
பிளாக்குகள் மற்றும் posts போன்றவை, கட்டமைக்கப்படாத டேட்டா வகைகளிலும்
சேரும். இத்தகைய கணக்கிலடங்காத, பல வகைகளிலான டேட்டாக்களை தேவைக்கேற்ற
வகையில் பிரித்தெடுத்து பயன்பாட்டிற்கு கொண்டு வருவதே டேட்டா
சயின்டிஸ்டுகளின் முக்கியப் பணி.
முடிவுகளைத் தெரிவித்தல்
தாங்கள் சேகரித்த எண்ணற்ற டேட்டாக்களிலிருந்து, தேவையான விஷயங்களை
தேவையான முறையில் எடுத்து, எழுத்து வடிவில் அல்லது காட்சி வடிவில்,
சம்பந்தப்பட்டவர்களுக்கு இந்த டேட்டா சயின்டிஸ்டுகள் வழங்குகிறார்கள். இந்த
வகையில், ப்ரோகிராமர்களாக, அனலிஸ்டுகளாக, புள்ளியியல் நிபுணர்களாக,
பொறியாளராக, ஆர்டிஸ்டாக மற்றும் கதை சொல்பவராக ஒரு டேட்டா சயின்டிஸ்ட்,
பல்வேறு பரிமாணங்களில் பரிணமிக்கிறார்.
Moneyball என்ற திரைப்படத்தை நம்மில் சிலர் பார்த்திருக்கலாம் அல்லது
கேள்விப்பட்டிருக்கலாம். இது நிஜக்கதையின் அடிப்படையில் எடுக்கப்பட்ட ஒரு
படம். இப்படத்தில், யேல் பல்கலையில் படித்த ஒரு பொருளாதார பட்டதாரி,
பேஸ்பால் திறனைத் தேர்ந்தெடுக்க, எண்களைப் பயன்படுத்துவார். ஆனால் இந்த
செயல்முறையானது, விரும்பிய முடிவுகளையே தர தொடங்கிய பின்பு, அது
நிராகரிக்கப்பட்டது. இதன்மூலம் நாம் அறிந்துகொள்வது என்னவெனில், ஒரு டேட்டா
சயின்டிஸ்ட்டின் திறமை, பல்வேறு துறைகளிலும் ஜொலிக்கக் கூடியது என்பதை
அறிந்து கொள்ளலாம்.
ஒட்டுமொத்த திறன்கள்
புள்ளியியல் என்பது டேட்டா சயின்ஸ் செயல்பாட்டின் இலக்கணம்(Grammar)
போன்றது மற்றும் அதுதான் அதற்கான அடிப்படைத் திறன். பெரியளவிலான டேட்டா
அமைப்புகளுக்கு, புள்ளியியல் மாதிரிகளை கட்டமைத்தல் மற்றும் புள்ளியியல்
பகுப்பாய்வை பயன்படுத்துதல் ஆகிய செயல்பாடுகளில், இத்துறை சார்ந்த ஒருவர்
நிபுணத்துவம் பெறுவது அவசியம். மேலும், code எழுதுவதிலும் வல்லமை பெறுதல்
அவசியம். ஆனால் இந்த code எழுதும் செயல்முறை, தொழில்நுட்ப வளர்ச்சியினால்
இனிவரும் காலங்களில் தேவைப்படாது என்று கூறப்படுகிறது.
இவைத்தவிர, டேட்டா சயின்டிஸ்டுகள், சிறந்த கம்ப்யூடேஷனல் மற்றும் எண்
திறன்களைக் கொண்டிருக்க வேண்டும். தற்போதைய வணிக சூழலுடன் பொருந்திய
அறிவுடன், சொற்கள் மற்றும் காட்சி வகையிலான, வலுவான தகவல் தொடர்பு திறனைப்
பெற்றிருக்க வேண்டும்.
உயர்ந்தபட்ச தகுதிகள்
அதிகபட்ச ஆர்வம், பிரச்சினைக்கு உள்ளே சென்று ஆராயும் மனப்பாங்கு,
முக்கிய கேள்விகளுக்கு சரியான பதில்களை கண்டடைதல் போன்றவை, இத்துறை
நிபுணர்களுக்கான சிறந்த தகுதிகள். இதனால்தான், டேட்டா நிபுணர்கள், டேட்டா
சயின்டிஸ்டுகள் என்று அழைக்கப்படுகிறார்கள்.ஒரு செயல்பாட்டு இயற்பியல்
அறிஞர், சாதனங்களை வடிவமைக்க வேண்டும், தரவை சேகரிக்க வேண்டும், பல்வேறான
சோதனை முயற்சிகளை மேற்கொள்ள வேண்டும் மற்றும் முடிவுகளைத் தெரிவிக்க
வேண்டும். எனவே, ஒரு டேட்டா சயின்டிஸ்ட் என்பவரை, இயற்பியல் வல்லுநர்,
கணிப்பொறி அறிவியல், கணிதம் அல்லது பொருளாதார நிபுணர் ஆகியோருக்கு சமமாக
ஒப்பிடலாம்.
டேட்டா சயின்ஸ் துறையில் நுழைதல்
வலுவான டேட்டா மற்றும் கம்ப்யூடேஷனல் அம்சங்களைக் கொண்ட எந்த துறையை
சார்ந்தவரும், டேட்டா சயின்டிஸ்ட் என்ற நிலைக்கு வர முடியும். மானுடவியல்
மற்றும் தொல்லியல் துறையை சார்ந்த ஆராய்ச்சி நிபுணர்கள்கூட, தங்களின்
அதிகளவு தரவு பயன்பாட்டு திறனால், டேட்டா சயின்டிஸ்ட் என்ற நிலைக்கு
உயர்ந்துள்ளனர். இயற்பியல் அறிஞர், ப்ரோகிராமர், கணிதவியல் நிபுணர், கலை
நிபுணர் உள்ளிட்ட பல தகுதி நிலைகளில் ஒரு டேட்டா சயின்டிஸ்ட் பொருந்தி
வந்தாலும், தொழில்முனையும் பண்பானது அவருக்கு இருக்க வேண்டிய முக்கியமான
தகுதிகளில் ஒன்றாகும்.
துறைக்குள் நுழைதல்
ஒருவர் எப்படி டேட்டா சயின்டிஸ்ட் ஆகலாம்? டேட்டா சயின்டிஸ்ட் என்ற பணி
நிலைக்கான ஆள் தேவை எண்ணிக்கைக்கும், படித்து வெளிவரும் பட்டதாரிகளின்
எண்ணிக்கைக்கும் பெருத்த இடைவெளி உள்ளது. இந்தியாவைப் பொறுத்தவரை, ஒரு சில
கல்வி நிறுவனங்கள்தான், தகுதியான முறையில் இப்படிப்பை வழங்குகின்றன.
அதேசமயம், எம்.பி.ஏ., படித்த ஒருவர், தனது தொழில்நுட்பத் திறனை
வளர்த்துக்கொண்டு, புள்ளியியல் மென்பொருள் ப்ரோகிராமில் சான்றிதழ் பெறலாம்.
நீங்கள் ஐ.டி., துறையில் இருந்தாலும், எம்.பி.ஏ., படித்து இத்துறைக்குள்
நுழையலாம். ஏனெனில், வணிகத்தைப் புரிந்துகொள்ளல் மற்றும் அதை வழங்குதல்
போன்ற திறன்கள் அவசியமானவை. அதேசமயம், புள்ளியியல் திறன் அமைப்பை
வளர்த்துக் கொள்ளுதல் என்பது சற்று சிக்கலானது. இந்தியாவில் ஒரு சில கல்வி
நிறுவனங்களே, SAS மற்றும் SPSS போன்ற புள்ளியியல் tool -களில் முறையான
பயிற்சிகளை வழங்குவதோடு, பகுப்பாய்வு மற்றும் புள்ளியியல் மாடலிங்
தொழில்நுட்பங்களில் அடிப்படைத் திறனையும் வழங்குகின்றன.
நீங்களும் ஒரு டேட்டா சயின்டிஸ்ட்
Kaggle எனப்படும், உலகின் மிகப்பெரிய டேட்டா சயின்டிஸ்ட் அமைப்பு,
புள்ளியியல் மற்றும் அனலிடிகல் அவுட்சோர்சிங் செயல்பாட்டிற்கு தேவையான
புத்தாக்க தீர்வுகளை வழங்குகிறது. இந்த அமைப்பானது, டேட்டா சயின்ஸ் பணியில்
ஈடுபடும் ஒவ்வொருவரும் நல்ல அனுபவம் பெற்று, live data -வுடன்
பணிபுரிந்து, சிறிய மற்றும் பெரியளவிலான பணப் பரிசுகளையும் பெறும் வகையில்
பல்வேறான அம்சங்களைக் கொண்ட ஒரு விளையாட்டாக அத்துறையை மாற்றும்
நடவடிக்கைகளில் ஈடுபட்டுள்ளது.
இந்த அமைப்பின் பணிகளிலேயே முக்கியமானது, இத்துறையில் புதிதாக நுழைவோர்,
தங்களின் திறனை வெளிப்படுத்தும் வகையில் ஒரு அடிப்படை ஆதாரமாக
இருப்பதுதான். இந்த அமைப்பை பற்றி மேலும் தகவல் அறிய www.kaggle.com.
டேட்டா சயின்ஸ் என்பதன் எதிர்காலம்
உருவாக்கப்படும் டேட்டாக்களின் எண்ணிக்கை அதிகரிக்கப்படவுள்ளது. இத்துறை
நிபுணர்கள், எதிர்காலத்தில், பல்வேறான நிறுவனங்களில் பணி வாய்ப்புகளைப்
பெறுவார்கள். இத்துறை நிபுணர்களுக்கான தேவைகள், நாளுக்கு நாள் அதிகரித்து
வருகின்றன. எனவே, எதிர்காலம் பிரமாதமானதாக இருக்கும் என்பதில்
சந்தேகமேயில்லை.
No comments:
Post a Comment