1.4 தரவுச் சேமிப்பும் தகவல் மீட்பும் (Data Storage and Information Retrieval)

தரவுகள் அதிகமாகக் கையாளக்கூடிய அலுவலகங்களில் தானியக்கத் தேவைகள் அதிக முக்கியத்துவம் பெறுகின்றன. பல்லாயிரக் கணக்கானோர் பணிபுரியும் நிறுவனங்களும் பல இலட்சம் வாடிக்கையாளர்களைக் கொண்ட நிறுவனங்களும் உள்ளன. இந்த நிறுவனங்கள், பணியாளர்களைப் பற்றிய விவரங்களையும், வாடிக்கையாளர்களின் தகவல்களையும் எப்படி எங்கே சேமித்து வைத்துக் கையாள்வது? ஒருவரைப் பற்றிய தகவலைப் புதுப்பிக்க வேண்டியிருப்பின் அவருடைய ஏட்டைத் (Record) தேடியெடுத்துத் தகவலை மாற்றி எழுதுவது எப்படி? பல இலட்சம் வாடிக்கையாளர்களில் ஆண்கள் எத்தனை பேர், பெண்கள் எத்தனை பேர், முப்பது வயதுக்கு உட்பட்டோர் யார் யார், ஐம்பது வயதுக்கு மேற்பட்டோர் யார் யார் என்றெல்லாம் அறிந்து கொள்ள வேண்டியிருந்தால் உடனடியாய் அத்தகவலைப் பெறமுடியுமா? இந்தக் கேள்விகளுக்கெல்லாம் இப்பாடப் பிரிவில் விடை காண்போம்.

1.4.1 தரவுச் சேமிப்பு (Data Storage)

தொலைபேசிச் சேவை வழங்கும் ஒரு தகவல் தொடர்பு நிறுவனத்தை எடுத்துக் கொள்ளுங்கள். செல்பேசிச் சேவை அறிமுகப்படுத்தப்பட்ட பின் பல இலட்சம் வாடிக்கையாளர்கள் தொலைபேசிச் சேவையைப் பயன்படுத்துகின்றனர். இவர்களுடைய தகவல்களைச் சேமித்து வைக்க வேண்டும். மாதந்தோறும் அவர்களுக்கு பில் அனுப்பி வைக்க வேண்டும். அவர்கள் கட்டணம் செலுத்திய தகவலைப் பதிவு செய்ய வேண்டும். ஏதேனும் ஒரு வாடிக்கையாளர் தாம் பெறும் சேவைகளில் மாற்றம் வேண்டி விண்ணப்பிக்கும்போது, அத்தகவலைத் தரவுத் தளத்தில் பதிவு செய்துகொள்ள வேண்டும். இந்த நிறுவனத்தின் வாடிக்கையாளர் விவரங்களைத் தாளேடுகளில் (Paper Records) சேமித்து வைத்துக் கையாள முடியுமா என்பதைச் சற்றே சிந்தித்துப் பாருங்கள்.

கணிப்பொறியில் ஏராளமான தகவல்களைச் சேமித்து வைக்க முடியும் என்பது அதன் சிறப்புக் கூறுகளில் ஒன்றாகும். மூன்றரை அங்குல விட்டமுள்ள ஒரு குறுவட்டில் (Compact Disc - CD) ஏறத்தாழ எழுபத்தைந்து கோடி எழுத்துகள் கொண்ட தகவலைச் சேமிக்க முடியும். டிவிடி எனப்படும் மீத்திறன் வட்டில் 450 கோடி எழுத்துகள் கொண்ட தகவலைச் சேமிக்க முடியும். கணிப்பொறியில் பொறுத்தப்பட்டுள்ள மின்காந்த நிலைவட்டில் (Hard Disc) பதினாறாயிரம் கோடி எழுத்துகள் கொண்ட தகவலைச் சேமித்து வைக்க முடியும் என்பது வியப் பூட்டும் செய்தியல்லவா?

ஆக, இன்றைய கால கட்டத்தில் ஒருபுறம் தாளேடுகளில் சேமித்து வைக்க முடியாத அளவுக்குத் தரவுகளைக் கையாள வேண்டிய தேவை இருக்கிறது. மறுபுறம் கணிப்பொறித் தொழில்நுட்பத்தில் அதற்கான தீர்வு காத்திருக்கிறது.

1.4.2 தகவல் மீட்பு (Information Retrieval)

சேமித்து வைத்துள்ள தரவுக் குவியலிலிருந்து தேவையான தகவலைத் தேவையான போது தெரிந்தெடுத்துக் கொள்வதைத் ‘தகவல் மீட்பு’ என்கிறோம். எடுத்துக் காட்டாக, பணியாளர்களின் தகவல் கோப்புகளில் அவர்களின் பெயர், முகவரி, கல்வித் தகுதி, பிறந்த தேதி, பணியில் சேர்ந்த தேதி போன்ற விவரங்களைக் குறித்து வைத்துள்ளோம். பணியில் இருப்போர் ஐம்பத்தெட்டு வயதில் ஓய்வு பெற வேண்டும். இந்த மாதம் ஓய்வு பெறப் போகின்றவர்களின் பட்டியல் தேவை. என்ன செய்வது? அனைத்துப் பணியாளர்களின் விவரங்களையும் அலசிப் பார்த்துத்தான் இத்தகவலைப் பெறமுடியும். பணியாளர்கள் பல்லாயிரம்பேர் எனில், இந்த வேலையில் பல பேர் பல நாட்கள் ஈடுபட வேண்டியிருக்கும்.

முப்பது ஆண்டுகள் பணி முடித்தவர்கள் எத்தனை பேர்? முதுநிலைப் பட்டம் பெற்ற பணியாளர்கள் யார் யார்? பெண் ஊழியர்களில் திருமணம் ஆனவர்கள் யார்? என்பது போன்ற தகவல்கள் அவ்வப்போது தேவைப்படலாம். இப்படி ஒவ்வொரு முறையும் ஒரு சிறு தகவலை மீட்டெடுக்கப் பலநூறு மனித மணி நேரங்களைச் செலவிட வேண்டியிருக்கும்.

பல இலட்சம் வாடிக்கையாளர்களைக் கொண்டுள்ள வணிக நிறுவனங்களில் இன்னும் இதைப்போலப் பலமடங்கு தேவையிருக்கும். கெடுவுக்குள் கட்டணம் செலுத்தாதவர்கள் யார் யார், சேவை கேட்டுப் புதிதாக விண்ணப்பித்தவர்கள் எத்தனை பேர், சேவை கொடுக்கப்பட்டு விட்டதா, சேவை தரும் பணி எந்த நிலையில் இருக்கிறது - என்று பலவாறு பல தகவல்களைப் பெற வேண்டியிருக்கும். உடனுக்குடன் இத்தகவல்கள் கிடைக்கவில்லை எனில் நிறுவனத்தின் அன்றாடப் பணிகள் முற்றிலுமாய் முடங்கிப் போகும்.

தாளேடுகளில் தகவலைச் சேமித்து வைத்து இப்படிப்பட்ட தேவைகளை நிறைவேற்றிக் கொள்ள முடியாது. கணிப்பொறியில் தரவுச் சேமிப்புக்கான மென்பொருளைப் பயன்படுத்துவதே இதற்கான தீர்வாக இருக்க முடியும். தரவுகளைச் சேமித்து வைத்துக் கொண்டு அவ்வப்போது அதிலிருந்து தகவலை மீட்டெடுப்பதற்கென்றே தரவுத்தள (Database) மென்பொருள்கள் உள்ளன.

தரவுத்தளம் என்பது தொடர்புடைய தகவல்களின் தொகுப்பு. இது பல்வேறு அட்டவணைகளையும் (Tables) அவற்றுக்கிடையேயான உறவுகளின் வரை யறுப்புகளையும் உள்ளடக்கியது. அட்டவணையைத் தரவுக் கோப்பு (Data File) எனலாம். அட்டவணை என்பது கிடக்கைகளையும் (Rows), நெடுக்கைகளையும் (Columns) கொண்டிருக்கும். நெடுக்கைகள் புலங்கள் (Fields) என்றும், கிடக்கைகள் ஏடுகள் (Records) என்றும் அழைக்கப்படுகின்றன.

பணியாளர் எண், பெயர், பிறந்த தேதி, படிப்புத் தகுதி, பணியில் சேர்ந்த தேதி போன்ற தரவுகளைக் கொண்ட புலங்களின் தொகுப்பு ஓர் ஏடாகும். ஓர் ஏடு பலநூறு புலங்களைக் கொண்டிருக்க முடியும். ஓர் அட்டவணையில் பல கோடி ஏடுகளைச் சேமிக்க முடியும். இந்த அட்டவணையிலிருந்து தேவையான தகவலை, வினவல் (Query) எனப்படும் ஒருவரிக் கட்டளை மூலம் உடனடி யாய்ப் பெற முடியும். பல்லாயிரம் பணியாளர்களின் ஏடுகளைக் (Records) கொண்ட ஓர் அட்டவணையிலிருந்து இந்த மாதம் ஓய்வு பெறுவோரின் பட்டி யலை அரை நொடியில் பெற முடியும்.

அலுவலகங்களில் அன்றாடப் பணிகளை அதிவிரைவில் நிறவேற்றி முடிக்கத் தரவுத்தள மென்பொருள்களைப் பயன்படுத்துவது தவிர்க்க முடியாததாகும்.

1.4.3 தகவல் தேடல் (Information Search)

தகவல் மீட்பு என்பது ஒருவகையான தகவல் தேடல்தான். தகவலைத் தேடித்தான் மீட்டெடுக்கிறோம். பல்லாயிரம் பெயர்கள் கொண்ட பட்டியலில் ‘குமரன்’ என்ற ஒரு பெயரைத் தேடிக் கண்டுபிடிக்க எவ்வளவு நேரம் ஆகும் என்று பாருங்கள். ஆனால் அப்பெயர்ப் பட்டியல் அகர வரிசையில் இருக்கிறதெனில் வெகு எளிதாகக் கண்டுபிடித்துவிட முடியும். பதவி உயர்வுக்குக் காத்திருப்போர் பட்டியலில் குமரனுக்கு முன்னால் இருப்பவர் யார், பின்னால் இருப்பவர் யார் என அறிய விரும்பினால் அகர வரிசைப் பட்டியல் பயன்படாது. பணிமூப்பு அடிப்படையில் தயாரிக்கப்பட்ட வேறொரு பட்டியல் வேண்டும். இந்த மாதம், அடுத்த மாதம் அடுத்தடுத்து ஓய்வு பெறப் போகிறவர்கள் யார் யார் என அறிய விரும்பினால் மேற்கண்ட இரண்டு பட்டியல்களும் பயன்தரா. பிறந்த நாள் அடிப்படையில் தயாரிக்கப்பட்ட மூன்றாவது பட்டியல் ஒன்று தேவை. இவ்வாறு ஒரே தகவல் தொகுப்பை எத்தனை பட்டியல்களாகத் தயார் செய்து வைத்துக் கொள்வது?

தொலைபேசி வாடிக்கையாளர்களின் பெயர்கள், எண்கள் அடங்கிய திரட்டினைப் (Directory) பார்த்திருப்பீர்கள். அகர வரிசையில் பெயர்கள் இருக்கும். குமரன் என்பவரின் தொலைபேசி எண்ணை அறிய விரும்பினால் அகர வரிசையில் அவருடைய பெயரைத் தேடிக் கண்டறியலாம். உங்கள் உறவினர் வீட்டுத் தொலைபேசி எண் உங்களிடம் இருக்கிறது. தொடர்பு கொள்கிறீர்கள். தொலைபேசி பழுதெனத் தகவல் வருகிறது. அவரை உடனடியாகச் சந்திக்க வேண்டும். அவருடைய வீட்டு முகவரி தெரியாது. தொலைபேசி எண்ணை வைத்துக் கொண்டு முகவரி அறிவது எப்படி? உங்களிடம் உள்ள திரட்டுப் பயன்படாது. ஏறுமுக அல்லது இறங்குமுக எண்வரிசைப்படி அமைந்த ஒரு திரட்டு வேண்டும். பத்து இலட்சம் வாடிக்கையாளர்களின் பட்டியல் ஏற்கெனவே மூன்று பெரும் தொகுப்புகளாய் இருக்கிறது. அதேபோன்று இன்னும் மூன்று தொகுப்புகள் தயார் செய்ய முடியுமா?

தரவுத்தள மென்பொருளில் இதுபோன்ற சிக்கல்களுக்கு எளிதாகத் தீர்வு காணலாம். தரவுத்தளத்திலுள்ள அட்டவணையை ஏறுமுகம் அல்லது இறங்கு முகமாக வரிசைமுறைப்படுத்தும் (Sorting) செயல்முறை உள்ளது. நெடுக்கைகளில் (Columns) பதிவு செய்யப்பட்டுள்ள பெயர், பிறந்த நாள், பணியில் சேர்ந்த நாள் போன்ற புலங்களின் (Fields) அடிப்படையில் கிடக்கைகளில் (Rows) உள்ள பணியாளர்களின் ஏடுகளை (Records) ஏறுமுகம், இறங்குமுகமாக ஒரு நொடியில் வரிசைப்படுத்திவிட முடியும். ஆக, தரவுத் தளத்தின் அட்டவணைகளில் தகவல்களை ஒழுங்கமைத்துப் பதிவுசெய்து வைத்துக் கொண்டால் தகவல் தேடல் மிகவும் எளிதாகிவிடும்.

தரவுத்தளத்தின் அட்டவணைகளில் புதிய ஏடுகளைச் சேர்க்கவும், தேவையற்ற ஏடுகளை நீக்கவும், எந்தவோர் ஏட்டிலுமுள்ள தகவலைத் தேடிப் பெறவும், அவ்வாறு தேடிக் கண்டறியும் தகவலைப் புதுப்பிக்கவும் (Updating), வெவ்வேறு அட்டவணைகளில் உள்ள தொடர்புடைய தகவல்களை ஒரே நேரத்தில் மீட் டெடுக்கவும் வினவல் (Query) எனப்படும் கட்டளைகள் உள்ளன.