شبكه اطلاع رساني روابط عمومي ايران (شارا)، پردازشهاي موردنياز براي آمادهسازي دادههاي بدون ساختار براي تجزيه و تحليل ميتواند فرآيندي دستوپا گير و نيز مستعد خطا باشد، به همين دليل سازمانها بايد براي سازماندهي اطلاعات خود حتي پيش از اقدام به جمعآوري آنها اقداماتي را مدنظر داشته باشند.دادههاي فاقد ساختار به اطلاعاتي اطلاق ميشود كه به صورت از پيش تعريف شده سازمان يافته نيستند و امروزه به صورت گسترده در دسترس هستند اما بهمنظور استفاده از اين اطلاعات در فرآيندهاي تجزيه و تحليل سازماني كه به معني پردازشهاي خاص است، بايد آنها را تحت ساختار مشخصي سازماندهي كرد. اين پردازش ميتواند مشكلساز باشد.
فرآيندهاي تجزيه و تحليل امروزي نيز در حالحاضر اطلاعات فاقد ساختار را به كمك كيمياگري مدرن به ارزشي براي كسبوكار تبديل ميكنند. سيستمهاي امروزي هرجا كه باشند هر داده قابل تصوري را مورد استفاده و پايش قرار ميدهند. فناوريهايي نظير Hadoop وNoSQL اين گنجينههاي اطلاعاتي را بهراحتي در همان شكل بدون ساختارشان ذخيره ميكنند. پردازشگرهاي زبان طبيعي، استخراج ويژگي و تشخيص گفتار اكنون به صورت روزمره مقادير عظيمي از متون بدون ساختار، تصاوير، اطلاعات صوتي و تصويري مختلف را براي تجزيه و تحليل آماده ميكنند. اين فرآيندها بسيار شگفتآور بوده و با هدف ايجاد نظم در دل بينظميها انجام ميشوند.متاسفانه درحاليكه مراحل مختلف اين پردازشها قابلتوجه هستند، نميتوان آنها را عاري از خطا هم تصور كرد. به جرات ميتوان گفت بهترين جايگزين براي چنين مواردي اجتناب از نياز به پردازشهاي جامع و عظيم است. ما همه به خوبي ميدانيم كه چگونه هر مرحله از پردازش، اطلاعات را دچار خدشه ميكند. با انجام اشتباهات حتي كوچك تحريف اطلاعاتي گسترش پيدا كرده و عدم اطمينان به سرعت در لايههاي مختلف گسترش پيدا ميكند.
سازمانها درگير بازي گسترده اطلاعاتي هستند و دادههاي فاقد ساختار اين بازي را بسيار پيچيده و دشوارتر ميكند. در شرايطي كه فعاليتهاي مصرف كننده ۵۰ الي ۸۰ درصد از دادههاي كمياب را مصرف ميكند، هر مرحله از فرآيند پردازش مستلزم دقت، تلاش و زمان بيشتري از سوي سازمان است و اين در حالي است كه معدودي از سازمانها اين سه مولفه را در اختيار دارند.هر مرحله از فرآيند پردازش ميتواند هزينه توسعه و نگهداري بالايي براي سازمان دربر داشته باشد اما گسترش اهميت به اشتراكگذاري اطلاعات ميان سازمانها يكي از مهمترين دغدغههاي عصر حاضر بهشمار ميرود. در گزارشي كه اخيرا توسط MIT منتشر شده است، موضوع ارزش كسبوكار و اهميت به اشتراكگذاري اطلاعات ميان سازمانها در قالب اينترنت اشيا مورد بررسي قرار گرفته است. مطالعات ديگر حاكي از نتايج مشابه در زمينههاي گستردهتر تجزيه و تحليلهاي اطلاعاتي است. در واقع با هر بار انتقال داده، فرآيندهاي توسعه و نگهداري بيشتري موردنياز خواهد بود.حذف واسطهها از جمله راهكارهايي است كه با حذف مراحل مياني مراحلي را پشتسر ميگذارد كه شايد در دورهاي ارزش افزودهاي دربر داشته است اما هماكنون ارزشي ايجاد نميكنند. سازمانها ميتوانند به دو روش واسط فرآيندهاي اطلاعاتي خود را حذف كنند.
• ساختار يافتهتر كردن اطلاعات از طريق يك رابط نرمافزاري رسمي: با ارائه اطلاعاتي كه فرمتهاي سادهاي دارند، سازمان ميتواند در ميزان تلاشهايي كه صرف پيادهسازي اين فرآيند ميكند، صرفهجويي كند.
• ساختاربخشي به اطلاعات در مبدا: با رشد فناوريهاي ذخيره دادههاي فاقد ساختار، ذخيره اين دست از اطلاعات بسيار آسانتر شده است. طراحي فرآيندهايي كه از اين فناوريها بهمنظور ذخيره اطلاعات بدون ساختار استفاده ميكنند با ايده امكان سازماندهي در آينده بسيار وسوسه انگيز است اما هرچه داده بيشتري از مبدا جمعآوري شود، امكان سازماندهي مطلوب كاهش پيدا خواهد كرد.
جان هورتون در تجربه كاري خود در oDesk متوجه اين موضوع شد كه سيستمهايي كه اصولا به افراد اجازه به اشتراكگذاري اطلاعات ميدهند از وروديهاي فاقد ساختار بهره ميبرند، در نتيجه كاربران اين سيستمها بيش از صدهزار ورودي لغوي مجزا با اشتباهات متعدد ايجاد كردند (مثلMS Powerpoint Microsoft Power Point). هرچند حدود ۱۴ درصد از وروديهاي سيستم بيش از يكبار استفاده شده بودند اما بسياري از موارد تكراري بودند و در واقع منظور يك ورودي واحد بوده است. بدتر اينكه هر سازمان يا سيستمي كه از اين اطلاعات استفاده ميكرد مجبور به ايجاد فرآيندهايي بود تا منظور كاربر را تفسير كند. به اين ترتيب oDesk با طراحي مجدد نحوه ورود اطلاعات به سيستم خود ليستي سازماندهي شده فراهم كرد كه به طرز شگفتآوري فرآيندهاي داخلي شركت براي تحليل اطلاعات و فرآيندهاي مورد نياز سازمانها در استفاده از سيستم oDesk را به مراتب بهبود بخشيده است. بهطور قطع، مهارتهاي جمعي ما در سازماندهي اطلاعات فاقد ساختار در هر مرحله از فرآيند تحليل موثر بوده و بهبودهايي را در پي داشته است. اما اين كيمياگري مدرن كاري دشوار است و مستلزم صرف تلاش، هزينه و زمان بسيار است.
منبع: روزنامه دنياي اقتصاد - شماره 3999