شارا - شبكه اطلاع رساني روابط عمومي ايران : كيمياگري مدرن و مديريت داده ‏هاي فاقد ساختار
یکشنبه، 15 اسفند 1395 - 12:05 کد خبر:28536
پردازش‎هاي موردنياز براي آماده‎سازي داده‎هاي بدون ساختار براي تجزيه و تحليل مي‎تواند فرآيندي دست‎وپا گير و نيز مستعد خطا باشد، به همين دليل سازمان‎ها بايد براي سازماندهي اطلاعات خود حتي پيش از اقدام به جمع‎آوري آنها اقداماتي را مدنظر داشته باشند.

شبكه اطلاع رساني روابط عمومي ايران (شارا)، پردازشهاي موردنياز براي آمادهسازي دادههاي بدون ساختار براي تجزيه و تحليل ميتواند فرآيندي دستوپا گير و نيز مستعد خطا باشد، به همين دليل سازمانها بايد براي سازماندهي اطلاعات خود حتي پيش از اقدام به جمعآوري آنها اقداماتي را مدنظر داشته باشند.دادههاي فاقد ساختار به اطلاعاتي اطلاق ميشود كه به صورت از پيش تعريف شده سازمان يافته نيستند و امروزه به صورت گسترده در دسترس هستند اما به‌منظور استفاده از اين اطلاعات در فرآيندهاي تجزيه و تحليل سازماني كه به معني پردازشهاي خاص است، بايد آنها را تحت ساختار مشخصي سازماندهي كرد. اين پردازش ميتواند مشكلساز باشد.

 

فرآيندهاي تجزيه و تحليل امروزي نيز در حال‌حاضر اطلاعات فاقد ساختار را به كمك كيمياگري مدرن به ارزشي براي كسبوكار تبديل ميكنند. سيستم‌هاي امروزي هرجا كه باشند هر داده قابل تصوري را مورد استفاده و پايش قرار ميدهند. فناوريهايي نظير Hadoop وNoSQL اين گنجينههاي اطلاعاتي را به‌راحتي در همان شكل بدون ساختارشان ذخيره ميكنند. پردازشگرهاي زبان طبيعي، استخراج ويژگي و تشخيص گفتار اكنون به صورت روزمره مقادير عظيمي از متون بدون ساختار، تصاوير، اطلاعات صوتي و تصويري مختلف را براي تجزيه و تحليل آماده ميكنند. اين فرآيندها بسيار شگفتآور بوده و با هدف ايجاد نظم در دل بي‌نظميها انجام ميشوند.متاسفانه درحاليكه مراحل مختلف اين پردازشها قابل‌توجه هستند، نميتوان آنها را عاري از خطا هم تصور كرد. به جرات مي‌توان گفت بهترين جايگزين براي چنين مواردي اجتناب از نياز به پردازشهاي جامع و عظيم است. ما همه به خوبي ميدانيم كه چگونه هر مرحله از پردازش، اطلاعات را دچار خدشه ميكند. با انجام اشتباهات حتي كوچك تحريف اطلاعاتي گسترش پيدا كرده و عدم اطمينان به سرعت در لايه‌هاي مختلف گسترش پيدا مي‌كند.

سازمانها درگير بازي گسترده‎‎ اطلاعاتي هستند و دادههاي فاقد ساختار اين بازي را بسيار پيچيده و دشوارتر ميكند. در شرايطي كه فعاليتهاي مصرف كننده ۵۰ الي ۸۰ درصد از داده‌هاي كمياب را مصرف مي‌كند، هر مرحله از فرآيند پردازش مستلزم دقت، تلاش و زمان بيشتري از سوي سازمان است و اين در حالي است كه معدودي از سازمانها اين سه مولفه را در اختيار دارند.هر مرحله از فرآيند پردازش ميتواند هزينه توسعه و نگهداري بالايي براي سازمان دربر داشته باشد اما گسترش اهميت به اشتراكگذاري اطلاعات ميان سازمانها يكي از مهمترين دغدغههاي عصر حاضر به‌شمار ميرود. در گزارشي كه اخيرا توسط MIT منتشر شده است، موضوع ارزش كسبوكار و اهميت به اشتراك‏گذاري اطلاعات ميان سازمانها در قالب اينترنت اشيا مورد بررسي قرار گرفته است. مطالعات ديگر حاكي از نتايج مشابه در زمينه‏هاي گستردهتر تجزيه و تحليلهاي اطلاعاتي است. در واقع با هر بار انتقال داده، فرآيندهاي توسعه و نگهداري بيشتري موردنياز خواهد بود.حذف واسطهها از جمله راهكارهايي است كه با حذف مراحل مياني مراحلي را پشت‌سر مي‌گذارد كه شايد در دوره‌اي ارزش افزوده‌اي دربر داشته است اما هم‌اكنون ارزشي ايجاد نميكنند. سازمان‏ها مي‏توانند به دو روش واسطفرآيندهاي اطلاعاتي خود را حذف كنند.

ساختار يافته‌تر كردن اطلاعات از طريق يك رابط نرم‌افزاري رسمي: با ارائه اطلاعاتي كه فرمتهاي ساده‏اي دارند، سازمان مي‌تواند در ميزان تلاش‌هايي كه صرف پياده‏سازي اين فرآيند مي‏كند، صرفه‌جويي كند.

ساختاربخشي به اطلاعات در مبدا: با رشد فناوريهاي ذخيره دادههاي فاقد ساختار‏، ذخيره اين دست از اطلاعات بسيار آسانتر شده است. طراحي فرآيندهايي كه از اين فناوريها به‌منظور ذخيره اطلاعات بدون ساختار استفاده ميكنند با ايده امكان سازماندهي در آينده بسيار وسوسه انگيز است اما هرچه داده بيشتري از مبدا جمع‏آوري شود، امكان سازماندهي مطلوب كاهش پيدا خواهد كرد.

جان هورتون در تجربه كاري خود در oDesk متوجه اين موضوع شد كه سيستمهايي كه اصولا به افراد اجازه به اشتراك‏گذاري اطلاعات ميدهند از وروديهاي فاقد ساختار بهره ميبرند، در نتيجه كاربران اين سيستم‌ها بيش از صدهزار ورودي لغوي مجزا با اشتباهات متعدد ايجاد كردند (مثلMS Powerpoint Microsoft Power Point). هرچند حدود ۱۴ درصد از وروديهاي سيستم بيش از يكبار استفاده شده بودند اما بسياري از موارد تكراري بودند و در واقع منظور يك ورودي واحد بوده است. بدتر اينكه هر سازمان يا سيستمي كه از اين اطلاعات استفاده مي‌كرد مجبور به ايجاد فرآيندهايي بود تا منظور كاربر را تفسير كند. به اين ترتيب oDesk با طراحي مجدد نحوه ورود اطلاعات به سيستم خود ليستي سازماندهي شده فراهم كرد كه به طرز شگفتآوري فرآيندهاي داخلي شركت براي تحليل اطلاعات و فرآيندهاي مورد نياز سازمانها در استفاده از سيستم oDesk را به مراتب بهبود بخشيده است. به‌طور قطع، مهارتهاي جمعي ما در سازمان‌دهي اطلاعات فاقد ساختار در هر مرحله از فرآيند تحليل موثر بوده و بهبودهايي را در پي داشته است. اما اين كيمياگري مدرن كاري دشوار است و مستلزم صرف تلاش، هزينه و زمان بسيار است.

 

منبع: روزنامه دنياي اقتصاد - شماره 3999