شبکه اطلاعرسانی روابطعمومی ایران (شارا) || ردپاهایی که افراد در اینترنت و رسانههای اجتماعی برجا میگذارند، منبع عظیمی از کلانداده و دادههای دیجیتال را شکل میدهد. برخی ظهور این حجم داده را بهمعنای پایان علوم اجتماعی میدانستند، اما واقعیت این است که علوم اجتماعی با اتکا به دادههای دیجیتال، روشهای تحقیقاتی خود را متحول کرده است. با این حال، به علت غیرنماینده بودن نمونهها، ابهام الگوریتمها و نگرانیهای حریم خصوصی، احتیاط همچنان ضروری است.
اطلاعاتی که از موتورهای جستجو، شبکههای اجتماعی، فروشگاههای آنلاین و همچنین اشیای متصل مانند تلفن هوشمند، ساعت و حسگرها بهدست میآید، جزئیات دقیقی از رفتارهای روزانه، الگوهای مصرف، سلامت، علایق و حتی گرایشهای سیاسی و مذهبی را آشکار میسازد. دیجیتالسازی سریع آرشیوها و اسناد قدیمی نیز به این روند شتاب بخشیده است.
این دادهها بهلحاظ حجم، تنوع و سرعت، ویژگیهای کلانداده را دارند (۳V). با پیشرفت هوش مصنوعی، ابزارهای استخراج و تحلیل داده، بهسرعت توسعه یافتهاند و طبق گفته دومینیک بولیه، چهره علوم اجتماعی را دگرگون ساختهاند.
از زمان شکلگیری وب، دو دیدگاه متضاد درباره تاثیر کلاندادهها وجود دارد؛ یک دیدگاه مرگ نظریه و روش علمی را پیشبینی میکند و دیدگاه دیگر فرصت تجدید علوم اجتماعی با علم داده را برجسته میسازد. کریس اندرسون، سردبیر مجله Wired، معتقد است که همبستگیها جای علیت را میگیرند و «اعداد خود گویا هستند». اما پژوهشگرانی همچون برت مونرو و گری کینگ، تلفیق نظریه و کلانداده را فرصتی برای پیشرفت میدانند.
در حوزههایی مانند نژادپرستی، که در نظرسنجیها بهدلیل سوگیری پاسخدهندگان کمتر قابل اندازهگیری است، کلانداده نقش ویژهای دارد. بهعنوان نمونه، در پژوهشی بر انتخابات ۲۰۰۸ و ۲۰۱۲ آمریکا، ست استفنز-دیویدویتز نشان داد جستجوی واژههای نژادپرستانه در گوگل، با کاهش آرای اوباما همبستگی داشته و بیانگر نقش پنهان نژادپرستی در نتایج است. او کشف کرد که واژه N به طور متوسط ۷ میلیون بار در سال جستجو شده و در ایالتهایی که این جستجو بیشتر بوده، رای اوباما حدود ۴ درصد کمتر بوده است.
مطالعه دیگری روی دادههای ۴۰۰ هزار پروفایل و ۲۵ میلیون ایمیل از سایت همسریابی Meetic و نیز نظرسنجی ملی فرانسه نشان میدهد زنان اغلب به اختلاف سنی به نفع مرد تاکید دارند، اما در عمل، مردان هنگام مسنتر شدن ترجیح بیشتری برای زنان جوانتر دارند. این اختلاف میان رفتار ادعایی و واقعی فقط از طریق دادههای بزرگ آشکار میشود.
اما باید توجه داشت که کلاندادهها چالشهایی مانند نمونهگیری غیرنماینده، ابهام الگوریتمی، دشواری دسترسی به داده، مخاطرات امنیتی و هزینه بالای انرژی را نیز بهدنبال دارد و سلطه شمال جهانی و آمریکا بر دادهها همچنان باقی است. با این وجود، نسل جدید پژوهشگران از کلاندادهها استقبال کردهاند.
امروزه دانشجویان دکترا با استفاده از یادگیری نظارتشده، میتوانند میلیونها سند از کشورهای مختلف را بر اساس فرضیات خود تحلیل کرده و علوم اجتماعی را در ابعادی جدید بررسی کنند. این روند، علوم اجتماعی را به سوی «علوم اجتماعی افزوده» هدایت میکند.
این مقاله با همکاری همایش علمی «انتشارها: الگوی جدید برای علوم اجتماعی؟» در سرزی، ۲۵ تا ۳۱ ژوئیه ۲۰۲۵، تهیه شده است.
نویسنده: نونا مایر، دانشگاه ساینس پو
منبع: The Conversation France
تاریخ: ۳۱ ژوئیه ۲۰۲۵
نظر بدهید