انبوه - داده؛ تحول معرفت شناسی (مقاله علمی وزارت علوم)
درجه علمی: نشریه علمی (وزارت علوم)
آرشیو
چکیده
انبوه - داده یکی از دستاوردهای مهم انقلاب فناوری اطلاعات و ارتباطات است که از حیث تأثیری که می تواند بر پژوهش های علمی بگذارد در این مقاله مورد توجه قرار گرفته است. در آنچه که به حوزه معرفت شناسی پژوهش های علمی مربوط می شود، دو گرایش عمده در این موضوع وجود دارد: یکی اینکه چنین پدیده ای به کنار گذاشتن تئوری از فرآیندهای پژوهش منجر می شود و دیگری در نقطه مقابل نقش تئوری ها را همچنان مؤثر می داند. انبوه - داده عبارت است از داده هایی که از گستره وسیعی از جریان فعالیت های اقتصادی، اجتماعی، زیست محیطی و... به صورت خودکار یا نیمه خودکار و با مشارکت فعال کاربران به وجود می آید. از شبکه های اجتماعی، وبگاه ها، وبلاگ ها، ژورنالیسم و «ردپای دیجیتال» افراد گرفته تا خدمات و تعاملات تجاری، اداری، فرهنگی، اجتماعی و... همگی عرصه ای پویا و گسترده را برای ایجاد انبوه - داده فراهم می کنند. انبوه - داده صرفاً حجم عظیم داده نیست؛ بلکه گستره وسیعی است که دارای تنوع، تکثر، سرعت، ارزش و انعطاف است. انبوه - داده زمینه دانش داده کاوی را فراهم کرده است که عبارت است از استخراج دانش های مفید از پایگاه های بزرگ داده یا از جریان داده ها که توسط روش های رایج، به دلیل گستردگی و پیچیدگی آنها قابل مدیریت نیستند. به دلیل حجم بالا، تنوع و سرعت زیاد انبوه - داده فنون جدیدی برای تحلیل آنها ضروری است. انبوه - داده ویژگی لحظه ای بودن دارد و ازاین رو، مشکل زمان را در پیمایش ها حل می کند. این یکی از مهم ترین ویژگی های انبوه - داده است. انبوه- داده و علم داده -ران بحث از اگنوستیک[1] را پیش روی ما می گشاید. «اگنوستیک» که اساساً نوعی «لاادری گری» یا ندانم گرایی است را می توان در ساحت معرفت شناسی به علم مستقل، علم بدون پیش فرض، یا علم قابل انطباق تعبیر کرد. در اگنوستیک ادعا بر این است که پیش فرضی ازسوی پژوهشگر وجود ندارد و می گوید که نمی دانم چه چیزی هست یا نیست، درست است یا غلط، حقیقت دارد یا ندارد. این مبنایی برای ورود به عرصه دانش است. علم داده - ران نیز بر همین ادعا استوار است. ازاین رو، این دو مفهوم مرتبط با معرفت شناسی را در کنار هم آورده ایم. ازآنجاکه داده های انبوه به خودی خود و بدون فرضیه یا تئوری ممکن است ما را در پژوهش علمی یاری دهند، بنابراین راه برای اقبال به اگنوستیسم فراهم می شود. به ویژه آنکه فناوری ها و روش هایی چون داده کاوی، یادگیری ماشین و هوش مصنوعی امکان پردازش داده های انبوه و استخراج الگوها را فراهم می کنند. این پدیده هنوز از حیث تأثیراتی که بر معرفت شناسی و نظریه پردازی دارد به اندازه کافی واکاوی نظری نشده است. مقاله حاضر، در پی بحث از همین ابعاد است. روش: در این مقاله با روشی تحلیلی نخست، چارچوبی مفهومی از چند مقوله اصلی برساخته می شود که شامل انبوه - داده، علم داده-ران، اگنوستیسم است. این سه مفهوم اصلی با یکدیگر در علوم فناوری های نوین و در علوم اجتماعی ارتباط دارند. این چارچوب مفهومی ازآن رو اهمیت دارد که با ترکیب علوم داده ای، علوم محاسباتی، علوم اجتماعی می تواند مبانی پارادایمی موجود را متحول کند و به تضعیف پارادایم علوم تجربی (پیشارنسانس)، علوم نظری (پیشارایانه) و علوم محاسباتی (پیشاداده انبوه) که پس از رنسانس مسلط بوده است بینجامد (کیچین، 2014). نتایج: این مقاله استدلال می کند که انبوه - داده ظرفیت آن را دارد که تحولی عمده را در معرفت شناسی علوم اجتماعی پدید آورد. ازسویی پدیده انبوه - داده بازیگران جدیدی را که پژوهشگران سنتی علوم اجتماعی نیستند، وارد توسعه علمی و معرفت شناسی می کند که شامل فناوران حوزه اطلاعات و ارتباطات و نیز کارآفرینان اقتصادی می شود. ازسوی دیگر، نقش رشته های دانشگاهی و تئوری ها در توسعه علمی کاهش می یابد. علم داده- ران می تواند برنامه های پژوهشی را سامان دهی کند؛ به گونه ای که نقش نظریه ها و تقسیم بندی های رشته ای سنتی در دانشگاه را محدود نماید. پدیده انبوه - داده به فردگرایی روش شناختی در علوم اجتماعی دامن می زند. ازاین رو، تجزیه وتحلیل سیاستی مبتنی بر ابزارهای فناوری اطلاعات یا علوم اجتماعی محاسباتی در معرض توجه بیشتری قرار گرفته است. بر اساس این، پایه های معرفت جدید بر درک فعالیت های خُرد فردی و فردگرایی روش شناختی بنا گذاشته می شود. «شناختِ ترکیبیِ فردمحور» امکان وقوع می یابد که حاصل سپهرهای گوناگون است. به دیگرسخن، شناخت بهتر فرد زمینه توسعه نظریه های فردمحور را امکان پذیر می کند. شناخت داده های متکثر، ضرورتاً به بی نیازی از نظریه نمی انجامد. تحلیل نظری گریبان انسان را رها نمی کند؛ زیرا این نظریه ها بخشی جداناشدنی از تجربه ها، سلیقه ها، ترجیحات و ادراکات روحی و روانی ما هستند. اما تحول اساسی اینجاست که نقش داده های خُردِ فردی و در مقیاس «نانورفتار» توسعه نظریه های فردمحور - داده محور را بیشتر می کند. به همین سان، نقش داده های فردی و نقش سوژه در شکل گیری نظریه بیش از نقش پژوهشگر - فاعلِ نظریه پرداز می شود؛ زیرا این داده ها به هرحال خود، کم و بیش سخن می گویند و نقش آفرینی بیشتری در فهم و در شکل گیری ذهن نظریه پرداز ایفا می کنند. نظریه های گوناگونی که از داده ها برمی آیند، بدینسان، از تعامل پذیری بیشتری برخوردارند؛ زیرا سهم هریک از عوامل و مؤلفه ها به صورت محسوس تری دیده شده و تصدیق می شود. ازاین رو، در نگاه نخست، زمینه برای تلفیق نظریه های گوناگون و شکل گیری کلان نظریه های «متناسب تر» بیش ازپیش فراهم می شود. به عنوان مثال، آنگاه که داده هایی طبقه بندی شده و شفاف از پدیده فقر و سهم ساختارها و رفتارها در آن شناسایی شود و آنگاه که داده هایی روشن و طبقه بندی شده از توانمندسازی انسان، از ابعاد گوناگون محیط زیست، از نقش سیاست دولتی در این زمینه ها، از عوامل مؤثر بر علم، فناوری و نوآوری در ابعاد و اجزای گوناگون و... به دست آید، زمینه برای نظریه پردازی های خُرد در هریک از این موضوعات و درنتیجه نظریه ای جامع فراهم می آید؛ البته در نگاه عمیق تر تحولی پارادایمی در توسعه دانش بدون رشته فراهم می آورد که خود می تواند موجد اغتشاش نظری باشد. بحث و نتیجه گیری: اگرچه دقیقاً نمی توان گفت که نقش نظریهها پایان یافته است، اما این انقلاب وجوهی دارد که نقشی بنیانی در تغییر پارادایم دارد؛ ازطریق گسست فعالیت علمی از نظریه پردازی، با از بین بردن ساختار سلسلهمراتبی دانشمندان، با تضعیف ساختار رشتهای، با توده ای کردن بازیگران دانش، با گسست تولید علم از زمینه رشته ای و از زمینه متخصصان، و با پدید آوردن دانش غیرتداومی. تقسیم بندی رشته ای به دلیل غرق شدن در اقیانوسی از داده ها اهمیت خود را از دست داده یا اینکه حداقل متزلزل شده است. داده مستقل از رشته است و ازاین رو، همکاری بین رشته ای در فضای «شبه - اگنوستیکی» از علم می تواند بلاموضوع باشد. در علم در دست کارشناسان فنی، تکنیسین ها و نه ضرورتاً دانشمندان به صورت «آنارشیک» رشد می یابد. امروزه، تحولات نوآورانه ای در حوزه فناوری های نوین ازسوی جوانان (و گاه نوجوانانی)، که دوره های تحصیلات تکمیلی را نگذرانده اند، مشاهده می شود. مایکروسافت، اپل، فیسبوک، تلگرام، واتساپ و بسیاری دیگر ازاین دست توسط کسانی به عرصه نوآوری آمده اند که ابداع کنندگان اولیه اغلب «دانشمند» به معنای مصطلح نبوده اند و حتی گاه از دانشگاه ترک تحصیل کرده اند. این ابتکارات و ابداعات خود سرمنشأ رشد علم بوده اند. نتیجه آنکه تحول علمی از محیط آکادمی به محیط کسب و کار آمده است. علم بیش از گذشته به بازار وابسته شده است و «دینامیسم» بازار سرمنشأ «دینامیسم» علم شده است. فناوری اطلاعات چنین بستری را ازطریق تسهیل ارتباطات و ترکیب فناوری های گوناگون با یکدیگر زمینه جهش متقابل را فراهم کرده است و علم نه اینتردیسیپلینری است و نه دیسیپلینری بلکه بی دیسیپلین است و این می تواند کل ساختار پیشین از رنسانس به این سو را به هم زند.Big-Data and Epistemic Change
Big data is an important achievement of the ICT revolution. In this article, big data is considered in terms of its impact on scientific research and the epistemology of knowledge. There are two main trends in this matter: one is that such a phenomenon leads to the abandonment of theory from research processes, and the other considers the role of theories to be still effective.
What we consider regarding the epistemological transformation caused by big data is somewhat different from what is stated in the relevant literature. Of course, it was presented in the critical analysis of researchers' points of view. Now we summarize it as follows:
1- The traditional division of disciplines has lost its importance or at least has been weakened due to the ocean of data. Data is independent of the field, and therefore interdisciplinary cooperation in the “agnostic” situation of science might be irrelevant. Of course, we are not of the agnostic belief that theory has lost its importance in the big-data age, as Chris Anderson claims in his article “The End of Theory: The Data Deluge Makes the Scientific Method Obsolete”. But without this agnostic approach, we can also accept that the role of theories, at least at the level of description, is greatly reduced, and therefore we can accept that data analysis is possible without disciplinary affiliation, and as a result, interdisciplinary collaborations are also shaky.
2- Data-driven science increases the role of correlation compared to causal theories and increases the role of researcher decision-making in the application of knowledge. Application means that a correlation is functionally important without depending on a specific discipline, and it can be used independently of any discipline; only to solve problems. The problems are not within the disciplines, but are located in the real world and impose themselves on us independently of the theories and disciplines. To solve a problem, numerous disciplines can be considered. These different perspectives mean that “a problem” is not dependent on any of these perspectives (disciplines). The problem of inflation can be seen from the perspective of economics, social psychology, political science, etc.
3- Weakening the role of theory and discipline in scientific development opens another field for scientific activities. New actors enter into scientific activities to the extent possible to play a competitive role with traditional researchers in scientific development. While the methodological changes produced by big data do not seem to be sufficient to invoke an entirely new paradigm in knowledge discovery, the emergence of big data has profoundly shaped the actors involved and their relationships. Moreover, even, the transition of scientific authority is predictable. In the age of big data, the shift of scientific authority from researchers and scientists (the followers and holders of grand theorists) to technicians, digital businessmen, and even ordinary users of big data can be expected. According to Chang et al., categories of mass data have emerged, which are caused by interactions, economies, interactions of societies or nations, and interactions of individuals. Public access to these data and especially facilitating the use of information technology tools can enable a large number of non-professional users in the field of research even with basic knowledge of statistics and data analysis in the field of science production. It is useful to remember that before the appearance of statistical software such as SPSS and SAS, performing a statistical analysis requires familiarity with programming skills. With the development of this software, more researchers were able to perform statistical operations because programming skills were removed from this process. Similarly, increased access to big data and analytical technologies resulting from new tools enable more "people" to analyze data and discover correlations between data for personal or business purposes or socio-cultural interactions. The production of public knowledge by people who are considered unprofessional according to "academic standards" is an important aspect in the evolution of scientific epistemology in the age of big data and analytical tools of information technology. The aggregative and generalized structure of scientific activity (if such a structure is important anymore) which was done by professional researchers and scientists through the structures of knowledge sharing and reproduction, will be performed by the machine. Knowledge activity will be displaced from its traditional institutional context. This is why I say that the implicit structure of authority that has been created over time by scientists and researchers is disrupted by "new revolutionaries" in the world of science. The institution of power in the production of science becomes shaky, scattered, multipolar, and rather rebellious. The problem is that in the previous paradigms, a kind of hierarchical structure of power or authority or scientific authority had emerged. The new paradigm targets exactly this hierarchical structure. Everyone can observe the big data and make inferences from it: No prior expertise; not just without prior theory; in an "agnostic platform" and without dependence on any field or discipline; without aristocracy of epistemological knowledge or any other theory and with a disruption from previous scholars and scientists.
4- Massification of actors raises the question of whether the accumulative, aggregative, and evolutionary characteristics of science, as seen in the history of science, do not undergo a radical transformation. Doesn't it go out of its institutional context, i.e. the field of "academy"? Microsoft, Apple, Facebook, Telegram, WhatsApp and many others have come to the field of innovation by people whose original innovators were often not "scientists" in the conventional sense, and sometimes even dropped out of university. These initiatives and innovations have been the source of the growth of science. The result is that scientific evolution has come from the academic environment to the business environment. Science has become more dependent on the market than before, and the "dynamism" of the market has become the source of the "dynamism" of science. Information technology has provided such a platform by facilitating communication and combining various technologies to provide a context for mutual leap. Science is neither interdisciplinary nor disciplinary but non-disciplinary. This can disrupt the entire structure of science that has dominated since the Renaissance.