بحرانِ تکرار
مروری بر کتاب دروغهای علمی: افشای تقلب، سوگیری، بیدقتی و غلو در علم
جان ویتفیلد، مطلبی با عنوان «REPLICATION CRISIS» در مجلۀ لندن ریویو آو بوکس نوشته است که با ترجمهی علی امیری در سایت ترجمان منتشر شده است. متن کامل را در ادامه بخوانید.
«امروزه میزان موفقیت یک پژوهشگر، تا حد زیادی، وابسته به سابقۀ انتشار اوست: نامش را پای چند مقاله گذاشته، آثارش را در کدام نشریات منتشر کرده، سایر مقالهها چند بار به مقالههایش ارجاع دادهاند؟ این امر نظامی آفریده که طرفدار سرعت انتشار، حجم زیاد تولید و جنجالطلبی است. عجله برای انتشار و فشاری که برای جلبتوجه وجود دارد پژوهشگران را بهسوی راههای میانبر و دوز و کلک سوق میدهد. استورات ریچی، روانشناس و گزارشگر علم، در کتاب جدیدش، دروغهای علمی، مشکلات سازوکارهای رایج برای انتشار مقالات علمی و دانشگاهی را بررسی میکند.
جان ویتفیلد، لندن ریویو آو بوکس— روزنامۀ چاینا دیلی در ماه نوامبر سال ۲۰۱۷ گزارشی منتشر کرد دربارۀ رستورانِ باربیکیویی در پکن. این رستوران لیویهدائو («نیشتر»۱) نام داشت و به مشتریانی تخفیف میداد که میتوانستند ثابت کنند، اخیراً، در نشریهای علمی مقاله منتشر کردهاند. این رستوران ضریبِ تأثیرِ۲ -آماری براساس تعداد میانگین ارجاعاتی که مقالههای منتشره در مجله، طی دو سال پس از انتشار، دریافت میکنند- نشریه را میگرفت و آن را تبدیل به معادلی نقدی میکرد تا از صورتحساب کاسته شود.
ضریب تأثیر در دهۀ ۱۹۶۰ ابداع شده بود تا کمکی باشد برای کتابدارهای دانشگاهی، تا بتوانند در این باره تصمیم بگیرند که از کدام نشریات در مجموعهشان نگهداری کنند. این معیاری معقول برای قوت نشریههاست. اما توزیع ارجاعاتْ اریب۳ است: اکثر ارجاعات به خاطر کسر کوچکی از مقالههاست، درحالیکه ارجاع به اکثر مقالهها، اگر هم ارجاعی داده شده باشد، اندک است. بنابراین ضریب تأثیر کاربردِ چندانی، بهمنزلۀ راهنمای کیفیت مقالهای خاص، ندارد: هیچکس نباید مقالۀ علمی را براساس نشریهای که در آن چاپ میشود قضاوت کند.
بیشتر افرادی که در حوزۀ پژوهش کار میکنند این را میدانند، اما ازآنجاکه فهم مقالههای علمی برای غیرمتخصصان دشوار است، و چون باخبرماندن از تمام متون مربوطه سخت است، مقاومت دربرابر وسوسۀ ارزیابی آثار علمی بهوسیلۀ معیاری واحد و ساده، هرچند مندرآوردی، سخت است. درنتیجه، ضریب تأثیر بدل به شاخص اعتبار شده است. مقالهای که در لَنسِت با ضریب تأثیر کنونی ۶۰ منتشر میشود، حتی پیشازآنکه کسی آن را بخواند، ارزشی بسیار بیشتری دارد از مقالهای که در عرضهگاهی تخصصی همچون کلینیکال ژنتیکس، با ضریب تأثیر ۴.۴، منتشر میشود. تعجبی ندارد که این مسئله مؤثر باشد بر اینکه پژوهشگران کار خود را به کجا ارائه دهند.
استخدامشدن پژوهشگر و جایی که در آن مشغول به کار میشود، تا حد زیادی، وابسته به سابقۀ انتشار اوست: نامش پای چند مقاله هست، آثارش را در کدام نشریات منتشر کرده، سایر مقالهها چند بار به مقالههایش ارجاع دادهاند؟ این امر نظامی آفریده که طرفدار سرعت انتشار، حجم [زیاد] تولید و -ازآنجاکه نشریاتْ یافتههای جدید و چشمگیر را به نتایج منفی یا تکرار آثار قبلی ترجیح میدهند- جنجالطلبی است. مشوقهای مالی نیز ممکن است وجود داشته باشند. زمانی که گزارش تخفیف باربیکیو انتشار یافت، بسیاری از دانشگاههای چین بابت مقالات جوایز نقدی میدادند، به این صورت که نشریاتی که ضریب بالاتری داشتند ضامن پاداشهای بیشتر برای پژوهشگران بودند. در بررسی خطمشیهای دانشگاههای چین در سال ۲۰۱۶، میانگین پاداش برای نویسندۀ اصلی مقالهای در نیچر یا ساینس ۴۴ هزار دلار محاسبه شده بود، یعنی پنج برابر میانگین حقوق استادی.
داوریِ همتا۴ صورت اصلی کنترلِ کیفیتِ پیش از انتشار در حوزۀ علم است. سردبیران نشریه مقالات ارائهشده را معمولاً برای دو نفر از کارشناسها میفرستند. وظیفۀ آنها قضاوت دراینباره است که آیا روشها، دادهها و تحلیلهای مطالعه مستدل است یا نه، و آیا شواهد مؤید مدعیات نویسنده است؟ گزارشهای (اغلب اوقات ناشناس) آنها اعتبار و اهمیت اثر را ارزیابی کرده و چگونگی بهبود آن را پیشنهاد میدهند و توصیه به رد یا قبول آن، معمولاً، همراه با اصلاحات موردنیاز میکنند. یافتن داوران روزبهروز سختتر میشود، زیرا آنها عموماً پولی دریافت نمیکنند یا بهطرق دیگر اعتباری نصیبشان نمیشود و باید این کار را در دل تدریس، پژوهش و مسئولیتهای اداری خود بگنجانند.
بررسی تمام روشها و تحلیلهای یک مقاله، حتی در چندین ساعتی که سرهمکردن یک داوری معمولی زمان میبرد، تقریباً غیرممکن است. همین مسئله دربارۀ کشف خطاهای ساده ازقبیل عدد اشتباهی که در صفحۀ گسترده۵ تایپ شده یا اشتباه در کشت سلولی نیز صادق است، چه برسد به دادههای ساختگی و تقلبی. درنتیجه داوران و نشریات، درنهایت، اساس خیلی چیزها را بر صداقت میگذارند. حتی داوری دقیق نیز ناسازگار است، زیرا ممکن است داوران دربارۀ شایستگیهای مقاله با هم تفاهم نداشته و سوگیریهای فکری و اجتماعی خود را داشته باشند.
استوارت ریچی در کتاب دروغهای علمی مشکلات این نظام را بررسی میکند. این کتاب شرح مفیدی است از دَه سال یا بیشتر مباحثه، عمدتاً در حلقههای تخصصی، دربارۀ بازتولیدپذیری۶، اصلی که میگوید یکی از اهداف مقالۀ علمی این است که امکان انجام همان کار را برای سایرین فراهم کند، و اینکه یکی از آزمونهای اعتمادپذیریِ آن این است که آنها هم همان نتایج را بگیرند. در دهههای اخیر، کوششهای گستردهای برای تکرار در چندین حوزه وجود داشته، اما چنانچه نتوان آزمایشی را تکرار کرد، لاجرم بدین معنا نیست که اثر اصلی فاقد صلاحیت است. کار در خط مقدمِ یک رشته دشوار است و دستانِ ماهرْ عاملی قدرنادیده در موفقیت علمی است.
برخی مشاهدهها دقیقاً به این دلیل درخور توجهاند که نامعمول یا متکی به زمینهشان هستند. گاه، انجام آزمایشی یکسان و گرفتن نتیجهای متفاوت نکتۀ مفیدی را آشکار میکند. با همۀ اینها، یافتههای این مطالعات گسترده برای تکرار نتیجه نفت بر آتشِ این درکِ فراگیر ریخته است که علم دارد براساس معیارهای خودش شکست میخورد: کوششی در زیستشناسیِ سرطان توانست تنها شش مطالعه از بین ۵۳ مطالعه را تکرار کند؛ در روانشناسی حدود ۵۰ درصد از مطالعات را نمیتوان تکرار کرد؛ در اقتصاد، حدود ۴۰ درصد. در سال ۲۰۱۶، نیچر از پژوهشگران تمام علوم طبیعی نظرسنجی کرد و دریافت که بیش از نیمی از پاسخدهندگان از تکرار کار خود عاجز بودهاند، هرچند کمتر از یکسوم آنها این ناکامی را برهان قاطع نادرستیِ آن مطالعه تلقی کردهاند.
در یک سوی بحرانِ تکرار، آنطور که برملا شده، تقلبهای خارقالعادهای وجود دارد. در نخستین سالهای قرن جدید، هوآنگ ووسوک، زیستشناس اهل کرۀ جنوبی، بابت شبیهسازی سلولهای بنیادی انسان به قهرمانی ملی تبدیل شد؛ تنها چند سال پیش از آن، یان هندریک شون، دانشمند علم مواد، بابت مقالههایی که اجزایِ الکترونیکی را در مقیاس مولکولی تشریح میکردند لایق دریافت جایزۀ نوبل دانسته میشد. هر دو نفر نتایجشان را سر هم کرده بودند. در نظرسنجیها، حدود دو درصد از پژوهشگران به جعل داده اعتراف میکنند، هرچند تعداد بیشتری از آنها شک دارند به اینکه همکارانشان این کار را میکنند. اما احتمالاً تخلفات عمدی مسئولِ تنها بخش کوچکی از علمِ اعتمادناپذیرند. دغدغۀ بزرگتر این است که عجله برای انتشار و فشاری که برای جلبتوجه وجود دارد پژوهشگران را بهسوی راههای میانبر و دوز و کلک سوق میدهد: حقهبازیهای سطحپایینی که بهمرحلۀ تقلب نمیرسند، اما اعتمادپذیری را تضعیف میکنند.
همانطور که ریچی نشان میدهد، تکتک بخشهای مقالۀ علمیِ استانداردْ منبع بالقوۀ اشکال است. بسیاری از پژوهشگران روشهایشان را چنان سربسته شرح میدهند که تکرار آنها برای دیگران غیرممکن است. زبان بحثها و چکیدهها روز به روز مبالغهآمیزتر شده است: بین سالهای ۱۹۷۴ تا ۲۰۱۴، نسبت مقالههایی که یافتههایشان را نوآورانه، مستحکم، بیسابقه، پیشگامانه و غیره وصف میکنند بیش از هشت برابر شده است. اما اوج بحرانِ تکرار شیوۀ ارائه و تحلیل نتایج است. شاید دلایل مشروعی برای کنارگذاشتن اندازهای خاص یا مرتبکردن یک تصویر وجود داشته باشد، اما این هم درست است که اگر، آگاهانه یا غیر از آن، کاری از این دست انجام دهید تا نتایجتان را بهسمت نتیجۀ مطلوب خود هدایت کنید، احتمال لورفتنتان کم است.
بعضی از مشکلاتْ خاصِ رشتههای بخصوصی هستند. در زیستشناسی سرطان، مقالههای بیشماری برپایۀ مطالعاتیاند که از کشتِ سلولیِ آلوده یا بهاشتباه شناساییشده استفاده میکنند. ظهور فوتوشاپ تشخیص اینکه چه زمانی تصاویرِ فرایندهای مولکولی و مولکولهای ژنتیکیْ اصلاح، تکثیر، متصل یا بهنحو دیگری دستکاری شدهاند را سخت کرده است. سایر مشکلات در بین رشتههای زیادی مشترک است. استفاده از آمار دغدغهای عمومی است. از روشهای آماری برای تحلیل الگوها درون دادهها، با نگاهی به جداسازی تغییر تصادفی۷ از دلایل بنیادین، استفاده میشود. معمولاً، وقتی نتیجهای تجربی ازلحاظ آماری معنادار توصیف شده باشد به این معناست که آزمونی آماری نشان داده که احتمالی کمتر از پنج درصد وجود دارد که تفاوت میان آن نتیجه و مثلاً نتیجۀ متناظر در آزمایش کنترل را بتوان به تغییر تصادفی نسبت داد.
تعداد بسیار زیادی آزمون آماری گوناگون وجود دارد که هر یک برای طرح سؤالی خاص دربارۀ نوع خاصی از داده مناسباند. نرمافزارهای رایانهای اجرای چنین آزمونهایی را بدون دردسر و بدون کوچکترین دانشی از بنیانهای ریاضیشان ممکن میسازند.این باعث میشود بهآسانی از آزمودن یک فرضیه دور شویم و به جستوجوی الگوهای نامحتمل در داده برویم. هرچه آزمونهای بیشتری انجام دهید، بیشتر احتمال دارد نتیجهای بگیرید که زیر آستانۀ پنج درصدی باشد. آنگاه میتوانید مطالعه را طوری بنویسید که انگار تمام مدت دنبال همین بودهاید. به این کار میگویند صید داده یا هارکینگ۸: فرضیهبافی پس از مشخصشدن نتایج.
سایر گونههای صید داده عبارتاند از ادامهدادن به جمعآوری داده تا زمانیکه چیزی از لحاظ آماری معنادار پیدا کنید و کنارگذاشتن دادههای پرت یا سایر اندازهها به این دلیل که آمارتان را به هم میریزند. بین یک سوم تا نیمی از دانشمندان به انجام کاری در همین مایهها اذعان دارند. دیگر روالهای فراگیر عبارتاند از تقسیم مطالعات برای بهدستآوردن حداکثر مقالات ممکن و بازیافت برشهایی از آثار قدیمی در مقالههای جدید.
تأمین بودجه نیز سوگیری بهنفع نتایج مثبت را سبب شده است: مثلاً آزمایشها و کارآزماییهایی که صنعت داروسازی پولشان را میدهد گرایش بیشتری به نشاندادن نتایج مثبت دارند تا مطالعات همترازی که بودجهشان را دولتها یا سازمانهای خیریه تأمین میکنند. سوگیری بهنفع نتایج مثبت چیزی است که به خود استمرار میبخشد: هنگامیکه سهچهارم یا بیشتر مقالههای منتشره خبر از یافتههای مثبت میدهند، برای احتراز از نتایج منفی، یا امتناع از نوشتن آنها، انگیزهای قوی وجود دارد.
نگرانی این است که انگیزههای انحرافی طوری تیشه به ریشۀ فرایندهای علمی زده باشند که دیگر بهسختی میدانیم چه چیز را باید باور کنیم. این بحران بهخصوص به روانشناسی، رشتۀ شخصِ ریچی، و زیستپزشکی سخت آسیب رسانده است. اینها حوزههایی شلوغ و رقابتیاند که در آنها گروههای پژوهشی از سراسر دنیا با یکدیگر مسابقه میدهند تا دربارۀ داغترین موضوعات چیزی منتشر کنند. در چنین شرایطی، عجله میتواند بر دقت غلبه کند. دادهها در این حوزهها معمولاً پرحاشیهاند و امکان تفسیر و دستکاری در ارائه و تحلیل را میدهند، و به احتمال زیاد، تخصصِ ریاضیِ روانشناسان و زیستشناسان از همکارانشان در علوم فیزیکی کمتر است.
هرچند شاید این حوزهها بیش از آنچه سزاوارش هستند زیر ذرهبین قرار گرفته باشند: انجام مجدد آزمایشی در آزمایشگاه از مثلاً مطالعهای میدانی دربارۀ رفتار جانوری آسانتر است. در همین حال، پژوهش در روانشناسی، سلامت و دارو درجۀ نامعمولی از نکتهسنجی را نیز جلب میکند، زیرا نتایج آن میتواند اثرات مستقیم بر زندگی روزمرۀ ما داشته باشد. وقتی مدرسهها روندهای آموزشیشان را براساس آزمایشهای روانشناسی کودک بنا مینهند یا روزنامههای جنجالی گزارشهای وحشتناکی دربارۀ مواد غذایی عادی، تنها برپایۀ یک مطالعه، منتشر میکنند، تکرارپذیربودن پژوهش اصلی اهمیت دارد.
نرخ بازتولیدپذیریِ حدود ۵۰درصدی در زیستپزشکی برابر است با پول زیادی که خرج کارهای اعتمادناپذیر شده است -بنابر مطالعهای از سال ۲۰۱۵، سالانه ۲۸ میلیارد دلار فقط در ایالات متحده. شرکتهای دارویی بخشی از گناهِ پیشرفت کُند و هزینههای گزاف توسعۀ دارویی را به گردن اعتمادناپذیری پژوهشهای پایه میاندازند. بیش از ۹۰ درصد ترکیبات شیمیایی که بهعنوان داروهای بالقوه شناسایی میشوند از رسیدن به کارآزمایی بازمیمانند؛ در سال ۲۰۱۱، شرکت بایر دوسومِ پروژههایش را متوقف کرد، زیرا دانشمندان سازمانیاش نمیتوانستند نتایج گزارششده در متون را بازتولید کنند.
همۀ اینها به اندازۀ کافی بد هست، باوجوداین، بازتولیدپذیری تنها یکی از چندین مشکل متقاطعی است که از رقابت بیش از پیش سهمگین برای منابع و اعتبار در علم ناشی میشود. تضمین این هر دو سختتر شده است، زیرا شمار افرادی که در حوزۀ پژوهشکار میکنند رشدی سریعتر از منابع مالی یا مشاغل دائمی داشته است. ساینس کمتر از هفت درصد از مقالات ارائهشدهای را که دریافت میکند منتشر میکند -این برای نشریات معتبر عادی است- درحالیکه تقریباً سهچهارم درخواستهای کمکهزینۀ پژوهشی رد میشوند.
ازآنجاکه انتشار در نشریههای با ضریب تأثیر بالا معیار قاطع موفقیت است، بر اینکه چه پژوهشی انجام شود، و چگونگی انجام آن، مؤثر است. اثری که معطوف به مسئلهای محلی باشد دستکم گرفته میشود، بهویژه اگر به زبانی غیر از انگلیسی منتشر شده باشد؛ همچنین رویکردهای بینارشتهای و نامتعارف به عرضهگاههای کمتر مشهود و فرودستتر تنزل یافتهاند. در همین حال، معتبرترین نشریهها جریان غالب را در حوزههای خود اشغال -درواقع، تعیین- میکنند.
فشار برای تولید انبوهِ خودکارِ مقالهها محرک فرهنگ اضافهکاری -و در مواری قلدری- نیز است که بیشترین فشار آن بر پژوهشگران تحصیلات تکمیلی و پسادکتری وارد میشود. اینها افرادیاند که، درحقیقت، بیشترین میزان کار آزمایشگاهی و میدانی را انجام میدهند؛ بیشترشان بورسیهاند یا قراردادهایی بین سه تا پنج سال دارند و تواناییشان برای ساختن سابقۀ انتشار بهشدت وابسته است به حمایت پژوهشگران ارشدی که در آزمایشگاههایشان کار میکنند. هیچکدام از این موارد کمکی به ترویجِ تنوعِ چشمانداز در نیروی کار علمی یا رویارویی با سوگیریها نمیکند. اگر محیطی بهشدت رقابتی کمک کرده تا بهترین آثار به صدر برکشیده شوند، ممکن است دلیلی برای توجیه این معضل وجود داشته باشد. برای نمونه، شاید فکر کنید نظامی که میتواند در کمتر از یک سال به چندین واکسن بسیار مؤثر برای بیماری جدیدی دست یابد، بالاخره، باید حُسنی هم داشته باشد.
شاید اینطور باشد، اما اکثر پژوهشها، برخلاف کار دربارۀ کووید۱۹، مجبورند برای بودجه و توجه مبارزه کنند. پژوهشگر زیردستی که مورد عتاب رئیسش واقع شده و قراردادی روبهاتمام دارد ممکن است وسوسه شود تا میانبر بزند. بدنههای تأمین بودجهای که نرخ موفقیت پایینی دارند رو به سوی پروژههای کمخطرِ کوتاهمدت میآورند. حتی هنگامیکه علم اعتمادپذیر است، دانشی که تولید میشود ممکن است پیشپاافتاده باشد.
دربارۀ اینکه باید برای حل این مشکلات کاری کرد تفاهم فراگیری وجود دارد. بدنههای تأمین بودجه و دولتها میل فزایندهای به عمل در مقام تنظیمگر از خود نشان میدهند. در فوریۀ سال ۲۰۲۰، دولت چین اصلاحاتی در پیش گرفت، ازجمله ممنوعیت مشوقهای نقدی برای مقالات، فاصلهگرفتن از استفاده از ضریبهای تأثیر در استخدام و ارتقا و این شرط که پژوهشگران، دستکم، یکسوم آثارشان را در نشریات داخلی منتشر کنند. در بریتانیا، دولت با تأمینکنندۀ اصلی بودجۀ پژوهش همگانی، یعنی سازمان پژوهش و نوآوری بریتانیا، در کنار بدنههای مؤثری مثل جامعۀ سلطنتی و بنیاد ولکام همکاری میکند تا فرهنگ پژوهش را بهبود بخشد.
یکی از پیشنهادها این است که استقبال بیشتری از تمام کارهای دانشمندان بهجز تولید مقاله بشود، کارهایی ازقبیل نوشتن کُدهای رایانهای، ارائۀ مشاورۀ سیاستگذاری، برقراری ارتباط با عموم مردم و همکاری با شرکتها و گروههای جامعۀ مدنی. همچنین، با توجه به اینکه تقریباً تمام پژوهشها اکنون گروهی است، رفتهرفته تمرکزِ ارزیابی از دستاورد فردی بهجانب دستاوردهای تیمها و مؤسسات حرکت میکند.
در این اثنا، بیش از پنجاه دانشگاه در شبکۀ بازتولیدپذیری بریتانیا ثبت نام کردهاند که ابتکارعملی است از پایین به بالا برای بهبود آموزش و روشهای پژوهشگران بریتانیایی. نشریات، ازطریق ملزمکردن نویسندهها به قراردادن دادههای خامشان در دسترس عموم، و نه صرفاً گزارش تحلیلهایشان، کار بررسی مقالهها را برای دیگران راحتتر کردهاند. در تلاش برای کاستن از وسوسۀ صید داده، بسیاری از نشریات شروع کردهاند تا به پژوهشگران اجازه دهند، پیش از شروع به کار، فرضیاتشان را بههمراه برنامههای آزمایش و تحلیلهایی که قصد انجامشان را دارند ارائه دهند. تلاشهایی در سطوح ملی و بینالمللی میشود برای حصول اطمینان از اینکه نتایج تمام کارآزماییهای بالینیْ عمومی میشوند تا از پنهانساختن نتایج منفی جلوگیری شود. و اکنون، ابزارهای خودکاری در دسترساند که میتوانند به تشخیص خطاها در دادهها و تصاویر کمک کنند.
همۀ اینها مغتنم است، اما مسئلهای که صاحبمنصبان علاقۀ کمی به پرداختن به آن نشان دادهاند چگونگی کاستن از اتکای این نظام به قراردادهای کوتاهمدتی است که تعدادشان بسیار بیشتر از مشاغل دائمی در حوزۀ پژوهش است که توسط بودجۀ عمومی تأمین مالی میشوند. آیا افزایش امنیت شغلی برای پژوهشگران، در زمانهای که تدریس در دانشگاهها دارد بیش از همیشه متزلزل میشود، اصلاً امکانپذیر است؟ پرسش مشابهی را میتوان مطرح کرد دربارۀ توانایی دانشگاهها برای مقاومت دربرابر نیروهایی که محرک رقابت در پژوهشاند. آیا هیچ مؤسسه یا ملتی توانایی کنارهگیری یکجانبه را دارد؟ چه اتفاقی میافتد اگر دانشگاههای خوب شروع به سقوط در ردهبندیهای بینالمللی کنند، ردهبندیهایی که تاحدی براساس تعداد مقالات و ارجاعات است؟
اصلاحات انجامگرفته از این دست در انتشارات دانشگاهی از هر جای دیگر مشهودتر است. از دید دانشمندان، بهلحاظ تاریخی، بزرگترین شرکتهایِ انتشاراتیِ انتفاعی کارِ بیمزد و مواجب آنها در مقام نویسنده و داور را گرفته و برای خواندن نتایج پول کلانی از آنها گرفتهاند. الزویر، بزرگترین شرکت از این میان، در سال ۲۰۱۹ حاشیۀ سودی برابر با ۳۷ درصد داشت.
جنبش دسترسی آزاد که حوالی آغاز قرن توسط دانشمندان عملگرا شروع شده این استدلال اخلاقی را میآورد که خوانندهها نباید مجبور باشند برای دیدن نتایج علمی، که پول آن قبلاً از بیتالمال پرداخت شده، پول بدهند، و نیز این استدلال عملی که مقالههایی که آزادانه در دسترساند را آسانتر میتوان اعتبارسنجی کرد و سنگبنا قرار داد. این جنبش دستکم در اروپا پیشرفت زیادی کرده است، جاییکه اتحادیۀ اروپا و بسیاری دیگر از تأمینکنندگان بودجه، ازجمله سازمان پژوهش و نوآوری بریتانیا و ولکام، اینک دیوار پرداخت۹ برای مقالاتی که حاصل کمکهزینههای خودشان بوده است را برداشتهاند.
نشریات چاپی همیشه گزینشگر بودهاند، زیرا شمار صفحاتشان محدود است. آنها بنا به سنت در پی آن بودهاند که نه تنها مستدلبودن مقاله، بلکه اهمیت یافتههای آن را نیز قضاوت کنند. بسیاری از آنها هنوز این کار را میکنند، این بخشی از اصالت آنهاست. اما درحالیکه اکثر نشریات دارند بهکلی آنلاین میشوند، فضا دیگر دغدغه نیست. طی بیست سالی که از آغاز جنبش دسترسی آزاد میگذرد، مدل تجاری جدیدی سر برآورده است که، در آن، فروش اشتراک جای خود را به حق انتشاری داده است که از نویسنده طلب میشود.
ما شاهد ظهور اَبَرنشریاتی با دسترسی آزاد بودهایم که از داوران میخواهند اعتبار نتایج، ولی نه اهمیت آنها را داوری کنند و تمام ارائهها، ازجمله تکرارها و یافتههای منفی، را میپذیرند. این رویکرد بیعیبونقص نیست؛ در سال ۲۰۱۶، ابرنشریۀ کتابخانۀ عمومی علم۱۰ به نام پلوس وان۱۱، که در حال حاضر حق انتشاری معادل ۱۶۹۵ دلار به ازای هر مقاله مطالبه میکند، مطالعهای منتشر کرد که اعلام میکرد دست انسان نشانۀ «طراحی صحیح خالق» است. اما این مدل هم در میان پژوهشگرانی که راهی نسبتاً سریع، بیدرد سر و ارزان به انتشار مییابند و هم ناشرانی که درآمد ثابتی کسب میکنند محبوب است.
ضریب تأثیر پلوس وان تنها ۲.۷ است. ریچی مینویسد «در حالت ایدئال، آنچه دوست داریم ببینیم نسبت دقیقی از نتایج باطل و تکرارهای نافرجامِ بیشتر در نشریات مسحورکننده با ضریب بالاست». اما بدیهی است که آن «نشریات مسحورکننده» باید جایگاه خود را حفظ کنند. میتوان استدلال کرد که صنعت نشر عالمانه تعمیرشدنی نیست و وضع ما بدون نشریات بهتر است -شاید حتی بدون داوری همتای پیش از انتشار. دیگر برای حروفچینی و توزیع به ناشران نیازی نیست و شبکههای اجتماعی -ازجمله سایتهای تخصصی مانند ریسرچگیت که بیش از ۱۷ میلیون کاربر دارد- میتوانند بخشی از مدیریت و بازاریابی آنها را انجام دهند.
آنچه از ارزش این نشریات باقی میماند در برند آنها و ظرفیتشان برای ساماندهی داوری همتا نهفته است. اما اگر داوری همتا کارآیی ندارد، ارزش این برند چیست؟ چرا صرفاً اجازه ندهیم که پژوهشگران کارشان را عمومی کنند و بگذاریم شکوفا یا تباه شوند؟
این رویکرد بهلطف سرورهای نسخۀ پیش از انتشار۱۲ امکانپذیر است. اینها منابع آنلاینیاند که مقالهها میتوانند بدون داوری همتا در آنها منتشر شوند، هرچند اکثرشان مقالات را برای انتحال، مخاطرات سلامتی و امنیتی و اقتضای عمومی بررسی میکنند. انتشار مطالعات، در قالب نسخههای پیش از انتشار، مدتهاست که در بسیاری از حوزههای فیزیک و ریاضی عرف است، تقریباً هرآنچه در این زمینه در نشریات وجود دارد قبلاً در سایتی به نام arXiv («آرشیو») انتشار یافتهاند – به رایگان، در شکلی داورینشده اما اکثراً بسیار شبیه به داوریشده.
زیستشناسان در ابتدا برای انتشار نسخههای پیش از انتشار کُندتر بودند، تاحدی به این خاطر که نگران بودند که روکردن دستشان کار را برای بقیه راحتتر کند که مقالهای داوریشده در یک نشریه چاپ کنند. این بیمیلی پیش از این، یعنی قبل از سال ۲۰۲۰، کمکم داشت رنگ میباخت، اما همهگیری کووید۱۹ نگرشها را دگرگون کرد. الزام به درمیانگذاشتن یافتهها، با حداکثر سرعت و فراگیری ممکن، بهاینخاطر که دیگران نیز بتوانند آنها را بیازمایند و از آنها استفاده کنند جای بحث ندارد.
این کارکرد علم به همان شیوهای است که بسیاری خواهان آن هستند: سریع، آزاد، اشتراکی و متمرکز بر نفع عمومی. ایرادی وجود دارد: سرورهای نسخههای پیش از انتشار و نشریات زیر آوار مقالههای سرهمبندیشدهای گرفتار آمدهاند که، با عجله، برای سوارشدن بر قطار کووید۱۹ فرستاده شده بودند. اگر دانشمندان تنها کسانی باشند که این آثار را میخوانند، این مشکل بزرگی نیست. اما در طی سال گذشته، روزنامهنگاران، بیماران، خلوچلها و هرکس دیگری که علاقهای داشته در حال نظارۀ سرورها بوده است و آنها همیشه فرق بین نسخۀ پیش از انتشار و مقالۀ داوریشده را نمیفهمند.
درنتیجه، برخی مقالههایی که احتمال زیادی نداشت که به نشریهای راه پیدا کنند سروصدای زیادی به پا کردند. مثلاً ژانویۀ سال گذشته مقالهای روی سرور bioRxiv ظاهر شد که از آزمایشگاه ارجمند کولد اسپرینگ هاربور در لانگ آیلند بیرون آمده بود، با این مدعا که «شباهت مرموزی» میان سارسکوو۲ و اچآیوی وجود دارد که «بعید است تصادفی باشد». این به بحثهای داغی دامن زد مبنیبراینکه ویروس کرونا یک سلاح زیستی مهندسیشده است.
این مقاله اکنون حامل برچسب قرمز «پسگرفتهشده» است، اما هنوز بهسادگی یافته میشود و خواندنش رایگان است (برای حفظ یکپارچگی متون، مقالههای پسگرفتهشده معمولاً پاک نمیشوند). ماه بعد، مجری شبکۀ فاکس نیوز، تاکر کارلسن، به نسخۀ پیش از انتشاری که در ریسرچگیت منتشر شده بود ارجاع داد، نوشتهای که مدعی بود بازار ترهبار ووهان که ظن آن میرود که خاستگاه شیوع بوده باشد نزدیک به یک آزمایشگاه پژوهشی ویروس کروناست. نویسنده بعداً آن را از سایت برداشت و به وال استریت ژورنال گفت که «برهان آشکاری مؤید آن نبوده است»، کارلسن گفت که روی این مقاله «سرپوش گذاشتهاند».
این مشکل محدود به نسخههای پیش از انتشار نیست: بسیاری از نشریات مطالعاتی مربوط به کووید۱۹ را پس گرفتهاند که داوری همتا را پشت سر گذاشته و منتشر شده بودند. علم نیز همواره در معرض سوءاستفاده بوده است؛ محدودکردن دسترسی به آن، اگر ممکن بود، به این مسئله خاتمه نمیداد. اما مقالهها، خواه مقالههای نشریات یا نسخههای پیش از انتشار، کماکان مهمترین واسطه میان پژوهش علمی و جامعۀ وسیعترند. این ظرفیت مضاعف برای اشاعۀ برقآسای تفسیرهای فریبآمیز از مقالات علمی به پژوهشگران دلیلِ خوبِ دیگری میدهد تا برای کارشان زحمت بکشند.
اطلاعات کتابشناختی:
Ritchie, Stuart. Science Fictions: Exposing Fraud, Bias, Negligence and Hype in Science. Bodley Head, 2020
پینوشتها:
- این مطلب را جان ویتفیلد نوشته و در تاریخ ۷ اکتبر ۲۰۲۱ با عنوان «REPLICATION CRISIS» در مجلۀ لندن ریویو آو بوکس منتشر شده است. و برای نخستینبار با عنوان «بحرانِ تکرار» در بیستودومین شمارۀ فصلنامۀ ترجمان علوم انسانی با ترجمۀ علی امیری منتشر شده است. وب سایت ترجمان آن را در تاریخ ۲۵ اردیبهشت ۱۴۰۱با همان عنوان منتشر کرده است.
•• جان ویتفیلد (John Whitfield) از سال ۲۰۱۲ ویراستار نظرات در وبگاه ریسرچ پروفشنال نیوز است. او تا کنون دو کتاب نوشته است با عناوین دهان مردم را نمیتوان بست: علم شگفتآور اشتهار (People Will Talk: the surprising science of reputation) و در تپش یک قلب: زندگی، نیرو و وحدت طبیعت (In the Beat of a Heart: life, energy and the unity of nature).
[۱] The Lancet نام یکی از نشریات معتبر علمی نیز است [مترجم].
[۲] Impact factor
[۳] skewe
[۴] Peer review
[۵] spreadsheet
[۶] reproducibility
[۷] Random variation
[۸] HARKing
[۹] paywall
[۱۰] Public Library of Science
[۱۱] PLOS One
[۱۲] preprint
انتهای پیام