بحرانِ تکرار

مروری بر کتاب دروغ‌های علمی: افشای تقلب، سوگیری، بی‌دقتی و غلو در علم

۷ تیر ۱۴۰۳

۰ زمان تقریبی مطالعه 15 دقیقه

جان ویتفیلد، مطلبی با عنوان «REPLICATION CRISIS» در مجلۀ لندن ریویو آو بوکس نوشته است که با ترجمه‌ی علی امیری در سایت ترجمان منتشر شده است. متن کامل را در ادامه بخوانید.

«امروزه میزان موفقیت یک پژوهشگر، تا حد زیادی، وابسته به سابقۀ انتشار اوست: نامش را پای چند مقاله گذاشته، آثارش را در کدام نشریات منتشر کرده، سایر مقاله‌ها چند بار به مقاله‌هایش ارجاع داده‌اند؟ این امر نظامی آفریده که طرف‌دار سرعت انتشار، حجم زیاد تولید و جنجال‌طلبی است. عجله برای انتشار و فشاری که برای جلب‌توجه وجود دارد پژوهشگران را به‌سوی راه‌های میان‌بر و دوز و کلک سوق می‌دهد. استورات ریچی، روانشناس و گزارشگر علم، در کتاب جدیدش، دروغ‌های علمی، مشکلات سازوکارهای رایج برای انتشار مقالات علمی و دانشگاهی را بررسی می‌کند.

جان ویتفیلد، لندن ریویو آو بوکس— روزنامۀ چاینا دیلی در ماه نوامبر سال ۲۰۱۷ گزارشی منتشر کرد دربارۀ رستورانِ باربیکیویی در پکن. این رستوران لیویه‌دائو («نیشتر»۱) نام داشت و به مشتریانی تخفیف می‌داد که می‌توانستند ثابت کنند، اخیراً، در نشریه‌ای علمی مقاله منتشر کرده‌اند. این رستوران ضریبِ تأثیرِ۲ -آماری براساس تعداد میانگین ارجاعاتی که مقاله‌های منتشره در مجله، طی دو سال پس از انتشار، دریافت می‌کنند- نشریه را می‌گرفت و آن را تبدیل به معادلی نقدی می‌کرد تا از صورت‌حساب کاسته شود.

ضریب تأثیر در دهۀ ۱۹۶۰ ابداع شده بود تا کمکی باشد برای کتابدارهای دانشگاهی، تا بتوانند در این باره تصمیم بگیرند که از کدام نشریات در مجموعه‌شان نگه‌داری کنند. این معیاری معقول برای قوت نشریه‌هاست. اما توزیع ارجاعاتْ اریب۳ است: اکثر ارجاعات به خاطر کسر کوچکی از مقاله‌هاست، درحالی‌که ارجاع به اکثر مقاله‌ها، اگر هم ارجاعی داده شده باشد، اندک است. بنابراین ضریب تأثیر کاربردِ چندانی، به‌منزلۀ راهنمای کیفیت مقاله‌ای خاص، ندارد: هیچ‌کس نباید مقالۀ علمی را براساس نشریه‌ای که در آن چاپ می‌شود قضاوت کند.

بیشتر افرادی که در حوزۀ پژوهش کار می‌کنند این را می‌دانند، اما ازآنجاکه فهم مقاله‌های علمی برای غیرمتخصصان دشوار است، و چون باخبرماندن از تمام متون مربوطه سخت است، مقاومت دربرابر وسوسۀ ارزیابی آثار علمی به‌وسیلۀ معیاری واحد و ساده، هرچند من‌درآوردی، سخت است. درنتیجه، ضریب تأثیر بدل به شاخص اعتبار شده است. مقاله‌ای که در لَنسِت با ضریب تأثیر کنونی ۶۰ منتشر می‌شود، حتی پیش‌ازآنکه کسی آن را بخواند، ارزشی بسیار بیشتری دارد از مقاله‌ای که در عرضه‌گاهی تخصصی همچون کلینیکال ژنتیکس، با ضریب تأثیر ۴.۴، منتشر می‌شود. تعجبی ندارد که این مسئله مؤثر باشد بر اینکه پژوهشگران کار خود را به کجا ارائه دهند.

استخدام‌شدن پژوهشگر و جایی که در آن مشغول به کار می‌شود، تا حد زیادی، وابسته به سابقۀ انتشار اوست: نامش پای چند مقاله هست، آثارش را در کدام نشریات منتشر کرده، سایر مقاله‌ها چند بار به مقاله‌هایش ارجاع داده‌اند؟ این امر نظامی آفریده که طرف‌دار سرعت انتشار، حجم [زیاد] تولید و -ازآنجاکه نشریاتْ یافته‌های جدید و چشم‌گیر را به نتایج منفی یا تکرار آثار قبلی ترجیح می‌دهند- جنجال‌طلبی است. مشوق‌های مالی نیز ممکن است وجود داشته باشند. زمانی که گزارش تخفیف باربیکیو انتشار یافت، بسیاری از دانشگاه‌های چین بابت مقالات جوایز نقدی می‌دادند، به این صورت که نشریاتی که ضریب بالاتری داشتند ضامن پاداش‌های بیشتر برای پژوهشگران بودند. در بررسی خط‌مشی‌های دانشگاه‌های چین در سال ۲۰۱۶، میانگین پاداش برای نویسندۀ اصلی مقاله‌ای در نیچر یا ساینس ۴۴ هزار دلار محاسبه شده بود، یعنی پنج برابر میانگین حقوق استادی.

داوریِ همتا۴ صورت اصلی کنترلِ کیفیتِ پیش از انتشار در حوزۀ علم است. سردبیران نشریه مقالات ارائه‌شده را معمولاً برای دو نفر از کارشناس‌ها می‌فرستند. وظیفۀ آن‌ها قضاوت دراین‌باره است که آیا روش‌ها، داده‌ها و تحلیل‌های مطالعه مستدل است یا نه، و آیا شواهد مؤید مدعیات نویسنده است؟ گزارش‌های (اغلب اوقات ناشناس) آن‌ها اعتبار و اهمیت اثر را ارزیابی کرده و چگونگی بهبود آن را پیشنهاد می‌دهند و توصیه به رد یا قبول آن، معمولاً، همراه با اصلاحات موردنیاز می‌کنند. یافتن داوران روزبه‌روز سخت‌تر می‌شود، زیرا آن‌ها عموماً پولی دریافت نمی‌کنند یا به‌طرق دیگر اعتباری نصیبشان نمی‌شود و باید این کار را در دل تدریس، پژوهش و مسئولیت‌های اداری خود بگنجانند.

بررسی تمام روش‌ها و تحلیل‌های یک مقاله، حتی در چندین ساعتی که سرهم‌کردن یک داوری معمولی زمان می‌برد، تقریباً غیرممکن است. همین مسئله دربارۀ کشف خطاهای ساده ازقبیل عدد اشتباهی که در صفحۀ گسترده۵ تایپ شده یا اشتباه در کشت سلولی نیز صادق است، چه برسد به داده‌های ساختگی و تقلبی. درنتیجه داوران و نشریات، درنهایت، اساس خیلی چیزها را بر صداقت می‌گذارند. حتی داوری دقیق نیز ناسازگار است، زیرا ممکن است داوران دربارۀ شایستگی‌های مقاله با هم تفاهم نداشته و سوگیری‌های فکری و اجتماعی خود را داشته باشند.

استوارت ریچی در کتاب دروغ‌های علمی مشکلات این نظام را بررسی می‌کند. این کتاب شرح مفیدی است از دَه سال یا بیشتر مباحثه، عمدتاً در حلقه‌های تخصصی، دربارۀ بازتولیدپذیری۶، اصلی که می‌گوید یکی از اهداف مقالۀ علمی این است که امکان انجام همان کار را برای سایرین فراهم کند، و اینکه یکی از آزمون‌های اعتمادپذیریِ آن این است که آن‌ها هم همان نتایج را بگیرند. در دهه‌های اخیر، کوشش‌های گسترده‌ای برای تکرار در چندین حوزه وجود داشته، اما چنانچه نتوان آزمایشی را تکرار کرد، لاجرم بدین معنا نیست که اثر اصلی فاقد صلاحیت است. کار در خط مقدمِ یک رشته دشوار است و دستانِ ماهرْ عاملی قدرنادیده در موفقیت علمی است.

برخی مشاهده‌ها دقیقاً به این دلیل درخور توجه‌اند که نامعمول یا متکی به زمینه‌شان هستند. گاه، انجام آزمایشی یکسان و گرفتن نتیجه‌ای متفاوت نکتۀ مفیدی را آشکار می‌کند. با همۀ این‌ها، یافته‌های این مطالعات گسترده برای تکرار نتیجه نفت بر آتشِ این درکِ فراگیر ریخته است که علم دارد براساس معیارهای خودش شکست می‌خورد: کوششی در زیست‌شناسیِ سرطان توانست تنها شش مطالعه از بین ۵۳ مطالعه را تکرار کند؛ در روان‌شناسی حدود ۵۰ درصد از مطالعات را نمی‌توان تکرار کرد؛ در اقتصاد، حدود ۴۰ درصد. در سال ۲۰۱۶، نیچر از پژوهشگران تمام علوم طبیعی نظرسنجی کرد و دریافت که بیش از نیمی از پاسخ‌دهندگان از تکرار کار خود عاجز بوده‌اند، هرچند کمتر از یک‌سوم آن‌ها این ناکامی را برهان قاطع نادرستیِ آن مطالعه تلقی کرده‌اند.

در یک سوی بحرانِ تکرار، آن‌طور که برملا شده، تقلب‌های خارق‌العاده‌ای وجود دارد. در نخستین سال‌های قرن جدید، هوآنگ ووسوک، زیست‌شناس اهل کرۀ جنوبی، بابت شبیه‌سازی سلول‌های بنیادی انسان به قهرمانی ملی تبدیل شد؛ تنها چند سال پیش از آن، یان هندریک شون، دانشمند علم مواد، بابت مقاله‌هایی که اجزایِ الکترونیکی را در مقیاس مولکولی تشریح می‌کردند لایق دریافت جایزۀ نوبل دانسته می‌شد. هر دو نفر نتایجشان را سر هم کرده بودند. در نظرسنجی‌ها، حدود دو درصد از پژوهشگران به جعل داده اعتراف می‌کنند، هرچند تعداد بیشتری از آن‌ها شک دارند به اینکه همکارانشان این کار را می‌کنند. اما احتمالاً تخلفات عمدی مسئولِ تنها بخش کوچکی از علمِ اعتمادناپذیرند. دغدغۀ بزرگ‌تر این است که عجله برای انتشار و فشاری که برای جلب‌توجه وجود دارد پژوهشگران را به‌سوی راه‌های میان‌بر و دوز و کلک سوق می‌دهد: حقه‌بازی‌های سطح‌پایینی که به‌مرحلۀ تقلب نمی‌رسند، اما اعتمادپذیری را تضعیف می‌کنند.

همان‌طور که ریچی نشان می‌دهد، تک‌تک بخش‌های مقالۀ علمیِ استانداردْ منبع بالقوۀ اشکال است. بسیاری از پژوهشگران روش‌هایشان را چنان سربسته شرح می‌دهند که تکرار آن‌ها برای دیگران غیرممکن است. زبان بحث‌ها و چکیده‌ها روز به روز مبالغه‌آمیزتر شده است: بین سال‌های ۱۹۷۴ تا ۲۰۱۴، نسبت مقاله‌هایی که یافته‌هایشان را نوآورانه، مستحکم، بی‌سابقه، پیش‌گامانه و غیره وصف می‌کنند بیش از هشت برابر شده است. اما اوج بحرانِ تکرار شیوۀ ارائه و تحلیل نتایج است. شاید دلایل مشروعی برای کنارگذاشتن اندازه‌ای خاص یا مرتب‌کردن یک تصویر وجود داشته باشد، اما این هم درست است که اگر، آگاهانه یا غیر از آن، کاری از این دست انجام دهید تا نتایجتان را به‌سمت نتیجۀ مطلوب خود هدایت کنید، احتمال لورفتنتان کم است.

بعضی از مشکلاتْ خاصِ رشته‌های بخصوصی هستند. در زیست‌شناسی سرطان، مقاله‌های بی‌شماری برپایۀ مطالعاتی‌اند که از کشتِ سلولیِ آلوده یا به‌اشتباه شناسایی‌شده استفاده می‌کنند. ظهور فوتوشاپ تشخیص اینکه چه زمانی تصاویرِ فرایندهای مولکولی و مولکول‌های ژنتیکیْ اصلاح، تکثیر، متصل یا به‌نحو دیگری دست‌کاری شده‌اند را سخت کرده است. سایر مشکلات در بین رشته‌های زیادی مشترک است. استفاده از آمار دغدغه‌ای عمومی است. از روش‌های آماری برای تحلیل الگوها درون داده‌ها، با نگاهی به جداسازی تغییر تصادفی۷ از دلایل بنیادین، استفاده می‌شود. معمولاً، وقتی نتیجه‌ای تجربی ازلحاظ آماری معنادار توصیف شده باشد به این معناست که آزمونی آماری نشان داده که احتمالی کمتر از پنج درصد وجود دارد که تفاوت میان آن نتیجه و مثلاً نتیجۀ متناظر در آزمایش کنترل را بتوان به تغییر تصادفی نسبت داد.

تعداد بسیار زیادی آزمون آماری گوناگون وجود دارد که هر یک برای طرح سؤالی خاص دربارۀ نوع خاصی از داده مناسب‌اند. نرم‌افزارهای رایانه‌ای اجرای چنین آزمون‌هایی را بدون دردسر و بدون کوچک‌ترین دانشی از بنیان‌های ریاضی‌شان ممکن می‌سازند.این باعث می‌شود به‌آسانی از آزمودن یک فرضیه دور شویم و به جست‌وجوی الگوهای نامحتمل در داده برویم. هرچه آزمون‌های بیشتری انجام دهید، بیشتر احتمال دارد نتیجه‌ای بگیرید که زیر آستانۀ پنج درصدی باشد. آنگاه می‌توانید مطالعه را طوری بنویسید که انگار تمام مدت دنبال همین بوده‌اید. به این کار می‌گویند صید داده یا هارکینگ۸: فرضیه‌بافی پس از مشخص‌شدن نتایج.

سایر گونه‌های صید داده عبارت‌اند از ادامه‌دادن به جمع‌آوری داده تا زمانی‌که چیزی از لحاظ آماری معنادار پیدا کنید و کنارگذاشتن داده‌های پرت یا سایر اندازه‌ها به این دلیل که آمارتان را به هم می‌ریزند. بین یک سوم تا نیمی از دانشمندان به انجام کاری در همین مایه‌ها اذعان دارند. دیگر روال‌های فراگیر عبارت‌اند از تقسیم مطالعات برای به‌دست‌آوردن حداکثر مقالات ممکن و بازیافت برش‌هایی از آثار قدیمی در مقاله‌های جدید.

تأمین بودجه نیز سوگیری به‌نفع نتایج مثبت را سبب شده است: مثلاً آزمایش‌ها و کارآزمایی‌هایی که صنعت داروسازی پولشان را می‌دهد گرایش بیشتری به نشان‌دادن نتایج مثبت دارند تا مطالعات هم‌ترازی که بودجه‌شان را دولت‌ها یا سازمان‌های خیریه تأمین می‌کنند. سوگیری به‌نفع نتایج مثبت چیزی است که به خود استمرار می‌بخشد: هنگامی‌که سه‌چهارم یا بیشتر مقاله‌های منتشره خبر از یافته‌های مثبت می‌دهند، برای احتراز از نتایج منفی، یا امتناع از نوشتن آن‌ها، انگیزه‌ای قوی وجود دارد.

نگرانی این است که انگیزه‌های انحرافی طوری تیشه به ریشۀ فرایندهای علمی زده باشند که دیگر به‌سختی می‌دانیم چه چیز را باید باور کنیم. این بحران به‌خصوص به روان‌شناسی، رشتۀ شخصِ ریچی، و زیست‌پزشکی سخت آسیب رسانده است. این‌ها حوزه‌هایی شلوغ و رقابتی‌اند که در آن‌ها گروه‌های پژوهشی از سراسر دنیا با یک‌دیگر مسابقه می‌دهند تا دربارۀ داغ‌ترین موضوعات چیزی منتشر کنند. در چنین شرایطی، عجله می‌تواند بر دقت غلبه کند. داده‌ها در این حوزه‌ها معمولاً پرحاشیه‌اند و امکان تفسیر و دستکاری در ارائه و تحلیل را می‌دهند، و به احتمال زیاد، تخصصِ ریاضیِ روان‌شناسان و زیست‌شناسان از همکارانشان در علوم فیزیکی کمتر است.

هرچند شاید این حوزه‌ها بیش از آنچه سزاوارش هستند زیر ذره‌بین قرار گرفته باشند: انجام مجدد آزمایشی در آزمایشگاه از مثلاً مطالعه‌ای میدانی دربارۀ رفتار جانوری آسان‌تر است. در همین حال، پژوهش در روان‌شناسی، سلامت و دارو درجۀ نامعمولی از نکته‌سنجی را نیز جلب می‌کند، زیرا نتایج آن می‌تواند اثرات مستقیم بر زندگی روزمرۀ ما داشته باشد. وقتی مدرسه‌ها روندهای آموزشی‌شان را براساس آزمایش‌های روان‌شناسی کودک بنا می‌نهند یا روزنامه‌های جنجالی گزارش‌های وحشتناکی دربارۀ مواد غذایی عادی، تنها برپایۀ یک مطالعه، منتشر می‌کنند، تکرارپذیربودن پژوهش اصلی اهمیت دارد.

نرخ بازتولیدپذیریِ حدود ۵۰‌درصدی در زیست‌پزشکی برابر است با پول زیادی که خرج کارهای اعتمادناپذیر شده است -بنابر مطالعه‌ای از سال ۲۰۱۵، سالانه ۲۸ میلیارد دلار فقط در ایالات متحده. شرکت‌های دارویی بخشی از گناهِ پیشرفت کُند و هزینه‌های گزاف توسعۀ دارویی را به گردن اعتمادناپذیری پژوهش‌های پایه می‌اندازند. بیش از ۹۰ درصد ترکیبات شیمیایی که به‌عنوان داروهای بالقوه شناسایی می‌شوند از رسیدن به کارآزمایی بازمی‌مانند؛ در سال ۲۰۱۱، شرکت بایر دوسومِ پروژه‌هایش را متوقف کرد، زیرا دانشمندان سازمانی‌اش نمی‌توانستند نتایج گزارش‌شده در متون را بازتولید کنند.

همۀ این‌ها به اندازۀ کافی بد هست، باوجوداین، بازتولیدپذیری تنها یکی از چندین مشکل متقاطعی است که از رقابت بیش از پیش سهمگین برای منابع و اعتبار در علم ناشی می‌شود. تضمین این هر دو سخت‌تر شده است، زیرا شمار افرادی که در حوزۀ پژوهشکار می‌کنند رشدی سریع‌تر از منابع مالی یا مشاغل دائمی داشته است. ساینس کمتر از هفت درصد از مقالات ارائه‌شده‌ای را که دریافت می‌کند منتشر می‌کند -این برای نشریات معتبر عادی است- درحالی‌که تقریباً سه‌چهارم درخواست‌های کمک‌هزینۀ پژوهشی رد می‌شوند.

ازآنجاکه انتشار در نشریه‌های با ضریب تأثیر بالا معیار قاطع موفقیت است، بر اینکه چه پژوهشی انجام شود، و چگونگی انجام آن، مؤثر است. اثری که معطوف به مسئله‌ای محلی باشد دست‌کم گرفته می‌شود، به‌ویژه اگر به زبانی غیر از انگلیسی منتشر شده باشد؛ همچنین رویکردهای بینارشته‌ای و نامتعارف به عرضه‌گاه‌های کمتر مشهود و فرودست‌تر تنزل یافته‌اند. در همین حال، معتبرترین نشریه‌ها جریان غالب را در حوزه‌های خود اشغال -درواقع، تعیین- می‌کنند.

فشار برای تولید انبوهِ خودکارِ مقاله‌ها محرک فرهنگ اضافه‌کاری -و در مواری قلدری- نیز است که بیشترین فشار آن بر پژوهشگران تحصیلات تکمیلی و پسادکتری وارد می‌شود. این‌ها افرادی‌اند که، درحقیقت، بیشترین میزان کار آزمایشگاهی و میدانی را انجام می‌دهند؛ بیشترشان بورسیه‌اند یا قراردادهایی بین سه تا پنج سال دارند و توانایی‌شان برای ساختن سابقۀ انتشار به‌شدت وابسته است به حمایت پژوهشگران ارشدی که در آزمایشگاه‌هایشان کار می‌کنند. هیچ‌کدام از این موارد کمکی به ترویجِ تنوعِ چشم‌انداز در نیروی کار علمی یا رویارویی با سوگیری‌ها نمی‌کند. اگر محیطی به‌شدت رقابتی کمک کرده تا بهترین آثار به صدر بر‌کشیده شوند، ممکن است دلیلی برای توجیه این معضل وجود داشته باشد. برای نمونه، شاید فکر کنید نظامی که می‌تواند در کمتر از یک سال به چندین واکسن بسیار مؤثر برای بیماری جدیدی دست یابد، بالاخره، باید حُسنی هم داشته باشد.

شاید این‌طور باشد، اما اکثر پژوهش‌ها، برخلاف کار دربارۀ کووید۱۹، مجبورند برای بودجه و توجه مبارزه کنند. پژوهشگر زیردستی که مورد عتاب رئیسش واقع شده و قراردادی روبه‌اتمام دارد ممکن است وسوسه شود تا میان‌بر بزند. بدنه‌های تأمین بودجه‌ای که نرخ موفقیت پایینی دارند رو به سوی پروژه‌های کم‌خطرِ کوتاه‌مدت می‌آورند. حتی هنگامی‌که علم اعتمادپذیر است، دانشی که تولید می‌شود ممکن است پیش‌پاافتاده باشد.

دربارۀ اینکه باید برای حل این مشکلات کاری کرد تفاهم فراگیری وجود دارد. بدنه‌های تأمین بودجه و دولت‌ها میل فزاینده‌ای به عمل در مقام تنظیم‌گر از خود نشان می‌دهند. در فوریۀ سال ۲۰۲۰، دولت چین اصلاحاتی در پیش گرفت، ازجمله ممنوعیت مشوق‌های نقدی برای مقالات، فاصله‌گرفتن از استفاده از ضریب‌های تأثیر در استخدام و ارتقا و این شرط که پژوهشگران، دست‌کم، یک‌سوم آثارشان را در نشریات داخلی منتشر کنند. در بریتانیا، دولت با تأمین‌کنندۀ اصلی بودجۀ پژوهش همگانی، یعنی سازمان پژوهش و نوآوری بریتانیا، در کنار بدنه‌های مؤثری مثل جامعۀ سلطنتی و بنیاد ولکام همکاری می‌کند تا فرهنگ پژوهش را بهبود بخشد.

یکی از پیشنهادها این است که استقبال بیشتری از تمام کارهای دانشمندان به‌جز تولید مقاله بشود، کارهایی ازقبیل نوشتن کُدهای رایانه‌ای، ارائۀ مشاورۀ سیاست‌گذاری، برقراری ارتباط با عموم مردم و همکاری با شرکت‌ها و گروه‌های جامعۀ مدنی. همچنین، با توجه به اینکه تقریباً تمام پژوهش‌ها اکنون گروهی است، رفته‌رفته تمرکزِ ارزیابی از دستاورد فردی به‌جانب دستاوردهای تیم‌ها و مؤسسات حرکت می‌کند.

در این اثنا، بیش از پنجاه دانشگاه در شبکۀ بازتولیدپذیری بریتانیا ثبت نام کرده‌اند که ابتکارعملی است از پایین به بالا برای بهبود آموزش و روش‌های پژوهشگران بریتانیایی. نشریات، ازطریق ملزم‌کردن نویسنده‌ها به قراردادن داده‌های خامشان در دسترس عموم، و نه صرفاً گزارش تحلیل‌هایشان، کار بررسی مقاله‌ها را برای دیگران راحت‌تر کرده‌اند. در تلاش برای کاستن از وسوسۀ صید داده، بسیاری از نشریات شروع کرده‌اند تا به پژوهشگران اجازه دهند، پیش از شروع به کار، فرضیاتشان را به‌همراه برنامه‌های آزمایش و تحلیل‌هایی که قصد انجامشان را دارند ارائه دهند. تلاش‌هایی در سطوح ملی و بین‌المللی می‌شود برای حصول اطمینان از اینکه نتایج تمام کارآزمایی‌های بالینیْ عمومی می‌شوند تا از پنهان‌ساختن نتایج منفی جلوگیری شود. و اکنون، ابزارهای خودکاری در دسترس‌اند که می‌توانند به تشخیص خطاها در داده‌ها و تصاویر کمک کنند.

همۀ این‌ها مغتنم است، اما مسئله‌ای که صاحب‌منصبان علاقۀ کمی به پرداختن به آن نشان داده‌اند چگونگی کاستن از اتکای این نظام به قراردادهای کوتاه‌مدتی است که تعدادشان بسیار بیشتر از مشاغل دائمی در حوزۀ پژوهش است که توسط بودجۀ عمومی تأمین مالی می‌شوند. آیا افزایش امنیت شغلی برای پژوهشگران، در زمانه‌ای که تدریس در دانشگاه‌ها دارد بیش از همیشه متزلزل می‌شود، اصلاً امکان‌پذیر است؟ پرسش مشابهی را می‌توان مطرح کرد دربارۀ توانایی دانشگاه‌ها برای مقاومت دربرابر نیروهایی که محرک رقابت در پژوهش‌اند. آیا هیچ مؤسسه یا ملتی توانایی کناره‌گیری یک‌جانبه را دارد؟ چه اتفاقی می‌افتد اگر دانشگاه‌های خوب شروع به سقوط در رده‌بندی‌های بین‌المللی کنند، رده‌بندی‌هایی که تاحدی براساس تعداد مقالات و ارجاعات است؟

اصلاحات انجام‌گرفته از این دست در انتشارات دانشگاهی از هر جای دیگر مشهودتر است. از دید دانشمندان، به‌لحاظ تاریخی، بزرگ‌ترین شرکت‌هایِ انتشاراتیِ انتفاعی کارِ بی‌مزد و مواجب آن‌ها در مقام نویسنده و داور را گرفته و برای خواندن نتایج پول کلانی از آن‌ها گرفته‌اند. الزویر، بزرگ‌ترین شرکت از این میان، در سال ۲۰۱۹ حاشیۀ سودی برابر با ۳۷ درصد داشت.

جنبش دسترسی آزاد که حوالی آغاز قرن توسط دانشمندان عمل‌گرا شروع شده این استدلال اخلاقی را می‌آورد که خواننده‌ها نباید مجبور باشند برای دیدن نتایج علمی، که پول آن قبلاً از بیت‌المال پرداخت شده، پول بدهند، و نیز این استدلال عملی که مقاله‌هایی که آزادانه در دسترس‌اند را آسان‌تر می‌توان اعتبارسنجی کرد و سنگ‌بنا قرار داد. این جنبش دست‌کم در اروپا پیشرفت زیادی کرده است، جایی‌که اتحادیۀ اروپا و بسیاری دیگر از تأمین‌کنندگان بودجه، ازجمله سازمان پژوهش و نوآوری بریتانیا و ولکام، اینک دیوار پرداخت۹ برای مقالاتی که حاصل کمک‌هزینه‌های خودشان بوده است را برداشته‌اند.

نشریات چاپی همیشه گزینش‌گر بوده‌اند، زیرا شمار صفحاتشان محدود است. آن‌ها بنا به سنت در پی آن بوده‌اند که نه تنها مستدل‌بودن مقاله، بلکه اهمیت یافته‌های آن را نیز قضاوت کنند. بسیاری از آن‌ها هنوز این کار را می‌کنند، این بخشی از اصالت آن‌هاست. اما درحالی‌که اکثر نشریات دارند به‌کلی آنلاین می‌شوند، فضا دیگر دغدغه نیست. طی بیست سالی که از آغاز جنبش دسترسی آزاد می‌گذرد، مدل تجاری جدیدی سر برآورده است که، در آن، فروش اشتراک جای خود را به حق انتشاری داده است که از نویسنده طلب می‌شود.

ما شاهد ظهور اَبَرنشریاتی با دسترسی آزاد بوده‌ایم که از داوران می‌خواهند اعتبار نتایج، ولی نه اهمیت آن‌ها را داوری کنند و تمام ارائه‌ها، ازجمله تکرارها و یافته‌های منفی، را می‌پذیرند. این رویکرد بی‌عیب‌ونقص نیست؛ در سال ۲۰۱۶، ابرنشریۀ کتابخانۀ عمومی علم۱۰ به نام پلوس وان۱۱، که در حال حاضر حق انتشاری معادل ۱۶۹۵ دلار به ازای هر مقاله مطالبه می‌کند، مطالعه‌ای منتشر کرد که اعلام می‌کرد دست انسان نشانۀ «طراحی صحیح خالق» است. اما این مدل هم در میان پژوهشگرانی که راهی نسبتاً سریع، بی‌درد سر و ارزان به انتشار می‌یابند و هم ناشرانی که درآمد ثابتی کسب می‌کنند محبوب است.

ضریب تأثیر پلوس وان تنها ۲.۷ است. ریچی می‌نویسد «در حالت ایدئال، آنچه دوست داریم ببینیم نسبت دقیقی از نتایج باطل و تکرارهای نافرجامِ بیشتر در نشریات مسحورکننده با ضریب بالاست». اما بدیهی است که آن «نشریات مسحورکننده» باید جایگاه خود را حفظ کنند. می‌توان استدلال کرد که صنعت نشر عالمانه تعمیرشدنی نیست و وضع ما بدون نشریات بهتر است -شاید حتی بدون داوری همتای پیش از انتشار. دیگر برای حروف‌چینی و توزیع به ناشران نیازی نیست و شبکه‌های اجتماعی -ازجمله سایت‌های تخصصی مانند ریسرچ‌گیت که بیش از ۱۷ میلیون کاربر دارد- می‌توانند بخشی از مدیریت و بازاریابی آن‌ها را انجام دهند.

آنچه از ارزش این نشریات باقی می‌ماند در برند آن‌ها و ظرفیتشان برای سامان‌دهی داوری همتا نهفته است. اما اگر داوری همتا کارآیی ندارد، ارزش این برند چیست؟ چرا صرفاً اجازه ندهیم که پژوهشگران کارشان را عمومی کنند و بگذاریم شکوفا یا تباه شوند؟

این رویکرد به‌لطف سرورهای نسخۀ پیش از انتشار۱۲ امکان‌پذیر است. این‌ها منابع آنلاینی‌اند که مقاله‌ها می‌توانند بدون داوری همتا در آن‌ها منتشر شوند، هرچند اکثرشان مقالات را برای انتحال، مخاطرات سلامتی و امنیتی و اقتضای عمومی بررسی می‌کنند. انتشار مطالعات، در قالب نسخه‌های پیش از انتشار، مدت‌هاست که در بسیاری از حوزه‌های فیزیک و ریاضی عرف است، تقریباً هرآنچه در این زمینه در نشریات وجود دارد قبلاً در سایتی به نام arXiv («آرشیو») انتشار یافته‌اند – به رایگان، در شکلی داوری‌نشده اما اکثراً بسیار شبیه به داوری‌شده.

زیست‌شناسان در ابتدا برای انتشار نسخه‌های پیش از انتشار کُندتر بودند، تاحدی به این خاطر که نگران بودند که روکردن دستشان کار را برای بقیه راحت‌تر کند که مقاله‌ای داوری‌شده در یک نشریه چاپ کنند. این بی‌میلی پیش از این، یعنی قبل از سال ۲۰۲۰، کم‌کم داشت رنگ می‌باخت، اما همه‌گیری کووید۱۹ نگرش‌ها را دگرگون کرد. الزام به درمیان‌گذاشتن یافته‌ها، با حداکثر سرعت و فراگیری ممکن، به‌این‌خاطر که دیگران نیز بتوانند آن‌ها را بیازمایند و از آن‌ها استفاده کنند جای بحث ندارد.

این کارکرد علم به همان شیوه‌ای است که بسیاری خواهان آن هستند: سریع، آزاد، اشتراکی و متمرکز بر نفع عمومی. ایرادی وجود دارد: سرورهای نسخه‌های پیش از انتشار و نشریات زیر آوار مقاله‌های سرهم‌بندی‌شده‌ای گرفتار آمده‌اند که، با عجله، برای سوارشدن بر قطار کووید۱۹ فرستاده شده بودند. اگر دانشمندان تنها کسانی باشند که این آثار را می‌خوانند، این مشکل بزرگی نیست. اما در طی سال گذشته، روزنامه‌نگاران، بیماران، خل‌وچل‌ها و هرکس دیگری که علاقه‌ای داشته در حال نظارۀ سرورها بوده است و آن‌ها همیشه فرق بین نسخۀ پیش از انتشار و مقالۀ داوری‌شده را نمی‌فهمند.

درنتیجه، برخی مقاله‌هایی که احتمال زیادی نداشت که به نشریه‌ای راه پیدا کنند سروصدای زیادی به پا کردند. مثلاً ژانویۀ سال گذشته مقاله‌ای روی سرور bioRxiv ظاهر شد که از آزمایشگاه ارجمند کولد اسپرینگ هاربور در لانگ آیلند بیرون آمده بود، با این مدعا که «شباهت مرموزی» میان سارس‌کوو۲ و اچ‌آی‌وی وجود دارد که «بعید است تصادفی باشد». این به بحث‌های داغی دامن زد مبنی‌براینکه ویروس کرونا یک سلاح زیستی مهندسی‌شده است.

این مقاله اکنون حامل برچسب قرمز «پس‌گرفته‌شده» است، اما هنوز به‌سادگی یافته می‌شود و خواندنش رایگان است (برای حفظ یک‌پارچگی متون، مقاله‌های پس‌گرفته‌شده معمولاً پاک نمی‌شوند). ماه بعد، مجری شبکۀ فاکس نیوز، تاکر کارلسن، به نسخۀ پیش از انتشاری که در ریسرچ‌گیت منتشر شده بود ارجاع داد، نوشته‌ای که مدعی بود بازار تره‌بار ووهان که ظن آن می‌رود که خاستگاه شیوع بوده باشد نزدیک به یک آزمایشگاه پژوهشی ویروس کروناست. نویسنده بعداً آن را از سایت برداشت و به وال استریت ژورنال گفت که «برهان آشکاری مؤید آن نبوده است»، کارلسن گفت که روی این مقاله «سرپوش گذاشته‌اند».

این مشکل محدود به نسخه‌های پیش از انتشار نیست: بسیاری از نشریات مطالعاتی مربوط به کووید۱۹ را پس گرفته‌اند که داوری همتا را پشت سر گذاشته و منتشر شده بودند. علم نیز همواره در معرض سوءاستفاده بوده است؛ محدودکردن دسترسی به آن، اگر ممکن بود، به این مسئله خاتمه نمی‌داد. اما مقاله‌ها، خواه مقاله‌های نشریات یا نسخه‌های پیش از انتشار، کماکان مهم‌ترین واسطه میان پژوهش علمی و جامعۀ وسیع‌ترند. این ظرفیت مضاعف برای اشاعۀ برق‌آسای تفسیرهای فریب‌آمیز از مقالات علمی به پژوهشگران دلیلِ خوبِ دیگری می‌دهد تا برای کارشان زحمت بکشند.

اطلاعات کتاب‌شناختی:

Ritchie, Stuart. Science Fictions: Exposing Fraud, Bias, Negligence and Hype in Science. Bodley Head, 2020

پی‌نوشت‌ها:

این مطلب را جان ویتفیلد نوشته و در تاریخ ۷ اکتبر ۲۰۲۱ با عنوان «REPLICATION CRISIS» در مجلۀ لندن ریویو آو بوکس منتشر شده است. و برای نخستین‌بار با عنوان «بحرانِ تکرار» در بیست‌ودومین شمارۀ فصلنامۀ ترجمان علوم انسانی با ترجمۀ علی امیری منتشر شده است. وب سایت ترجمان آن را در تاریخ ۲۵ اردیبهشت ۱۴۰۱با همان عنوان منتشر کرده است.
•• جان ویتفیلد (John Whitfield) از سال ۲۰۱۲ ویراستار نظرات در وبگاه ریسرچ پروفشنال نیوز است. او تا کنون دو کتاب نوشته است با عناوین دهان مردم را نمی‌توان بست: علم شگفت‌آور اشتهار (People Will Talk: the surprising science of reputation) و در تپش یک قلب: زندگی، نیرو و وحدت طبیعت (In the Beat of a Heart: life, energy and the unity of nature).

[۱] The Lancet نام یکی از نشریات معتبر علمی نیز است [مترجم].
[۲] Impact factor
[۳] skewe
[۴] Peer review
[۵] spreadsheet
[۶] reproducibility
[۷] Random variation
[۸] HARKing
[۹] paywall
[۱۰] Public Library of Science
[۱۱] PLOS One
[۱۲] preprint

انتهای پیام

برچسب ها