7-летнее масштабное исследование обнаружило, что половина исследований в области социальных наук не поддается повторной проверке

Проект DARPA SCORE, проанализировав тысячи научных работ, выявил серьезные проблемы с воспроизводимостью результатов в социальных науках, что подчеркивает системный кризис надежности

news.sciencenet.cn

Короткое резюме

Масштабный семилетний проект SCORE, проведённый Агентством перспективных оборонных исследовательских проектов США (DARPA), показал, что лишь около половины результатов исследований в области социальных наук могут быть успешно воспроизведены. В ходе анализа 3900 научных статей, опубликованных в 62 журналах по экономике, образованию, психологии и социологии, исследователи обнаружили тревожный уровень невоспроизводимости.

Проблема заключается не столько в недобросовестности исследователей, сколько в недостатке данных и прозрачности методологии. Только 145 из 600 проверенных статей предоставили достаточно деталей для точного воспроизведения анализа, и лишь 53% из них дали идентичные результаты. При проверке «устойчивости» (устойчивости) исследований, когда данные анализируются альтернативными методами, около 2% работ дали выводы, противоположные оригинальным.

Для решения проблемы предлагается развивать автоматизированные инструменты, включая модели искусственного интеллекта, для прогнозирования надёжности исследований. Хотя первые попытки использования искусственного интеллекта были неудачными, в последнем раунде соревнований точность лучшей модели достигла 68.5%. Учёные считают, что более открытый обмен данными и прозрачность методов — ключ к повышению доверия к научным результатам.

Ключевые выводы

Низкая воспроизводимость

Только 49% из 164 проверенных исследований в социальных науках показали статистически значимую воспроизводимость при полном повторении эксперимента

Проблема прозрачности

Основная причина неудач при воспроизведении — недостаточность предоставленных данных и описания методов, а не ошибки или мошенничество исследователей

Риск противоположных выводов

При проверке «устойчивости» (альтернативный анализ данных) около 2% исследований дали результаты, полностью противоречащие первоначальным выводам

Потенциал инструментов искусственного интеллекта

Автоматизированные инструменты на основе искусственного интеллекта демонстрируют растущую, но пока ограниченную точность (до 68.5%) в прогнозировании воспроизводимости исследований

Текст сгенерирован с использованием ИИ

Открытая наука, Воспроизводимость науки, Кризис репликации, Социальные науки, Мета-наука, DARPA SCORE

7-летнее масштабное исследование обнаружило, что половина исследований в области социальных наук не поддается повторной проверке

Короткое резюме

Рекомендации по теме

Комментарии

Лента

7-летнее масштабное исследование обнаружило, что половина исследований в области социальных наук не поддается повторной проверке

Короткое резюме

Рекомендации по теме

Комментарии

Лента.css-1kwqo06{position:absolute;height:2px;bottom:0;width:100%;-webkit-transition:all 300ms cubic-bezier(0.4, 0, 0.2, 1) 0ms;transition:all 300ms cubic-bezier(0.4, 0, 0.2, 1) 0ms;background-color:#282c6b;}

Лента