Тут несколько слоев проблемы.
Первый - кризис воспроизводимости. В психологии и биомедицине до 70% исследований не воспроизводятся при повторении. Причины: давление на публикацию, p-hacking (подгонка статистики), маленькие выборки, отсутствие пре-регистрации.
Второй - медийное искажение. СМИ любят сенсации. "Ученые доказали" в заголовке обычно означает одно пилотное исследование на 50 студентах. А когда мета-анализ на 100000 человек опровергает - это уже не кликбейтно.
Третий - разница между "жесткими" и "мягкими" науками. Физика выдает воспроизводимые результаты потому что изучает простые системы. Человек и общество - сложные системы где слишком много переменных. Поэтому в социологии и экономике консенсус достигается сложнее.
Четвертый - наука по определению фальсифицируема. Если теорию нельзя опровергнуть - это не наука. Поэтому любой научный вывод временный и может быть пересмотрен при новых данных. Это сила метода, а не слабость.
Ньютоновская механика работала 200 лет. Потом Эйнштейн показал что она частный случай. Это не значит что Ньютон ошибался - он был прав в своих рамках применимости.
Про p-hacking интересно, не слышал раньше. Это когда специально подбирают статистику?
Да. Например собрал данные, посчитал - p-value 0.06 (не значимо). Тогда начинаешь "исследовать" - убрал пару выбросов, поделил выборку по полу, добавил ковариату. О, p=0.048, ура публикация! Формально не нарушил правил но по сути подогнал