Однажды британка отказалась пить чай, в который было влито молоко. Чтобы разрешить спор, её оппоненты приготовили восемь чашек, в которых был чай с молоком. Достаточно было и шести, ведь уже тогда получилось бы достичь общеупотребимого показателя ЭТОГО. Назовите ЭТО.
Ответ: p‑value [пи‑вэлью]
Зачёт: P-значение, p-уровень значимости, p-критерий
Комментарий: Чтобы провести эксперимент с нулевой гипотезой — «Нельзя отличить, что было налито раньше: молоко в чай или наоборот» — Ро́нальду Фи́шеру хватило бы шести чашек (по три каждого типа). В этом случае вероятность случайного угадывания составляла 0,05 [пять сотых], так как способов выбрать три чашки из шести — ровно двадцать. В современных научных исследованиях в качестве p‑value (уровня значимости) часто используют ту же границу — 0,05. В результате эксперимента Мю́риэл Бри́столь угадала все чашки правильно и посрамила мужиков.
Источники: 1. https://en.wikipedia.org/wiki/Muriel_Bristol#Statistics_and_tea:~:text=Bristol declined it, saying that she preferred the flavour when the milk was poured into the cup before the tea. 2. https://en.wikipedia.org/wiki/Lady_tasting_tea
/ 57 · 40.35%
/ 24 · 25%
Спорные: показать
Апелляции: показать
Вопрос
35
Тип:
на зачёт
Статус:
removeотказано
Ответ команды:
стандартное отклонение
Текст апелляции:
Прошу в вопросе 35 засчитать ответ «стандартное отклонение». Причины: 1. оно соответствует смыслу вопроса (тестирование гипотезы и отклонение результатов теста от матожидания в рамках гипотезы «различить последовательность наливания нельзя»). 2. Если считать, что чашек одного и второго типа равное количество (что, отметим, никак не сказано в вопросе явно), то для четырёх чашек статистистическая значимость, соответствующая отклонению на одно стандартное отклонение для распределения Гаусса, не достигается, а для шести уже достигается. 3. Оно ложится в форму вопроса: «ведь уже тогда получилось бы достичь общеупотребимого показателя - стандартного отклонения» ХХХХ [удалена подпись, И. О.]
Комментарий АЖ:
Для вынесения вердикта по этой апелляции АЖ обратилось к экспертам по математической статистике и теории вероятностей. Ответ "стандартное отклонение" не показывает достаточного проникновения в логику вопроса. Похоже, что команда сообразила, что речь идет о чем-то статистическом, но не смогла сформулировать достаточно точный ответ. Доверительная вероятность 0.68, соответствующая одному стандартному отклонению распределения Гаусса, соответствует уровню значимости 0.32, который не является общеупотребительным (это означает 0.32 вероятность ошибки первого рода, принимать гипотезы с таким уровнем значимости бессмысленно). АЖ и эксперты также рассмотрели аргументы апеллянтов по пунктам: 1. При подстановке ответа в формальный текст вопроса получается словосочетание "общеупотребимый показатель стандартного отклонения", не имеющее смысла. 2. Неверно (четырех чашек хватило бы для уровня значимости 0.32), но в любом случае, доказывает соответствие лишь части фактов в вопросе. 3. Тоже соответствует лишь части фактов — стандартное отклонение это общеупотребимый показатель в принципе, но не при тестировании гипотез, смысл словосочетания «получилось бы достичь стандартного отклонения», которое образуется при подстановке ответа в вопрос, не понятен, и команда его не объяснила. Кроме того, формальный текст вопроса не содержит тире, и на слух предложения "ведь уже тогда получилось бы достичь общеупотребимого показателя – ЭТОГО" и "ведь уже тогда получилось бы достичь общеупотребимого показателя ЭТОГО" сильно различимы (интонационно и наличием паузы перед словом "ЭТОГО"). Таким образом, ответ "стандартное отклонение" подходит хуже авторского и не может быть зачтён. Вердикт: Отклонить (3:0).