Просим зачесть наш ответ как полностью синонимичный авторскому.
Описанный феномен (люди начинают говорить через несколько секунд после начала записи видео для тик-ток) возникает, как пишут в авторском источнике
ссылка , потому, что прежде чем начать говорить, люди хотят убедиться, что идет запись.
Запись видео для тик-ток (как впрочем и любого видео со звуком) осуществляется совместной работой двух устройств: Камеры и микрофона. Любой желающий может убедиться, что в смартфонах (как впрочем и в других устройствах, хотя для тик-ток используются практически всегда смартфоны), камера это такая отдельная дырка в корпусе, поверх которой линза, а микрофон - еще одно или несколько отверстий в корпусе, через которые записывается звук.
Совершенно очевидно, что если бы в описанной в вопросе ситуации включалась только камера, но не включался бы микрофон, описанный феномен наблюдать бы не удалось.
Убедиться в том, что микрофон в смартфоне используется для записи видео можно либо, например, тут:
ссылка либо попробовав это эмпирически, просто отключив микрофон в настройках и посмотрев результат записи.
Упомянутая в вопросе подсказка (слова "1-2-3") отлично ложится и на привычку многих поколений тестировать микрофон, в т.ч. перед записью видео, поэтому наш ответ ложится на текст вопроса в чем-то лучше авторского.
Да и история с микрофоном упоминается и при описании феномена из вопроса:
ссылка
Спасибо за понимание.