Dafür gibt es ja die Timecodes.
Wenn da also viel Text / Zeile ist, dann wird in der Szene auch viel gesprochen und umgekehrt genauso. Wir sollten das nicht auseinanderreissen, sonst wird es asynchron!