Возможно ли: из фильмы, разговор-диалоги конвертировать в текстовый файл
Имеется ссылка на фильм из медиатеки ARD,
из которого хотелось бы
разговор-диалоги в т.ч. и Hörfassung (аудио-сопровождение сцен в которых нет разговора)
и / или имеющийся подстрочник
автоматически записать в текстовый файл?
Можно ли каким-то образом это сделать?
Если ссылка фильма на сайте Ard имеете ввиду (Ard Mediathek), я в браузере поизучал сайт спомощью Untersuchung, когда вы смотрите фильм на сайте Ard, то вроде как сервер, на котором расположен фильм, присылает видео браузеру в формате TS https://ru.wikipedia.org/wiki/MPEG-TS, имя файлов TS хранится в файле m3u8 - https://ru.wikipedia.org/wiki/M3U и субтитры вроде как запиханы в сам TS файл. Единственное можете попробывать спомощью Google Übersetzer, там есть иконка микрофона (слева). На ютубе на канале Ard там есть субтитры, некоторые видео на ютубе поддерживают транскрипцию, когда откроете видеоплеер под видео справа (правее где лайки и дизлайки) есть кнопка "...", нажимаете, всплывает меню, там выбераете "Transkription Öffnen", и открывается транскрипция.
имя файлов TS хранится в файле m3u8 - https://ru.wikipedia.org/wiki/M3U и субтитры вроде как запиханы в сам TS файл.
Каким образом, из ссылки на фильм, выделить TS-файл, содержащий аудио и субтитры?
Я удивлён что веб браузер вообще может проигрывать такой видеоформат, может проигрывается благодаря этому - https://ru.wikipedia.org/wiki/WebAssembly, там все видео в m3u8 кусками нарезаны, вроде как понимаю... подгружаются и кусок за куском проигрывается специальном видеоплеере. Выделить такой файл будет очень трудно, в первую очередь с правовой точки зрения могут начаться проблемы. Видео как понимаю расположены на американской Akamai CDN - https://ru.wikipedia.org/wiki/Akamai_Technologies если бы там был бы WebVTT - https://developer.mozilla.org/ru/docs/Web/API/WebVTT_API то было бы проще, а это не WebVTT а TS. Поэтому ничем помочь вам не могу, может быть вам лучше спросить у немцев...