Что такое тайм код при расшифровке аудиозаписей (видео) в текст

Расшифровка аудиозаписей в текст, как вставить тайм код в Ворд

Расшифровка аудиозаписей в текст обозначается с тайм–кодом. Давайте приведём конкретный пример. Например, идёт процесс судебного заседания. Секретарь, который записывает показания свидетелей отмечает, что на такой-то  минуте, человек сказал о себе, и событиях, которые произошли в данный момент времени на месте происшествия.

Тайм код вставляется в любой документ, в том числе, в ворд очень просто. Он пишется между абзацами, с различными временными интервалами. Его можно прописывать, как от руки, так и с помощью специальных программ, которые могут расшифровывать аудиозаписи в текст автоматически. Тайм коды в Ворде выглядят так (Рисунок 1).

Эти интервалы времени, помогают запомнить все необходимые моменты из разговора. Итак, мы и рассмотрели, что такое тайм код и как его используют. А дальше, разберём особенность расшифровки видео в текст, и воспользуемся тайм кодом на YouTube.

Базовые концепции

Сигнал временного кода SMPTE (A 1 выражается переходом в середине периода. A 0 выражается отсутствием такого перехода.) По сравнению с внешне схожим манчестерским кодом (A 0 выражается переходом от высокого к низкий переход, 1 при переходе от низкого к высокому в середине периода).

Временной код SMPTE представлен в формате час: минута: секунда: кадр и обычно представлен в 32-битном формате с использованием десятичного двоичного кода . Также имеются флаги пропуска кадра и цветового кадрирования и три дополнительных бита флага двоичной группы, используемые для определения использования пользовательских битов. Форматы других разновидностей тайм-кода SMPTE являются производными от линейного тайм-кода . Более сложные временные коды, такие как временной интервал вертикального интервала, также могут включать дополнительную информацию в различных кодировках.

Значения времени субсекундного временного кода выражаются в кадрах. Общие поддерживаемые частоты кадров включают:

  • 24 кадра / сек ( пленка , ATSC , 2K, 4K , 6K)
  • 25 кадров / сек ( PAL (Европа, Уругвай, Аргентина, Австралия), SECAM , DVB , ATSC)
  • 29,97 (30 ÷ 1,001) кадров / сек ( американская система NTSC (США, Канада, Мексика, Колумбия и т. Д.), ATSC, PAL-M (Бразилия))
  • 30 кадров / сек ( ATSC )

Как правило, информация о частоте кадров временного кода SMPTE является неявной, она известна по скорости поступления временного кода из носителя. Это также может быть указано в других метаданных, закодированных на носителе. Интерпретация нескольких битов, включая биты цветового кадрирования и пропуска кадров , зависит от базовой скорости передачи данных. В частности, бит пропуска кадров действителен только для номинальной частоты кадров 30 кадров / с.

Прерывистый тайм-код и обработка маховиком

Временные коды генерируются как непрерывный поток последовательных значений данных. В некоторых приложениях используется время настенных часов , в других время закодировано как условное время с более произвольной ссылкой. После выполнения серии записей или грубого редактирования записанные временные коды могут состоять из прерывистых сегментов.

Как правило, невозможно узнать линейный тайм-код ( LTC ) текущего кадра до тех пор, пока кадр уже не прошел, и к этому времени уже слишком поздно вносить изменения. Практические системы следят за возрастающей последовательностью тайм-кода и по нему делают вывод о времени текущего кадра.

Поскольку временные коды в аналоговых системах подвержены битовым ошибкам и выпадениям, большинство устройств обработки временного кода проверяют внутреннюю согласованность в последовательности значений временного кода и используют простые схемы исправления ошибок для исправления коротких пакетов ошибок. Таким образом, граница между диапазонами прерывистого временного кода не может быть определена точно, пока не пройдут несколько последующих кадров.

Бонус-трек

Держите макросы, которые сделают это все автоматически за пару нажатий. Вы вправе отредактировать систему под свои нужды.

Если используете мою систему как есть, то ваше шоу должно соответствовать нескольким требованиям:

  1. Каждой песне соответствует свой номер страницы и номер таймкод-пула. Например, Песня 1: Page 1, Timecode Pool 1.
  2. В системе заготовлено 60 песен. Все песни идут с интервалом в 10 минут, начиная с 0:10:00:00.
  3. Макрос «Import TC+Seq» импортирует секвенцию Setlist в пул 999, назначает ее на экзекютор 1.201, импортирует таймкод-пул Setlist в пул 100. Перед запуском этого макроса убедитесь, что все пулы и экзекютор пустые. Вы сможете потом все перенести по своему желанию.
  4. После импорта секвенции и таймкод-пула, переименуйте их в настоящие названия песен макросом Label Songs. Это присвоит значения необходимым для работы системы переменным $song1…$song60 и позволит выстраивать порядок песен для красоты.
  5. Таймкод-пул Setlist в режиме Link Selected. Это удобно для быстрого переключения между LTC и MTC. Например, когда вы на репетиции запускаете таймкод с ноутбука по миди.

Расшифровка видео в текст, особенность

В чём особенность расшифровки видео в текст? Не все люди любят смотреть видео и на это есть различные причины. У кого-то слабый Интернет, нет желания смотреть, хочется просто почитать полезную для себя информацию. Например, нет возможности просматривать часто видеоролики на компьютере, а на телефоне, это неудобно.

Иногда бывает удобнее создать текстовый алгоритм действий какого-либо учебного видео урока. Поэтому, проще изложить алгоритм действий в виде текста и проставить тайм коды каждого действия. Если возникнет необходимость в пересмотре нужного фрагмента, достаточно будет перейти по нему.

Расшифровка видео в текст помогает упросить эту задачу. Вы можете из видеоролика создать наглядную, информативную статью, или выложить интересный пост для своих читателей.

Варианты

Временной код может быть прикреплен к носителю записи множеством различных способов.

  1. Линейный тайм-код , также известный как «продольный тайм-код» и «LTC»: подходит для записи на аудиоканале или передачи по аудиоканалам для распространения в студии для синхронизации записывающих устройств и камер. Чтобы читать LTC, запись должна двигаться, а это означает, что LTC бесполезен, когда запись стационарна или почти неподвижна. Этот недостаток привел к развитию VITC.
  2. Временной код вертикального интервала (VITC, произносится как «vit-see»): записывается в интервал вертикального гашения видеосигнала на каждом кадре видео. Преимущество VITC в том, что, поскольку это часть воспроизводимого видео, его можно прочитать, когда лента неподвижна.
  3. Встроенный тайм-код AES-EBU, временной код SMPTE, встроенный в соединение цифрового аудио AES3.
  4. Продольный временной код контрольной дорожки (временной код CTL): временной код SMPTE, встроенный в контрольную дорожку видеоленты.
  5. Видимый временной код, также известный как встроенный тайм-код и BITC (произносится как « побитовый просмотр») — числа встроены в видеоизображение, чтобы люди могли легко прочитать временной код. Видеокассеты, которые дублируются с этими номерами временного кода, «встроенными» в видео, называются оконными дублями .
  6. Пленочные этикетки, такие как Keykode .

Формат данных продольного временного кода

Форма волны линейного временного кода, отображаемая в ярком виде с выделенным 80-битным фреймом данных

Базовый формат — это 80-битный код, который указывает время дня с точностью до секунды и номер кадра с точностью до секунды. Значения сохраняются в двоичном десятичном формате , сначала младший бит. Есть тридцать два бита пользовательских данных, обычно используемых для номера барабана и даты.

Линейный временной код SMPTE
Немного Вес Смысл Немного Вес Смысл Немного Вес Смысл Немного Вес Смысл Немного Стоимость Смысл
00 1 Единицы номера кадра (0–9) 16 1 Секунды единиц (0-9) 32 1 Минуты единиц (0-9) 48 1 Часовые единицы (0–9) 64 Синхронизирующее слово, фиксированный битовый шаблон 0011 1111 1111 1101
01 2 17 2 33 2 49 2 65
02 4 18 4 34 4 50 4 66 1
03 8 19 8 35 год 8 51 8 67 1
04 Поле пользовательских битов 1 20 Поле пользовательских битов 3 36 Поле пользовательских битов 5 52 Поле пользовательских битов 7 68 1
05 21 год 37 53 69 1
06 22 38 54 70 1
07 23 39 55 71 1
08 10 Номер кадра десятки (0-2) 24 10 Секунды десятки (0–5) 40 10 Минуты десятки (0–5) 56 10 Часы десятки (0-2) 72 1
09 20 25 20 41 год 20 57 20 73 1
10 D Флаг .
26 40 42 40 58 BGF1 Флаг часов 74 1
11 C Флаг «Цветная рамка» 27 (флаг, см. ниже) 43 год (флаг, см. ниже) 59 (флаг, см. ниже) 75 1
12 Поле пользовательских битов 2 28 Поле пользовательских битов 4 44 Поле пользовательских битов 6 60 Поле пользовательских битов 8 76 1
13 29 45 61 77 1
14 30 46 62 78
15 31 год 47 63 79 1
  • Бит 10 устанавливается в 1, если используется нумерация ; номера кадров 0 и 1 пропускаются в течение первой секунды каждой минуты, кроме кратных 10 минутам. Это преобразует временной код 30 кадров в секунду в стандарт NTSC 29,97 кадров в секунду .
  • Бит 11, бит цветного кадрирования , устанавливается в 1, если временной код синхронизируется с цветным видеосигналом. Номер кадра по модулю 2 (для NTSC и SECAM ) или по модулю 4 (для PAL ) должен быть сохранен через разрезы, чтобы избежать скачков фазы в поднесущей цветности .
  • Биты 27, 43 и 59 различаются между временным кодом 25 кадров / с и другими частотами кадров (30, 29,97 или 24). Биты:
    • «Бит коррекции полярности» (бит 59 при 25 кадрах / с, бит 27 при других скоростях): этот бит выбирается для обеспечения четного числа 0 бит во всем кадре, включая код синхронизации. (Поскольку длина кадра — четное число битов, это подразумевает четное число из 1 битов и, таким образом, является битом четности . Поскольку код синхронизации включает нечетное число из 1 бит, это бит нечетной четности над данными .) Это поддерживает согласованность фазы каждого кадра, поэтому он всегда начинается с нарастающего фронта в начале бита 0. Это позволяет бесшовно соединять различные временные коды и упрощает считывание с помощью осциллографа .
    • Биты BGF0 и BGF2 «флага двоичной группы» (биты 27 и 43 при 25 кадрах / с, биты 43 и 59 при других скоростях): они указывают формат пользовательских битов. Оба 0 указывают на отсутствие (или неуказанный) формат. Только набор BGF0 указывает четыре 8-битных символа (передаваемый с прямым порядком байтов ). Комбинации с установленным BGF2 зарезервированы.
  • Бит 58, не использовавшийся в более ранних версиях спецификации, теперь определяется как «флаг двоичной группы 1» и указывает, что временной код синхронизирован с внешними часами. если ноль, начало отсчета времени произвольно.
  • Шаблон синхронизации в битах с 64 по 79 включает 12 последовательных 1 битов, которые не могут появиться где-либо еще во временном коде. Предполагая, что все пользовательские биты установлены в 1, самый длинный ряд из 1 битов, который может появиться в другом месте временного кода, равен 10, биты с 9 по 18 включительно.
  • Перед шаблоном синхронизации стоит 00, а за ним — 01. Он используется для определения, движется ли аудиолента вперед или назад.

Производство и распространение

В ситуациях с вещательным видео генератор LTC должен быть привязан к домашней вспышке черного, как и все устройства, использующие тайм-код, чтобы обеспечить правильное цветовое кадрирование и правильную синхронизацию всех цифровых часов. При синхронизации нескольких цифровых устройств, зависящих от часов, вместе с видео, таких как цифровые аудиомагнитофоны, устройства должны быть подключены к общему сигналу синхронизации слов, который получается из домашнего сигнала черной вспышки. Это может быть достигнуто с помощью генератора, который генерирует как черную вспышку, так и синхронизацию слов с разрешением видео, или путем синхронизации главного цифрового устройства с видео и синхронизации всех последующих устройств с выходом синхронизации слов главного цифрового устройства (и с LTC). .

Состоит из 80 бит на кадр, где может быть 24, 25 или 30 кадров в секунду, временной код LTC варьируется от 960 Гц (двоичные нули при 24 кадрах / с) до 2400 Гц (двоичные нули при 30 кадрах / с), и таким образом удобно находится в диапазоне звуковых частот. LTC может существовать как сбалансированный или несбалансированный сигнал и может рассматриваться как аудиосигнал в отношении распределения. Как и аудио, LTC может распространяться с помощью стандартной аудиопроводки, разъемов, усилителей-распределителей и коммутационных панелей, а также может быть изолирован от земли с помощью аудиопреобразователей. Его также можно распространять через видеокабель с сопротивлением 75 Ом и усилители распределения видеосигнала, хотя ослабление напряжения, вызванное использованием системы с сопротивлением 75 Ом, может привести к падению сигнала до уровня, который не может быть прочитан некоторым оборудованием.

Следует проявлять осторожность с аналоговым звуком, чтобы избежать слышимого «прорыва» (также известного как «перекрестные помехи») от дорожки LTC к звуковым дорожкам.

Уход за LTC :

  • Избегайте ударных звуков, близких к LTC
  • Никогда не обрабатывайте LTC с шумоподавлением, эквалайзером или компрессором
  • Разрешить предварительную и завершающую ролики
  • Чтобы создать отрицательный временной код, добавьте ко времени один час (избегайте эффекта полуночи )
  • Всегда ставьте самое медленное устройство в качестве главного

Продольный тайм-код SMPTE должен воспроизводиться на среднем уровне при записи на звуковую дорожку, поскольку как низкие, так и высокие уровни будут вносить искажения.

Временной код с пропущенным кадром

Временной код с пропущенным кадром возник из компромисса, введенного при изобретении цветного видео NTSC. Разработчики NTSC хотели сохранить совместимость с существующими монохромными телевизорами. Чтобы минимизировать видимость поднесущей в монохромном приемнике, необходимо было сделать поднесущую цвета нечетным кратным половине частоты строчной развертки; первоначально выбранным кратным было 495. При частоте кадров 30 Гц частота строчной развертки составляет (30 × 525) = 15750 Гц. Таким образом, частота поднесущей была бы4952 × 15750 = 3,898125 МГц. Это была изначально выбранная частота поднесущей, но тесты показали, что на некоторых монохромных приемниках можно увидеть интерференционную картину, вызванную биением между цветной поднесущей и звуковой интернесущей 4,5 МГц. Видимость этого паттерна может быть значительно уменьшена за счет уменьшения частоты поднесущей, кратной 455 (таким образом, увеличивая частоту биений примерно с 600 кГц до примерно 920 кГц), и за счет того, что частота биений также равна нечетному кратному половине частоты строчной развертки. . Это последнее изменение могло быть достигнуто путем увеличения межнесущей звука на 0,1% до 4,5045 МГц, но разработчики, обеспокоенные тем, что это может вызвать проблемы с некоторыми существующими приемниками, вместо этого решили уменьшить частоту цветовой поднесущей и, следовательно, частоту строчной развертки. а частота кадров — на 0,1%. Таким образом, цветовая поднесущая NTSC составила 3,57954545 МГц (точно31588 МГц), частота строчной развертки — 15734,27 Гц (точно 9572 МГц) и частота кадров 29,97 Гц (точно 301,001 Гц).

Измененная частота кадров означала, что «час тайм-кода» при номинальной частоте кадров 30 кадров / с при воспроизведении со скоростью 29,97 кадра / с был длиннее часа времени настенных часов на 3,6 секунды, что приводило к ошибке почти полторы минуты за день.

Чтобы исправить это, был изобретен тайм-код SMPTE с пропуском кадра. Несмотря на то, что подразумевается в названии, при использовании тайм-кода с пропущенным кадром никакие видеокадры не пропадают или пропускаются. Вместо этого некоторые временные коды отбрасываются. Чтобы час тайм-кода совпадал с часом на часах, тайм-код с пропуском кадров пропускает номера кадров 0 и 1 первой секунды каждой минуты, за исключением случаев, когда количество минут делится на десять. Это приводит к тому, что временной код пропускает 18 кадров каждые десять минут (18 000 кадров при 30 кадрах / с) и почти полностью компенсирует разницу в скорости.

Например, последовательность, когда количество кадров сбрасывается:

01: 08: 59: 28
01: 08: 59: 29
01: 09: 00: 02
01: 09: 00: 03

За каждую десятую минуту

01: 09: 59: 28
01: 09: 59: 29
01: 10: 00: 00
01: 10: 00: 01

В то время как тайм-код без выпадения отображается двоеточиями, разделяющими пары цифр — «ЧЧ: ММ: СС: FF» — выпадающий кадр обычно представлен точкой с запятой (;) или точкой (.) В качестве разделителя между всеми парами цифр — «HH; MM; SS; FF», «HH.MM.SS.FF» — или только между секундами и кадрами — «HH: MM: SS; FF» или «HH: MM: SS.FF». Временной код с пропущенным кадром обычно обозначается как DF, а без пропуска — как NDF.

Заключение

В статье мы разобрали вопрос, что такое тайм код в транскрибации и как он используется. На самом деле, здесь нет ничего сложного. Главное знать, куда нажать, чтобы получить этот тайм код. Думаю, данный инструмент Вам может пригодиться при просмотре видеороликов и прослушивании аудиозаписи

Спасибо за внимание, и удачи Вам друзья!

Просмотров: 3134

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *

Adblock
detector