Historical dance bibliography: Transcriptions

Транскрипция — это набранный текст источника (книги или манускрипта). Транскрипции упрощают работу с источником и предоставляют некоторые дополнительные возможности (например, поиск по тексту). Примеры набранных транскрипций лежат тут, в обработанном виде их можно найти здесь.

Как сделать транскрипцию?

  1. Что я могу транскрибировать? Напишите Юрию Чернышову, он подскажет, с какого источника начать, проследит за тем, чтобы два человека не делали одну и ту же работу.
  2. У меня есть источник. Что набирать? Транскрибируется весь текст источника за исключением титульных страниц, содержания, нотного материала, иллюстраций и подписей к ним. Если в книге присутствует эррата, она оформляется отдельным пунктом. Ошибки, упомянутые в эррате, не вносятся в транскрипцию источника.
  3. Как набирать? Все транскрипции оформляются в оригинальной орфографии максимально близко к тексту.

    Никакие опечатки не исправляются, никакие сокращения (включая сокращения под тильдой) не раскрываются.

    Текст набирается с тем же разбиением на строки, что и в оригинале в том числе в заголовках (см. пример в соответствующем разделе), а символы переноса размечаются специальным образом (подробности — в разделе про переносы строк).

    Обращайте внимание на знаки препинания: не путайте тире и дефисы, ставьте те кавычки, которые использует автор, следите за расстановкой точек в скобках и после чисел.

    В текстах могут встречаться непонятные символы; правила их набора описаны в соответствующей части.

  4. Где набирать? Мы используем формат markdown, чтобы все транскрипции выглядели одинаково и с ними было удобно работать. Он отличается от обычного текстового файла специальной разметкой (см. ниже). Текст можно набирать в блокноте (удобнее — в Notepad++, вам нужна кодировка UTF-8) или в Google Docs. Предварительно посмотреть набранный текст можно в расширении браузере Firefox при помощи расширения Markdown Viewer. Посмотреть файл в окончательном виде вы сможете только после того, как загрузите его в библиографию.

  5. Что за разметка? Вот основные символы разметки, которые могут вам пригодиться:

    Разметка Производимый ею эффект
    Абзац Абзацы в markdown отделяются друг от друга дополнительной пустой строкой.
    [-] Означает напечатанный символ переноса. Подробности здесь.
    [-?] Означает пропущенный символ переноса. Подробности здесь.
    **Текст, окружённый двойными звёздочками** Делает текст жирным.
    _Текст, окружённый подчёркиваниями_ Выделяет текст курсивом.
    ### Заголовок Делает текст заголовком.
    {123} Проставляет номер страницы (в данном случае — 123). Подробности здесь.
    [[Текст сноски]] Превращает текст внутри двойных квадратных скобок в сноску. Подробнее см. здесь.
    1^ere^ Превращает выделенный в ^ текст в надстрочный.
    ser.↓mo↓ Переводит выделенный в текст в нижний индекс.
    ~~Зачёркнутый текст~~ Превращает выделенный в ~~ текст в зачёркнутый.
    !!Капитель!! Набирает обрамлённый фрагмент текста капителью.
    * Элемент Создаёт маркированный список элементов. Элементы списков не отделяются друг от друга пустой строкой.
    1. Элемент Создаёт нумерованный список элементов. Элементы списков не отделяются друг от друга пустой строкой.
    *** Создаёт горизонтальную линию.
    > Будучи поставленной в начале строки, помечает текст как стихотворение или цитату. См. пример.
    >> Будучи поставленной в начале строки, сдвигает текст в правую часть страницы. Обычно используется для разметки подписей.
    \| и - Используется для разметки таблиц. См. описание правил и пример.

    Если вы не уверены в точности транскрибирования, добавьте сноску.

    Если вам нужна помощь с разметкой, обратитесь за помощью к Юрию Чернышову.

Детали оформления

Заголовки

Для разметки многострочных заголовков используется следующий синтаксис (обратите внимание на четыре пробела в начале второй строки).

### Начало заголовка
    и его продолжение.

Переносы строк

Символы переноса остаются в тексте транскрипции для простоты сверки набранного текста с оригиналом. Если их удалить (раскрыть), начала строк съедут и проблемное место сложнее будет отыскать.

Специальная разметка переносов строк позволяет отличить две ситуации: когда символ переноса можно безболезненно удалить (due pas-si) и когда этого делать нельзя (когда-нибудь).

Для разметки используются две последовательности символов: [-] означает напечатанный в середине слова символ переноса, [-?] — пропущенный по мнению транскрибирующего символ. При отображении на сайте обе последовательности символов вырезаются.

Номера страниц

  • Набирается только смысловая часть номера страницы, но не декоративная. То есть набирается так: {17}.
  • Номера страниц ставятся перед первым целым словом на странице.
  • Номера страниц отделяются от слов основного текста пробелом.
  • Номер страницы, указанный в транскрипции, должен совпадать с номером, указанным в книге:
    • если для нумерации используются римские цифры, ставьте в транскрипции римские цифры,
    • опечатки в номерах страниц вносятся без исправления,
    • ненумерованные страницы следует обозначить разметкой {Page},
    • для нумерации страниц в манускриптах используются номера листов (только если они присутствуют в манускрипте) с суффиксами r и v (для recto и verso сторон листа соответственно), например, последовательность страниц {1r}, {1v}, {2r}, {2v} соответствует двум листам.
  • Если страница начинается с заголовка, номер страницы следует поставить сразу после ###: ### {1} Текст заголовка.
  • Если страница начинается со стихотворения, номер страница следует поставить после >: > {1} Мой дядя самых честных правил.
  • Если страница начинается с середины абзаца, номер страницы следует поставить прямо в середине абзаца. Отделять новую страницу дополнительным переносом строки не нужно.

Сноски

  • Сносками размечаются:

    • авторские сноски, наличествующие в самой книге,
    • маргиналии,
    • опечатки, упомянутые в эррате (при этом стоит пояснить, что опечатка была исправлена автором в оригинальном тексте),
    • места, являющиеся опечатками по мнению транскрибирующего (добавьте примечание о характере опечатки),
    • места, в которых перенос был раскрыт нетривиальным образом (добавьте примечание о причинах нетривиальности).
  • Сноска набирается там же, где на неё стоит ссылка в оригинале, или в том месте, в транскрипции которого вы не уверены.

  • В квадратных скобках набирается только сам текст сноски; нумерация будет проставлена автоматически.
  • В сносках можно использовать простую разметку (курсив, зачёркивание, текст в верхнем регистре).
  • Если в сноске автором использована более сложная разметка, обратитесь к Юрию Чернышову.

Advanced knowledge

Про непонятные символы

В основанных на латинице алфавитах действуют следующие правила по заменам:

Символ Название На что заменяем Где используется
ſ Длинная s или медиаль s
fl, ff, ffi, ffl, ft, st Стилистические лигатуры Раскрываются в отдельные буквы. Список лигатур менялся со временем. Вот список французских лигатур середины XVIII века
ß Эсцет В немецком языке набирается как есть, в других языках раскрывается в ss (считается стилистической лигатурой)
Œ Лигатура для OE Набирается как есть
Æ Лигатура для AE Набирается как есть
& Амперсанд Набирается как есть
🙰 Лигатура et Раскрывается в et
⁊, тиронов знак Набирается как ⁊с. [Gaspari, 1713, стр. 12]
или yᵉ Артикль þe (подробнее тут) или местоимение ye (подробнее тут) þᵉ или yᵉ в зависимости от контекста

Некоторые встречающиеся в книгах символы отсутствуют в Юникоде, например, и . Их придётся набирать, используя комбинируемые символы.

В русскоязычных источниках производятся следующие замены:

Символ Название На что заменяем
Ѣ ять Е
І, і и десятеричное И
Ї, ї и десятеричное с тремой И
Ъ ер, твёрдый знак в конце слова удаляется
Ѳ фита Ф
Ѵ ижица И

Про манускрипты

Изучением письменности вообще и манускриптов в частности занимается наука палеография. Если вы разбираете сложный манускрипт, вам может пригодиться инструкция по чтению манускриптов на разных европейских языках.

Дополнительно: при наборе текста надо ознакомиться со всеми вариантами начертания букв и лигатур, найти их в известных и хорошо читаемых словах и может даже скопировать себе и сделать табличку. Так всегда делают в палеографии когда работают с манускриптами, с печатными старыми книгами это тоже очень помогает.

Как набирать символы, которых нет на клавиатуре?

Есть несколько опций, можно выбрать удобную:

  1. Скопировать символы из «списочных» статей Википедии: List of XML and HTML character entity references, List of Latin-script_letters. Кроме того, почти все символы имеют собственные статьи, например Ять.
  2. Воспользоваться Типографской раскладкой Ильи Бирмана. 3. Воспользоваться служебной «Таблицей символов»:

    На Windows её можно найти в «Служебных программах» или запустить через Win + Rcharmap.exeOK.

    На Mac её можно найти во встроенном приложении «Шрифты». 4. На Windows: воспользоваться программой AutoHotKey. Попросите помощи у Юрия Чернышова.

Как добавить законченную транскрипцию в библиографию?

  1. Зарегистрируйте аккаунт на сайте github.com.
  2. Войдите в свой аккаунт.
  3. Перейдите по ссылке 4. Нажмите на кнопку Create new file. Вставьте в появившееся окно содержимое вашего файла. Нажмите на кнопку Preview, чтобы посмотреть на скомпилированный вариант вашего файла.

    Внимание! При просмотре файла на github.com не будут обработаны номера страниц, сноски и надстрочный текст. Не пугайтесь, всё будет хорошо. 5. Введите имя файла в поле Name your file... над основным текстом. Желательно придерживаться той же схемы именования, которая используется для существующих транскрипций. Схема именования описана здесь. 6. В описании текста ниже укажите, какую книгу вы транскрибируете (можно просто приложить ссылку на библиографию). 7. Укажите, пожалуйста, своё полное имя. Вы будете указаны автором транскрипции на сайте библиографии. 8. Нажмите на кнопку Propose new file. 9. Нажмите на кнопку Create pull request. Подтвердите своё действие повторным нажатием. 10. Дождитесь появления вашей транскрипции на сайте библиографии. Добавление обычно занимает не более одного дня. 11. Принимайте благодарности.

Неподдерживаемый функционал

Часть функционала в данный момент не имеет в поддержки:

  • Не существует механизма различения типов сносок.
  • Нет возможности отличать текст, набранный готикой от текста, набранного антиквой (в частности, такое встречается в немецких трактатах, использующих французскую танцевальную терминологию).
  • Нет удобной возможности набора нестандартный (отсутствующих в таблице Unicode) символов (в частности, вертикальных дробей, обозначающих музыкальные ритмы). Рекомендуемый workaround — использовать изображения в формате svg (пример можно найти в транскрипции книги Danciad Томаса Уилсона).