Один из лучших способов узнать о каком-либо историческом периоде — это пообщаться с людьми, которые его пережили. Говорить с людьми из далекого прошлого очень однобоко, так как они, как правило, мертвы и давно перестали слушать. Однако они говорят о многом, если у вас хватит терпения слушать, а точнее читать то, что они говорят в письмах, дневниках и примитивных стикерах без липкой обратной стороны.
Международная группа ученых-компьютерщиков из Италии, Великобритании и Пакистана объединилась, чтобы воскресить мертвых из письменных источников, испорченных временем, путем разработки компьютерного метода, позволяющего виртуально вернуть документы в более разборчивое и поддающееся расшифровке состояние. В своей исследовательской статье «Реставрация и анализ содержания древних рукописей с помощью сегментации на основе цветового пространства», опубликованной в журнале PLOS ONE , команда подробно описывает метод цифровой реставрации и экспериментальные результаты.
Мы получаем представление о древних цивилизациях из их сочинений, как тривиальных, так и глубоких. Шумерская клинопись на глиняных табличках раскрывает торговые сделки 4000-летней давности, геометрические расчеты и поэзию, подробно описывающую падение великого города. Если бы они были написаны на бумаге, а не в глине, у нас, вероятно, не было бы их сегодня.
У нас есть историки, пишущие о древних событиях, поскольку они сами жили на территории нынешней Древней Греции. У нас есть письма солдат, участвовавших в каждом крупном конфликте за последние четыреста лет, письменная история большинства крупных или даже незначительных событий со времен промышленной революции, и все это на бумаге, подверженной старению и деградации.
Примерно в конце 1980-х годов в послужном списке есть небольшой пробел, поскольку люди использовали дискеты для хранения важных документов только для того, чтобы выбросить их все через несколько лет — к счастью, в те годы не произошло ничего важного.
Чтение старых или древних документов, даже в хорошем состоянии, может потребовать от читателя вникнуть в роль криптолога, расшифровывающего зашифрованные сообщения. Не столько потому, что автор намеренно старался быть скрытным в своих текстах, сколько потому, что сочетание грамотности писателя, разборчивости почерка, стиля письма, устаревших орфографических и грамматических правил или специальных сокращений для экономии места может сделать даже родной язык незнакомым.
Возьмите тот же документ и уменьшите его читаемость еще больше, обесцвечивая чернила, расширяя буквы из-за воздействия влаги, просачиваясь или перенося пигмент с одной страницы на другую, а также собирая информацию вместе, это может стать поистине сложной задачей.
Одним из аспектов нынешних усилий, который сильно отличается от прошлых методов, является использование цвета. Типичная цифровая реконструкция преобразует документ в черный текст на белом фоне, пытаясь выявить текст с помощью фильтрации шума и повышения контрастности. В текущем цветовом методе изображение представляет собой гораздо больше усилий по восстановлению, сохраняя большую часть внешнего вида и виртуального ощущения исходного документа.
Исследователи применили сложную интеграцию нескольких цифровых методов интерпретации цвета и смешанных моделей Гаусса, чтобы идентифицировать и разделить особенности текста, бумаги и артефактов. Это позволяет избирательно извлекать различные уровни информации на основе иногда тонких спектральных различий. Таким образом, пользователь мог решить, являются ли набросанные примечания, оформление страницы, печать, пятно на кольце кофейной кружки или другие особенности важными для понимания, добавляя или удаляя слои.
В некоторых случаях этот метод может сохранить особенности, которые в противном случае были бы потеряны, такие как слабые водяные знаки производителя бумаги, которые могут дать историкам важную информацию. Например, известные работы Леонардо да Винчи, которые сохранились в замечательном состоянии и не участвовали в текущем исследовании, написаны на страницах с водяными знаками от различных поставщиков бумаги, что позволило историкам документов сгруппировать их в вероятные группы периодов написания.
Согласно статье, обработка может быть выполнена на стандартном настольном компьютере (Core i5, 4 ГБ ОЗУ, Windows 10). Алгоритму требуется всего несколько минут, чтобы виртуально восстановить документ до большей удобочитаемости. Такой уровень удобства использования сделал бы его отличным инструментом как для исследователей исторических документов, так и для людей, пытающихся расшифровать старые семейные рецепты.
Теги: археологи, ИИ, распознавание