Новая программа поможет восстановить секретные документы, которые пытались уничтожить сотрудники Штази, секретной службы ГДР, целых 18 лет назад
Сопоставить сотни миллионов мелких обрывков бумаги, лежащих в больших мешках, каждый кусочек — с каждым, чтобы в итоге восстановить миллионы документов секретной службы, пропущенных через шредер — на эту грандиозную задачу германское правительство выделило $8,5 миллиона (вернее, только на первый её этап).
Возвращение из «небытия» документов службы государственной безопасности ГДР стало возможным благодаря программе, которую создала команда под руководством Бертрама Николая (Bertram Nickolay) из берлинского института производственных систем и технологий Фраунхофера (Fraunhofer-Instituts für Produktionsanlagen und Konstruktionstechnik).
Во время присоединения так называемых Восточных земель — бывшей ГДР к ФРГ — архив одной из самых сильных европейских спецслужб, Штази, был уничтожен. Но не полностью. Множество бумаг, хотя и пропущенных через шредер (а очень многие листы были просто порваны руками, поскольку шредеров не хватало), западногерманским властям удалось вовремя захватить. Пусть уже только в виде нескольких тонн бумажных обрывков.
Теперь, как предаёт Nature, появилась возможность вновь прочитать эти документы.
Обрывки будут сканировать, а специальный софт проведёт титаническую работу по составлению всех мыслимых их комбинаций.
При этом, поскольку простой перебор сочетаний тут не годится (число вариантов будет чудовищным), программа будет распределять бумаги по группам, в зависимости от сочетания 25 особенностей, включая цвет, форму, текстуру бумаги, наличие надписей от руки или только печатных и так далее. А потом уже — составлять из кусочков готовые тексты.
При этом в программу встроена способность к самообучению, так что антишредерный софт будет накапливать опыт по мере расшифровки всё большего и большего числа документов, и будет способен ускорить свою работу.
Для выполнения этой задачи будет задействована группа из 16 мощных компьютеров.
Сохранённый в виде обрывков и обрезков архив Штази насчитывает 45 миллионов страниц, разделённых ныне на 600 миллионов бумажных кусочков. Двухлетний пилотный проект предусматривает восстановление 2% этого архива. Если программа сработает как запланировано, германское правительство выделит деньги на восстановление оставшихся страниц.
Любопытно, что составление мозаики из обрывков документов вручную потребовало бы труда 30 человек в течение 800 лет. И хотя для сканирования и сортировки бумаги будет задействована команда из 20 человек, благодаря чудо-программе они смогут восстановить весь архив спецслужбы за 5 лет.
В работе над архивом, помимо специалистов института Фраунхофера, примут участие сотрудники компании Arvato direct services.

Комментарии закрыты