Каталог архивированных сайтов в Национальном цифровом архиве

Актуальный каталог всех архивированных сайтов в национальном цифровом архиве

Структура CSV файла:

id - уникальный идентификатор ресурса

collection - наименование/код коллекции

domain - домен

filename - наименование файла

filesize - размер файла

date_modified - дата изменения

public_url - общедоступная ссылка для выгрузки

Также в списке присутствуют технические файлы использованные при архивации - WARC файлы метаданных, базы ссылок, вспомогательные файлы grab-site и wpull.

Всего 2559 доменов

Данные и Ресурсы

Дополнительная информация

Поле Величина
Источник https://ruarxive.org
Автор Иван Бегтин
Администратор Иван Бегтин
Версия 1.0
Последнее обновление декабря 16, 2020, 12:17 (UTC)
Создано декабря 16, 2020, 12:16 (UTC)
creation_date 2020-12-16
funding_source Другое