0 просмотров
Рейтинг статьи
1 звезда2 звезды3 звезды4 звезды5 звезд
Загрузка...

Что такое веб-архив и как им пользоваться

Веб-архив сайтов позиционируется как своеобразная бесплатная машина времени, позволяющая вернуться на месяцы или годы назад, чтобы увидеть, как выглядел ресурс на тот момент. При этом у каждого сайта сохраняются многочисленные версии от разных дат, которые зависят от посещений проекта краулерами веб-архива. У популярных сайтов может сохраняться тысячи версий, которые обновлялись ежедневно множество раз на протяжении всего периода существования проекта:

Веб-архив был основан в начале 1996 года и с этого времени в нем сохранено более 330 миллиардов веб-страниц, включая 20 миллионов книг, 4,5 миллионов аудиофайлов и 4 миллиона видео, занимающие свыше тысячи терабайт. Ежедневно сайт посещают миллионы пользователей, и он входит в ТОП-300 самых популярных проектов мира.

Archivarix

Мой фаворит, как сервис восстановления контента. Последнее время восстанавливаю с помощью этого сервиса.

Из преимуществ:

  • Гибкая настройка восстановления
  • Восстановление сайта состоящего из 200 файлов будет бесплатным
  • Своя CMS
  • Сервис доступен на 8 языках в том числе русский
  • Парсинг структурированных данных. Потом эти данные можно загрузить в wordpress. К сожалению пока сыровато.

Из минусов:

  • нельзя пополнить банковской картой

Программа WinHTTrack WebSite Copier

Всё самое нормальное — платное, но есть варианты. Бесплатное решение — программа WinHTTrack WebSite Copier. Хотя это ненашенский продукт, русский язык имеется, его нужно выбрать после установки программы.

Вы можете посмотреть видео или читать дальше статью:

Пользоваться программой довольно легко, нам в этом поможет «мастер». После запуска программы отображается дерево папок и файлов слева, и приглашение мастера справа. Дерево нужно только для того чтобы открыть ранее сохранённый проект. Нажимаем «Далее» чтобы начать новый проект или возобновить прерванную закачку:

Читать еще:  Как писать цветными буквами название сервера. Как сделать цветное названия сервера

Вводим любое название и путь для сохранения сайта. Путь по умолчанию «C:Мои Web Сайты» лучше поменять на «C:Downloads»:

На третьем шаге нужно ввести домен. Для примера, я буду скачивать свой сайт it-like.ru. Тип проекта можно выбрать «Загрузить сайт(ы)», если это новый проект, или «Продолжить прерванную загрузку», если нужно докачать сайт. Вариант «Обновить существующую закачку» полезен для тех, кто уже имеет копию сайта, но хочет её обновить до последней.

Здесь же можно задать дополнительные параметры, которые могут сократить время загрузки. По умолчанию можно ничего не менять, программа и так отработает нормально. Но всё же рекомендую обратить внимание на некоторые параметры:

  • Фильтры. Вы можете ограничить тип файлов для закачки. Например, запретить или разрешить скачивание видео или архивов (ZIP, RAR, CAB). По умолчанию включены картинки png, jpg, gif, файлы стилей css и скрипты js.
  • Ограничения. Задайте максимальную глубину сканирования сайта. Глубина – это количество переходов по ссылкам со стартовой страницы. Например, если стартовой является главная страница сайта, а глубина равна 2, то программа скачает первый уровень, т.е. главную страницу, и страницы на которые есть ссылки с главной, и всё. Если задать глубину 3, то будут скачены более глубокие страницы. Оптимальным является 3-4 уровня.
  • Линки. Поставьте галочку «Получить вначале HTML файлы!», это позволит сначала выкачать основной текстовый контент сайта, а затем уже картинки и другие файлы.

Идём дальше. На четвёртом шаге можно позволить автоматически устанавливать интернет-соединение и разрывать его по окончании закачки. Также можно выставить автоматическое выключение компьютера, по окончании работы (галочка «Shutdown PC when finished»).

Нажимаем «Готово» и идём за чашечкой кофе, пока WinHTTrack WebSite Copier работает за нас.

Читать еще:  Придумать опрос в контакте. Как провести опрос в контакте чтобы быстрее продвинуть группу

Готовый сайт можно открыть двумя способами.

  • из папки, в которую сохраняли проект, кликнув по файлу index.html. В этом случае откроется страница со списком всех проектов. Нужно выбрать интересующий.
  • из папки с именем самого проекта, кликнув по файлу index.html. В этом случае сразу откроется сайт.

Несколько фактов о веб-архиве

Первый запуск сервиса WebArchive состоялся в 1996 году. С тех пор этот инструмент сумел накопить в своей базе более 338 миллиардов сайтов. Представьте, сколько это! А дисковое пространство, которое занято информацией в архиве, составляет 1015 Терабайт. Если перевести на математический язык, то это квадриллион.

На следующий год после основания сервиса WebArchive добавил в свою базу сам себя. Хотите посмотреть, как он выглядел на тот момент? Тогда взгляните на изображение ниже.

Это самый первый его снимок от 26 января 1997 года.

На данный момент веб-архив считается наилучшим способом из бесплатных для создания снимков интернет-ресурсов. Возьмите его на вооружение.

Ссылка на основную публикацию
Статьи c упоминанием слов:
Adblock
detector