Архив Интернета

Не следует путать с arXiv.org — крупнейшим архивом электронных публикаций по точным и естественным наукам.

Internet Archive
URL archive.org​ (англ.)
Коммерческий нет
Тип сайта универсальная электронная библиотека
Язык(-и) английский
Расположение сервера  США
 Египет
 Нидерланды
Владелец Internet Archive
Автор Брюстер Кейл[1]
Начало работы 24 января 1996
Текущий статус работает
Оборот
Число сотрудников
  • 200 чел.
Слоган universal access to all knowledge
Рейтинг Alexa 262
Commons-logo.svg Медиафайлы на Викискладе

Архи́в Интерне́та (англ. Internet Archive) — некоммерческая организация, основанная в 1996 году в Сан-Франциско Брюстером Кейлом. Архив собирает копии веб-страниц, графические материалы, видео- и аудиозаписи и программное обеспечение. Архив обеспечивает долгосрочное архивирование собранного материала и бесплатный доступ к своим базам данных для широкой публики. Декларируемой целью Архива является сохранение культурно-исторических ценностей цивилизации в эпоху интернет-технологий, создание и поддержка электронной библиотеки. По состоянию на октябрь 2012 года размер Архива — 10 петабайт[3], а на окрябрь 2-16 — 10 петабайт[4]. По состоянию на август 2016 года содержит 502 миллиарда копий веб-страниц. Сервер Архива расположен в Сан-Франциско, зеркала — в Новой Александрийской библиотеке и в Амстердаме. С 2007 года Архив имеет юридический статус библиотеки[5].

История

Архив был создан Брюстером Кейлом в 1996 году примерно в то же время, когда он основал компанию Alexa Internet, занимающуюся сбором статистики о посещаемости веб-сайтов. В октябре того же года организация начала архивировать и хранить копии веб-страниц[6]. Сохранённые копии не были доступны для широкой публики до создания в 2001 году веб-сервиса Wayback Machine. С конца 1999 года Архив начал расширение за пределы веб-архива и в настоящее время помимо копий веб-сайтов включает тексты, видео, звукозаписи, программное обеспечение и изображения.

Проекты

Wayback Machine

Логотип Wayback Machine

The Wayback Machine — веб-сервис Архива. Содержание веб-страниц время от времени фиксируется c помощью бота, или при ручном указании посетителем сайта адреса страницы для фиксации. Таким образом, можно посмотреть, как выглядела та или иная страница раньше, даже если она больше не существует.

Легальность

На сервис не раз подавались судебные иски, в связи с тем, что публикация контента может быть нелегальной[7]. Поэтому сервис удаляет материалы из публичного доступа по требованию их правообладателей, или если доступ к страницам сайтов не разрешён в файле robots.txt владельцами этих сайтов.

В 2002 году часть архивных копий веб-страниц, содержащих критику саентологии, была удалена из архива[8] с пояснением, что это было сделано по «просьбе владельцев сайта»[9]. В дальнейшем выяснилось, что этого потребовали юристы Церкви саентологии, тогда как настоящие владельцы сайта не желали удаления своих материалов[10]. Некоторые пользователи сочли это проявлением интернет-цензуры.

Книжный сканер Архива Книга, изготовленная в течение 20 минут в рамках проекта Book-on-demand, на основе электронной книги из Архива

Open Library

Основная статья: Open Library

Open Library — общественный проект по сканированию всех книг в мире, к которому приступила Internet Archive в октябре 2005 года. На февраль 2010 года библиотека содержит в открытом доступе 1 миллион 165 тысяч книг, в каталог библиотеки занесено больше 22 млн изданий. По данным на 2008 год Архиву принадлежит 13 центров оцифровки в крупных библиотеках. По оценке Internet Archive на ноябрь 2008 года, коллекция составила более 0,5 петабайт, включая изображения и документы в формате PDF[11]. Коллекция постоянно растёт, так как библиотека сканирует около 1000 книг в день.

Scan-on-demand — бесплатная оцифровка желаемых публикаций из фондов Бостонской общественной библиотеки, относится к проекту «Открытая библиотека».

Собрание фильмов, аудио, текстов и программного обеспечения, которые являются общественным достоянием или распространяются под лицензией Creative Commons.

Награды

23 марта 2010 года Архив Интернета назван победителем в номинации Project of Social Benefit ежегодной премии Free Software Awards, организованной некоммерческим фондом Free Software Foundation (FSF)[12][13].

Блокировка Архива Интернета

В России

Images.png Внешние изображения
Image-silk.png Страница сайта Роскомнадзора с сообщением о блокировке страницы «Одиночный джихад»

В октябре 2014 года Роскомнадзор заблокировал на территории РФ доступ к некоторым страницам Архива Интернета за видеоролик «Звон мечей» экстремистской группировки «Исламское государство Ирака и Леванта» (нынешнее название — «Исламское государство»). Ранее блокировались только ссылки на отдельные материалы в архиве, однако 24 октября 2014 года в реестр запрещённых сайтов временно был включён сам домен и его IP-адрес[14][15][16].

16 июня 2015 года на основании статьи 15.3 закона «Об информации, информационных технологиях и о защите информации» генпрокуратура РФ приняла решение о блокировке страницы «Одиночный джихад в России», содержащей по её мнению «призывы к массовым беспорядкам, осуществлению экстремистской деятельности, участию в массовых мероприятиях, проводимых с нарушением установленного порядка»[16][17][18], в действительности на территории России был заблокирован доступ ко всему сайту, кроме The Wayback Machine.

С апреля 2016 Роскомнадзор решил убрать сайт из блокировок, и он доступен в России.

В Казахстане

Архив недоступен на территории Казахстана, хотя официальных сведений о блокировке нет.

См. также

Примечания

  1. Internet Archive: BiosInternet Archive.<a href=»https://wikidata.org/wiki/Track:Q461«></a>
  2. https://projects.propublica.org/nonprofits/organizations/943242767
  3. 10,000,000,000,000,000 bytes archived! (неопр.). Архивировано 28 ноября 2012 года.
  4. Defining Web pages, Web sites and Web captures (неопр.).
  5. Internet Archive officially a library (неопр.). Internet Archive (7 мая 2007). Дата обращения 31 августа 2016.
  6. Internet Archive: In the Collections (неопр.) (недоступная ссылка). Wayback Machine (6 июня 2000). Дата обращения 1 сентября 2016. Архивировано 6 июня 2000 года.
  7. Статья о сервисе в англ. Википедии. (англ.)
  8. Bowman, Lisa M. Net archive silences Scientology critic, CNET News.com (24 сентября 2002 г). Архивировано 16 июля 2012 года. Дата обращения 4 января 2007.
  9. Jeff. exclusions from the Wayback Machine (неопр.) (Blog). Wayback Machine Forum. Internet Archive (23 сентября 2002 г.). Дата обращения 4 января 2007. Архивировано 25 августа 2011 года. Author and Date indicate initiation of forum thread
  10. Miller, Ernest Sherman, Set the Wayback Machine for Scientology (неопр.) (Blog). LawMeme. Yale Law School (24 сентября). Дата обращения 4 января 2007. Архивировано 25 августа 2011 года. The posting is billed as a ‘feature’ and lacks an associated year designation; comments by other contributors appear after the ‘feature’
  11. Bulk Access to OCR for 1 Million Books, via Open Library Blog, by raj, 24 ноября 2008. (неопр.). Архивировано 28 ноября 2012 года.
  12. Free Software Awards Announced (неопр.). Архивировано 28 ноября 2012 года.
  13. Стали известны номинанты ежегодной награды Free Software Awards (неопр.). Архивировано 28 ноября 2012 года.
  14. Производится блокировка экстремистского видео террористической организации «Исламское государство Ирака и Леванта» в сети Интернет (неопр.). Роскомнадзор (24 октября 2014).
  15. Роскомнадзор внёс «архив интернета» в реестр запрещённых сайтов.
  16. 1 2 Роскомнадзор заблокировал архив интернета // РБК. 25 июня 2015 года.
  17. Роскомнадзор заблокировал страницу «архива интернета» за экстремизм // Lenta.ru. 25 июня 2015 года.
  18. Роскомнадзор заблокировал архив интернета из-за «Одиночного джихада» // Московский комсомолец. 25 июня 2015 года.

Литература

Ссылки

Зеркала