Wayback Machine: відмінності між версіями

Матеріал з Вікіпедії — вільної енциклопедії.
Перейти до навігації Перейти до пошуку
[перевірена версія][перевірена версія]
Вилучено вміст Додано вміст
м Відкинуто редагування 2A00:102A:4015:4E4B:B430:4CC4:6E62:F530 (обговорення) до зробленого BunykBot
Мітка: Відкіт
вікіфікація
 
Рядок 8: Рядок 8:
|registration=Optional
|registration=Optional
|owner=[[Internet Archive]]
|owner=[[Internet Archive]]
|launch date={{start date and age|2001|10|24}}<ref>{{cite web |url=http://whois.domaintools.com/waybackmachine.org |title=WayBackMachine.org WHOIS, DNS, & Domain Info – DomainTools |work=[[WHOIS]] |date= |accessdate=13 березня 2016 |archive-date=14 травня 2020 |archive-url=https://web.archive.org/web/20200514175402/http://whois.domaintools.com/waybackmachine.org }}</ref><ref>{{cite web|url=http://whois.domaintools.com/internetarchive.org|title=InternetArchive.org WHOIS, DNS, & Domain Info – DomainTools|work=[[WHOIS]]|date=|accessdate=13 березня 2016|archive-date=12 травня 2020|archive-url=https://web.archive.org/web/20200512114745/http://whois.domaintools.com/internetarchive.org}}</ref>
|launch date={{start date and age|2001|10|24}}<ref>{{cite web |url=http://whois.domaintools.com/waybackmachine.org |title=WayBackMachine.org WHOIS, DNS, & Domain Info – DomainTools |work=[[WHOIS]]|accessdate=13 березня 2016 |archivedate=14 травня 2020 |archiveurl=https://web.archive.org/web/20200514175402/http://whois.domaintools.com/waybackmachine.org }}</ref><ref>{{cite web|url=http://whois.domaintools.com/internetarchive.org|title=InternetArchive.org WHOIS, DNS, & Domain Info – DomainTools|work=[[WHOIS]]|accessdate=13 березня 2016|archivedate=12 травня 2020|archiveurl=https://web.archive.org/web/20200512114745/http://whois.domaintools.com/internetarchive.org}}</ref>
|alexa={{DecreasePositive}} 253 ({{asof|2019|02|04|alt=February 2019}})<ref name="alexa">{{cite web |title=Archive.org Traffic, Demographics and Competitors - Alexa |url=https://www.alexa.com/siteinfo/archive.org |website=alexa.com |accessdate=4 лютого 2019 |archive-date=23 березня 2019 |archive-url=https://web.archive.org/web/20190323051243/https://www.alexa.com/siteinfo/archive.org }}</ref>
|alexa={{DecreasePositive}} 253 ({{asof|2019|02|04|alt=February 2019}})<ref name="alexa">{{cite web |title=Archive.org Traffic, Demographics and Competitors - Alexa |url=https://www.alexa.com/siteinfo/archive.org |website=alexa.com |accessdate=4 лютого 2019 |archivedate=23 березня 2019 |archiveurl=https://web.archive.org/web/20190323051243/https://www.alexa.com/siteinfo/archive.org }}</ref>
|current status=Active
|current status=Active
<!-- | revenue = This parameter is more appropriate for the Internet Archive article. This article is only about the website. -->}}
<!-- | revenue = This parameter is more appropriate for the Internet Archive article. This article is only about the website. -->}}
Рядок 15: Рядок 15:


== Історія ==
== Історія ==
2001 року засновники [[Internet Archive]] [[Брюстер Кале]] і {{нп|Брюс Джилліат||en|Bruce Gilliat}} запустили проект Wayback Machine, щоб розв'язати проблему зникнення контенту вебсайтів щоразу, коли їх змінюють або закривають<ref>{{cite journal |last=Notess |first=Greg R. |date=March–April 2002 |title=The Wayback Machine: The Web's Archive |url= |journal=Online |volume=26 |pages=59–61 |via=EBSCOhost}}</ref>. Сервіс дозволяє користувачам переглядати архівні версії [[Вебсторінка|вебсторінок]], як вони змінювались з часом, які в архіві називаються «тривимірним індексом»<ref name="FAQ">{{Citation|title=Frequently Asked Questions|url=https://archive.org/about/faqs.php#The_Wayback_Machine|archiveurl=https://web.archive.org/web/20180918131957/https://archive.org/about/faqs.php#The_Wayback_Machine|deadurl=no|chapter=The Wayback Machine|access-date=18 вересня 2018|archivedate=September 18, 2018}}</ref>. Кале і Джилліат створили сервіс, сподіваючись заархівувати весь інтернет і забезпечити «загальний доступ до всіх знань»<ref name=":0">{{Cite web|url=https://blog.archive.org/2016/10/25/20000-hard-drives-on-a-mission/|title=20,000 Hard Drives on a Mission {{!}} Internet Archive Blogs|website=blog.archive.org|language=en-US|accessdate=15 жовтня 2018|archiveurl=https://web.archive.org/web/20181020153727/https://blog.archive.org/2016/10/25/20000-hard-drives-on-a-mission/|archivedate=October 20, 2018|deadurl=no}}</ref>.
2001 року засновники [[Internet Archive]] [[Брюстер Кале]] і {{нп|Брюс Джилліат||en|Bruce Gilliat}} запустили проект Wayback Machine, щоб розв'язати проблему зникнення контенту вебсайтів щоразу, коли їх змінюють або закривають<ref>{{cite journal |last=Notess |first=Greg R. |date=March–April 2002 |title=The Wayback Machine: The Web's Archive |url= |journal=Online |volume=26 |pages=59–61 |via=EBSCOhost}}</ref>. Сервіс дозволяє користувачам переглядати архівні версії [[Вебсторінка|вебсторінок]], як вони змінювались з часом, які в архіві називаються «тривимірним індексом»<ref name="FAQ">{{Citation|title=Frequently Asked Questions|url=https://archive.org/about/faqs.php#The_Wayback_Machine|archiveurl=https://web.archive.org/web/20180918131957/https://archive.org/about/faqs.php#The_Wayback_Machine|deadurl=no|chapter=The Wayback Machine|accessdate=18 вересня 2018|archivedate=September 18, 2018}}</ref>. Кале і Джилліат створили сервіс, сподіваючись заархівувати весь інтернет і забезпечити «загальний доступ до всіх знань»<ref name=":0">{{Cite web|url=https://blog.archive.org/2016/10/25/20000-hard-drives-on-a-mission/|title=20,000 Hard Drives on a Mission {{!}} Internet Archive Blogs|website=blog.archive.org|language=en|accessdate=15 жовтня 2018|archiveurl=https://web.archive.org/web/20181020153727/https://blog.archive.org/2016/10/25/20000-hard-drives-on-a-mission/|archivedate=October 20, 2018|deadurl=no}}</ref>.


Назву ''Wayback Machine'' вибрали як посилання на пристрій для [[Подорож у часі|подорожей у часі]], який застосовують персонажі {{нп|Містер Пібоді||en|Mr. Peabody}} і Шерман в анімаційному фільмі ''{{нп|Шоу Роккі та Буллвінкля||en|The Rocky and Bullwinkle Show}}''<ref>{{Cite news|url=http://www.businessweek.com/technology/content/feb2002/tc20020228_1080.htm|title=A Library as Big as the World|last=Green|first=Heather|date=28 лютого 2002|archiveurl=https://web.archive.org/web/20111220074306/http://www.businessweek.com/technology/content/feb2002/tc20020228_1080.htm|archivedate=December 20, 2011|publisher=BusinessWeek}}</ref><ref>{{Cite news|url=https://www.nytimes.com/2002/09/08/business/responsible-party-brewster-kahle-a-library-of-the-web-on-the-web.html|title=Responsible Party – Brewster Kahle; A Library Of the Web, On the Web|last=Tong|first=Judy|date=8 вересня 2002|work=New York Times|accessdate=15 серпня 2011|archiveurl=https://web.archive.org/web/20110220181725/http://www.nytimes.com/2002/09/08/business/responsible-party-brewster-kahle-a-library-of-the-web-on-the-web.html|archivedate=February 20, 2011|deadurl=no}}</ref> під назвою «{{iw|WABAC machine||}}<nowiki/>» (вимовляється ''вей-бек''). В одній з частин цього анімаційного мультфільму, ''{{нп|Неймовірна історія Пібоді||en|Peabody's Improbable History}}'', персонажі за допомогою [[Машина часу|машини часу]] часто стають свідками відомих історичних подій, беруть в них участь і, здебільшого, змінюють їхній перебіг.
Назву ''Wayback Machine'' вибрали як посилання на пристрій для [[Подорож у часі|подорожей у часі]], який застосовують персонажі {{нп|Містер Пібоді||en|Mr. Peabody}} і Шерман в анімаційному фільмі ''{{нп|Шоу Роккі та Буллвінкля||en|The Rocky and Bullwinkle Show}}''<ref>{{Cite news|url=http://www.businessweek.com/technology/content/feb2002/tc20020228_1080.htm|title=A Library as Big as the World|last=Green|first=Heather|date=28 лютого 2002|archiveurl=https://web.archive.org/web/20111220074306/http://www.businessweek.com/technology/content/feb2002/tc20020228_1080.htm|archivedate=December 20, 2011|publisher=BusinessWeek}}</ref><ref>{{Cite news|url=https://www.nytimes.com/2002/09/08/business/responsible-party-brewster-kahle-a-library-of-the-web-on-the-web.html|title=Responsible Party – Brewster Kahle; A Library Of the Web, On the Web|last=Tong|first=Judy|date=8 вересня 2002|work=New York Times|accessdate=15 серпня 2011|archiveurl=https://web.archive.org/web/20110220181725/http://www.nytimes.com/2002/09/08/business/responsible-party-brewster-kahle-a-library-of-the-web-on-the-web.html|archivedate=February 20, 2011|deadurl=no}}</ref> під назвою «{{iw|WABAC machine||}}<nowiki/>» (вимовляється ''вей-бек''). В одній з частин цього анімаційного мультфільму, ''{{нп|Неймовірна історія Пібоді||en|Peabody's Improbable History}}'', персонажі за допомогою [[Машина часу|машини часу]] часто стають свідками відомих історичних подій, беруть в них участь і, здебільшого, змінюють їхній перебіг.


У [[Травень|травні]] [[1996]] року Wayback Machine почала архівувати [[кеш]]овані вебсторінки з метою через п'ять років зробити послугу доступною громадськості<ref name="IA: Wayback">{{Cite web|url=https://archive.org/web/|title=Internet Archive: Wayback Machine|website=archive.org|language=en|accessdate=15 жовтня 2018|archiveurl=https://web.archive.org/web/20140103004344/http://archive.org/web/|archivedate=January 3, 2014|deadurl=no}}</ref>. Від 1996 до 2001 року інформація зберігалася на [[Магнітна стрічка|магнітних стрічках]], а Кале зрідка дозволяв дослідникам і науковцям під'єднуватись до громіздкої [[База даних|бази даних]]<ref>{{Cite news|last=Cook|first=John|title=Web site takes you way back in Internet history|url=http://www.seattlepi.com/news/article/Web-site-takes-you-way-back-in-Internet-history-1070534.php|accessdate=15 серпня 2011|work=Seattle Post-Intelligencer|date=1 листопада 2001|deadurl=no|archiveurl=https://web.archive.org/web/20140812205508/http://www.seattlepi.com/news/article/Web-site-takes-you-way-back-in-Internet-history-1070534.php|archivedate=August 12, 2014}}</ref>. 2001 року, коли архівові виповнилося п'ять років, відбулась церемонія його відкриття громадськості в [[Університет Каліфорнії (Берклі)|Університеті Каліфорнії]] ([[Берклі]])<ref>{{cite journal |url=https://www.wired.com/2001/10/wayback-goes-way-back-on-web/ |title=Wayback Goes Way Back on Web |journal=Wired |author= |date=28 жовтня 2001 |accessdate=16 жовтня 2017 |deadurl=no |archiveurl=https://web.archive.org/web/20171016225914/https://www.wired.com/2001/10/wayback-goes-way-back-on-web/ |archivedate=October 16, 2017 |df= }}</ref>. На час запуску Wayback Machine вона вже містила понад 10 мільярдів архівованих сторінок<ref name="Arora (2015)" />.
У [[Травень|травні]] [[1996]] року Wayback Machine почала архівувати [[кеш]]овані вебсторінки з метою через п'ять років зробити послугу доступною громадськості<ref name="IA: Wayback">{{Cite web|url=https://archive.org/web/|title=Internet Archive: Wayback Machine|website=archive.org|language=en|accessdate=15 жовтня 2018|archiveurl=https://web.archive.org/web/20140103004344/http://archive.org/web/|archivedate=January 3, 2014|deadurl=no}}</ref>. Від 1996 до 2001 року інформація зберігалася на [[Магнітна стрічка|магнітних стрічках]], а Кале зрідка дозволяв дослідникам і науковцям під'єднуватись до громіздкої [[База даних|бази даних]]<ref>{{Cite news|last=Cook|first=John|title=Web site takes you way back in Internet history|url=http://www.seattlepi.com/news/article/Web-site-takes-you-way-back-in-Internet-history-1070534.php|accessdate=15 серпня 2011|work=Seattle Post-Intelligencer|date=1 листопада 2001|deadurl=no|archiveurl=https://web.archive.org/web/20140812205508/http://www.seattlepi.com/news/article/Web-site-takes-you-way-back-in-Internet-history-1070534.php|archivedate=August 12, 2014}}</ref>. 2001 року, коли архівові виповнилося п'ять років, відбулась церемонія його відкриття громадськості в [[Університет Каліфорнії (Берклі)|Університеті Каліфорнії]] ([[Берклі]])<ref>{{cite journal|url=https://www.wired.com/2001/10/wayback-goes-way-back-on-web/|title=Wayback Goes Way Back on Web|journal=Wired|date=28 жовтня 2001|accessdate=16 жовтня 2017|deadurl=no|archiveurl=https://web.archive.org/web/20171016225914/https://www.wired.com/2001/10/wayback-goes-way-back-on-web/|archivedate=October 16, 2017}}</ref>. На час запуску Wayback Machine вона вже містила понад 10 мільярдів архівованих сторінок<ref name="Arora (2015)" />.


Нині дані зберігаються на великому [[Комп'ютерний кластер|кластері]] обчислювальних вузлів [[Linux]] компанії Internet Archive<ref name=":0" />. Він час від часу заново відвідує і архівує нові версії вебсайтів (див. технічні дані нижче)<ref name="leetaru" />. Сторінки також можна архівувати вручну, вводячи їх [[Уніфікований локатор ресурсів|URL-адреси]] в поле пошуку, за умови, що вебсайти дозволяють пошуковому роботу Wayback Machine просканувати їх і зберегти дані<ref name="IA: Wayback" />.
Нині дані зберігаються на великому [[Комп'ютерний кластер|кластері]] обчислювальних вузлів [[Linux]] компанії Internet Archive<ref name=":0" />. Він час від часу заново відвідує і архівує нові версії вебсайтів (див. технічні дані нижче)<ref name="leetaru" />. Сторінки також можна архівувати вручну, вводячи їх [[Уніфікований локатор ресурсів|URL-адреси]] в поле пошуку, за умови, що вебсайти дозволяють пошуковому роботу Wayback Machine просканувати їх і зберегти дані<ref name="IA: Wayback" />.
Рядок 26: Рядок 26:
Wayback Machine за допомогою спеціального [[пошуковий робот|пошукового робота]] сканує Інтернет і завантажує всі загальнодоступні вебсторінки, ієрархію [[Gopher]], електронну дошку оголошень [[Usenet]], а також завантажуване програмне забезпечення<ref name="ArchivingInternet">{{Cite web|last=Kahle|first=Brewster|title=Archiving the Internet|url=http://www.uibk.ac.at/voeb/texte/kahle.html|publisher=Scientific American – March 1997 Issue|accessdate=19 серпня 2011|deadurl=no|archiveurl=https://web.archive.org/web/20120403042627/http://www.uibk.ac.at/voeb/texte/kahle.html|archivedate=April 3, 2012}}</ref>. Ці роботи можуть відсканувати не всю доступну в Інтернеті інформацію, оскільки доступ до значної частини даних обмежують власники сайтів, або ж ці дані зберігається в недоступних базах даних. Щоб подолати неузгодженості частково кешованих вебсайтів, [[2005]] року компанія Internet Archive створила сайт Archive-It.org як засіб, що дозволяє установам і творцям контенту за власним бажанням збирати і зберігати зібрання цифрового контенту та створювати цифрові архіви<ref>{{Cite web|url=https://blog.archive.org/2014/10/27/archive-it-crawling-the-web-together/|title=Archive-It: Crawling the Web Together|website=Internet Archive Blogs|last=Jeff Kaplan|date=27 жовтня 2014|accessdate=16 жовтня 2017|deadurl=no|archiveurl=https://web.archive.org/web/20171012212827/http://blog.archive.org/2014/10/27/archive-it-crawling-the-web-together/|archivedate=October 12, 2017}}</ref>.
Wayback Machine за допомогою спеціального [[пошуковий робот|пошукового робота]] сканує Інтернет і завантажує всі загальнодоступні вебсторінки, ієрархію [[Gopher]], електронну дошку оголошень [[Usenet]], а також завантажуване програмне забезпечення<ref name="ArchivingInternet">{{Cite web|last=Kahle|first=Brewster|title=Archiving the Internet|url=http://www.uibk.ac.at/voeb/texte/kahle.html|publisher=Scientific American – March 1997 Issue|accessdate=19 серпня 2011|deadurl=no|archiveurl=https://web.archive.org/web/20120403042627/http://www.uibk.ac.at/voeb/texte/kahle.html|archivedate=April 3, 2012}}</ref>. Ці роботи можуть відсканувати не всю доступну в Інтернеті інформацію, оскільки доступ до значної частини даних обмежують власники сайтів, або ж ці дані зберігається в недоступних базах даних. Щоб подолати неузгодженості частково кешованих вебсайтів, [[2005]] року компанія Internet Archive створила сайт Archive-It.org як засіб, що дозволяє установам і творцям контенту за власним бажанням збирати і зберігати зібрання цифрового контенту та створювати цифрові архіви<ref>{{Cite web|url=https://blog.archive.org/2014/10/27/archive-it-crawling-the-web-together/|title=Archive-It: Crawling the Web Together|website=Internet Archive Blogs|last=Jeff Kaplan|date=27 жовтня 2014|accessdate=16 жовтня 2017|deadurl=no|archiveurl=https://web.archive.org/web/20171012212827/http://blog.archive.org/2014/10/27/archive-it-crawling-the-web-together/|archivedate=October 12, 2017}}</ref>.


Сканування надходять з різних джерел. Деякі імпортуються від третіх сторін, тоді як інші генеруються всередині самого Архіву<ref name=leetaru/>. Наприклад, сканування надходять від [[Фундація Альфреда Слоуна|Фундації Альфреда Слоуна]] і [[Alexa Internet|Alexa]], сканування зроблені ІА для [[Національне управління архівів та документації|Національного управління архівів та документації]] та {{iw|Internet Memory Foundation||}}, [[Дзеркало сайту|дзеркал]] {{iw|Common Crawl||}}<ref name="leetaru" />. «Worldwide Web Crawls» працює з [[2010]] року і сканує всемережжя<ref name=":3">{{Cite web|url=https://archive.org/details/widecrawl&tab=about|title=Worldwide Web Crawls|publisher=Internet Archive|last=|date=|accessdate=16 жовтня 2017|deadurl=no|archiveurl=https://web.archive.org/web/20171019222740/https://archive.org/details/widecrawl%26tab%3Dabout|archivedate=October 19, 2017}}</ref><ref name="leetaru" />.
Сканування надходять з різних джерел. Деякі імпортуються від третіх сторін, тоді як інші генеруються всередині самого Архіву<ref name=leetaru/>. Наприклад, сканування надходять від [[Фундація Альфреда Слоуна|Фундації Альфреда Слоуна]] і [[Alexa Internet|Alexa]], сканування зроблені ІА для [[Національне управління архівів та документації|Національного управління архівів та документації]] та {{iw|Internet Memory Foundation||}}, [[Дзеркало сайту|дзеркал]] {{iw|Common Crawl||}}<ref name="leetaru" />. «Worldwide Web Crawls» працює з [[2010]] року і сканує всемережжя<ref name=":3">{{Cite web|url=https://archive.org/details/widecrawl&tab=about|title=Worldwide Web Crawls|publisher=Internet Archive|accessdate=16 жовтня 2017|deadurl=no|archiveurl=https://web.archive.org/web/20171019222740/https://archive.org/details/widecrawl%26tab%3Dabout|archivedate=October 19, 2017}}</ref><ref name="leetaru" />.


Частота зроблених знімків сторінок змінюється в залежності від вебсайту<ref name=leetaru/>. Сайти у «Worldwide Web Crawls» вміщені в «список сканувань». Один сайт архівується раз за сканування<ref name="leetaru" />. Сканування може тривати кілька місяців або навіть років у залежності від розміру<ref name="leetaru" />. Наприклад, «Wide Crawl Number 13» розпочався 9 [[Січень|січня]] [[2015]] року й завершився 11 [[Липень|липня]] [[2016]] року<ref>{{Cite web|url=https://archive.org/details/wide00013?&sort=-publicdate&page=3|title=Wide Crawl Number 13|publisher=Internet Archive|last=|date=|accessdate=16 жовтня 2017|deadurl=no|archiveurl=https://web.archive.org/web/20171019223332/https://archive.org/details/wide00013?&sort=-publicdate&page=3|archivedate=October 19, 2017}}</ref>. Однак, в один і той самий час може відбуватись кілька сканувань, і сайт може бути вміщено в понад один список сканувань, тож частота сканування сайтів змінюється в широких межах<ref name="leetaru">{{Cite web|url=https://www.forbes.com/sites/kalevleetaru/2016/01/18/the-internet-archive-turns-20-a-behind-the-scenes-look-at-archiving-the-web/#222f2e5682e0|title=The Internet Archive Turns 20: A Behind the Scenes Look at Archiving the Web|website=Forbes|last=Kalev Leetaru|date=28 січня 2016|accessdate=16 жовтня 2017|deadurl=no|archiveurl=https://web.archive.org/web/20171016230439/https://www.forbes.com/sites/kalevleetaru/2016/01/18/the-internet-archive-turns-20-a-behind-the-scenes-look-at-archiving-the-web/#222f2e5682e0|archivedate=October 16, 2017}}</ref>.
Частота зроблених знімків сторінок змінюється в залежності від вебсайту<ref name=leetaru/>. Сайти у «Worldwide Web Crawls» вміщені в «список сканувань». Один сайт архівується раз за сканування<ref name="leetaru" />. Сканування може тривати кілька місяців або навіть років у залежності від розміру<ref name="leetaru" />. Наприклад, «Wide Crawl Number 13» розпочався 9 січня 2015 року й завершився 11 липня 2016 року<ref>{{Cite web|url=https://archive.org/details/wide00013?&sort=-publicdate&page=3|title=Wide Crawl Number 13|publisher=Internet Archive|accessdate=16 жовтня 2017|deadurl=no|archiveurl=https://web.archive.org/web/20171019223332/https://archive.org/details/wide00013?&sort=-publicdate&page=3|archivedate=October 19, 2017}}</ref>. Однак, в один і той самий час може відбуватись кілька сканувань, і сайт може бути вміщено в понад один список сканувань, тож частота сканування сайтів змінюється в широких межах<ref name="leetaru">{{Cite web|url=https://www.forbes.com/sites/kalevleetaru/2016/01/18/the-internet-archive-turns-20-a-behind-the-scenes-look-at-archiving-the-web/#222f2e5682e0|title=The Internet Archive Turns 20: A Behind the Scenes Look at Archiving the Web|website=Forbes|last=Kalev Leetaru|date=28 січня 2016|accessdate=16 жовтня 2017|deadurl=no|archiveurl=https://web.archive.org/web/20171016230439/https://www.forbes.com/sites/kalevleetaru/2016/01/18/the-internet-archive-turns-20-a-behind-the-scenes-look-at-archiving-the-web/#222f2e5682e0|archivedate=October 16, 2017}}</ref>.


=== Місткість сховища та її зростання ===
=== Місткість сховища та її зростання ===
Рядок 35: Рядок 35:
[[2009]] року Internet Archive перевів свою спеціалізовану архітектуру зберігання до {{iw|Sun Open Storage||}}, і має у своїй власності новий [[Центр даних|центр обробки даних]] у {{iw|Sun Modular Datacenter}} у каліфорнійському кампусі [[Sun Microsystems]]<ref>{{Cite web|title=Internet Archive and Sun Microsystems Create Living History of the Internet|publisher=[[Sun Microsystems]]|date=25 березня 2009|url=http://www.sun.com/aboutsun/pr/2009-03/sunflash.20090325.1.xml|accessdate=27 березня 2009|deadurl=no|archiveurl=https://web.archive.org/web/20090326200212/http://www.sun.com/aboutsun/pr/2009-03/sunflash.20090325.1.xml|archivedate=March 26, 2009}}</ref>. {{Станом на|2009}} Wayback Machine містила приблизно три [[петабайт]]и даних і зростала зі швидкістю 100 [[терабайт]] на місяць<ref>{{Cite news|url=http://www.computerworld.com/action/article.do?command=viewArticleBasic&taxonomyName=hardware&articleId=9130081&taxonomyId=12&intsrc=kc_top|title=Internet Archive to unveil massive Wayback Machine data center|last=Mearian|first=Lucas|date=19 березня 2009|accessdate=22 березня 2009|archiveurl=https://web.archive.org/web/20090323093002/http://www.computerworld.com/action/article.do?command=viewArticleBasic&taxonomyName=hardware&articleId=9130081&taxonomyId=12&intsrc=kc_top|archivedate=March 23, 2009|publisher=Computerworld.com}}</ref>.
[[2009]] року Internet Archive перевів свою спеціалізовану архітектуру зберігання до {{iw|Sun Open Storage||}}, і має у своїй власності новий [[Центр даних|центр обробки даних]] у {{iw|Sun Modular Datacenter}} у каліфорнійському кампусі [[Sun Microsystems]]<ref>{{Cite web|title=Internet Archive and Sun Microsystems Create Living History of the Internet|publisher=[[Sun Microsystems]]|date=25 березня 2009|url=http://www.sun.com/aboutsun/pr/2009-03/sunflash.20090325.1.xml|accessdate=27 березня 2009|deadurl=no|archiveurl=https://web.archive.org/web/20090326200212/http://www.sun.com/aboutsun/pr/2009-03/sunflash.20090325.1.xml|archivedate=March 26, 2009}}</ref>. {{Станом на|2009}} Wayback Machine містила приблизно три [[петабайт]]и даних і зростала зі швидкістю 100 [[терабайт]] на місяць<ref>{{Cite news|url=http://www.computerworld.com/action/article.do?command=viewArticleBasic&taxonomyName=hardware&articleId=9130081&taxonomyId=12&intsrc=kc_top|title=Internet Archive to unveil massive Wayback Machine data center|last=Mearian|first=Lucas|date=19 березня 2009|accessdate=22 березня 2009|archiveurl=https://web.archive.org/web/20090323093002/http://www.computerworld.com/action/article.do?command=viewArticleBasic&taxonomyName=hardware&articleId=9130081&taxonomyId=12&intsrc=kc_top|archivedate=March 23, 2009|publisher=Computerworld.com}}</ref>.


Нова, поліпшена версія Wayback Machine, з оновленим інтерфейсом і новішим покажчиком архівних матеріалів, стала доступною для публічного тестування у [[2011]] році<ref name="WordpressArchive">{{Cite web|title=Updated Wayback Machine in Beta Testing|url=http://iawebarchiving.wordpress.com/2011/01/24/updated-wayback-machine-in-beta-testing/|publisher=Archive.org|accessdate=19 серпня 2011|deadurl=no|archiveurl=https://web.archive.org/web/20110823040310/http://iawebarchiving.wordpress.com/2011/01/24/updated-wayback-machine-in-beta-testing/|archivedate=August 23, 2011}}</ref>. У [[Березень|березні]] того самого року на форумі Wayback Machine було сказано, що «бета-версія нової Wayback Machine має повніший і актуальніший покажчик всіх відсканованих матеріалів до 2010 року, й продовжить регулярно оновлюватися. Покажчик, який управляв старою Wayback Machine, має небагато матеріалів після 2008 року, і жодних його подальших оновлень не планується, оскільки цього року його припинять використовувати»<ref>{{Cite web|url=https://www.archive.org/post/350738/updated-wayback-machine-in-beta-testing|title=Beta Wayback Machine, in forum|publisher=Archive.org|date=|accessdate=16 квітня 2014|deadurl=no|archiveurl=https://web.archive.org/web/20140417082107/https://archive.org/post/350738/updated-wayback-machine-in-beta-testing|archivedate=April 17, 2014}}</ref>. Також 2011 року інтернет-архів встановив свою шосту пару стелажів PetaBox, що дозволило збільшити місткість Wayback Machine на 700 терабайт<ref>{{Cite web|url=https://archive.org/post/353721/6th-pair-of-racks-go-into-service-over-2pb-of-data-space-used|title=Internet Archive Forums: 6th pair of racks go into service: over 2PB of data space used|website=archive.org|language=en|accessdate=25 жовтня 2018|archiveurl=https://web.archive.org/web/20161024144627/http://archive.org/post/353721/6th-pair-of-racks-go-into-service-over-2pb-of-data-space-used|archivedate=October 24, 2016|deadurl=no}}</ref>.
Нова, поліпшена версія Wayback Machine, з оновленим інтерфейсом і новішим покажчиком архівних матеріалів, стала доступною для публічного тестування у [[2011]] році<ref name="WordpressArchive">{{Cite web|title=Updated Wayback Machine in Beta Testing|url=http://iawebarchiving.wordpress.com/2011/01/24/updated-wayback-machine-in-beta-testing/|publisher=Archive.org|accessdate=19 серпня 2011|deadurl=no|archiveurl=https://web.archive.org/web/20110823040310/http://iawebarchiving.wordpress.com/2011/01/24/updated-wayback-machine-in-beta-testing/|archivedate=August 23, 2011}}</ref>. У [[Березень|березні]] того самого року на форумі Wayback Machine було сказано, що «бета-версія нової Wayback Machine має повніший і актуальніший покажчик всіх відсканованих матеріалів до 2010 року, й продовжить регулярно оновлюватися. Покажчик, який управляв старою Wayback Machine, має небагато матеріалів після 2008 року, і жодних його подальших оновлень не планується, оскільки цього року його припинять використовувати»<ref>{{Cite web|url=https://www.archive.org/post/350738/updated-wayback-machine-in-beta-testing|title=Beta Wayback Machine, in forum|publisher=Archive.org|accessdate=16 квітня 2014|deadurl=no|archiveurl=https://web.archive.org/web/20140417082107/https://archive.org/post/350738/updated-wayback-machine-in-beta-testing|archivedate=April 17, 2014}}</ref>. Також 2011 року інтернет-архів встановив свою шосту пару стелажів PetaBox, що дозволило збільшити місткість Wayback Machine на 700 терабайт<ref>{{Cite web|url=https://archive.org/post/353721/6th-pair-of-racks-go-into-service-over-2pb-of-data-space-used|title=Internet Archive Forums: 6th pair of racks go into service: over 2PB of data space used|website=archive.org|language=en|accessdate=25 жовтня 2018|archiveurl=https://web.archive.org/web/20161024144627/http://archive.org/post/353721/6th-pair-of-racks-go-into-service-over-2pb-of-data-space-used|archivedate=October 24, 2016|deadurl=no}}</ref>.


У січні [[2013]] року Internet Archive оголосила про нову віху&nbsp;— 240 мільярдів відсканованих URL-адрес<ref>{{Cite web|url=http://blog.archive.org/2013/01/09/updated-wayback/|title=Wayback Machine: Now with 240,000,000,000 URLs &#124; Internet Archive Blogs|publisher=Blog.archive.org|date=9 січня 2013|accessdate=16 квітня 2014|deadurl=no|archiveurl=https://web.archive.org/web/20140414221120/http://blog.archive.org/2013/01/09/updated-wayback/|archivedate=April 14, 2014}}</ref>. У [[Жовтень|жовтні]] 2013 року компанія оголосила про введення функції «Save a Page»<ref name="ia-2013-10">{{Cite web|url=https://blog.archive.org/2013/10/25/fixing-broken-links/|title=Fixing Broken Links on the Internet|last=Rossi|first=Alexis|date=25 жовтня 2013|website=archive.org|publisher=Collections Team, the Internet Archive|location=San Francisco, CA, US|archiveurl=https://web.archive.org/web/20141107193437/http://blog.archive.org/2013/10/25/fixing-broken-links/|archivedate=November 7, 2014|deadurl=no|accessdate=25 березня 2015|quote=We have added the ability to archive a page instantly and get back a permanent URL for that page in the Wayback Machine. This service allows anyone – wikipedia editors, scholars, legal professionals, students, or home cooks like me – to create a stable URL to cite, share or bookmark any information they want to still have access to in the future.}}</ref>, що дозволяє користувачам Інтернету заархівувати вміст URL-адреси і швидко створює [[постійне посилання]] на відміну від попередньої функції ''liveweb''. Це стало загрозою зловживань з боку сервісу як {{нп|Drive-by download|хостингу шкідливих двійкових файлів|en|Drive-by download}}<ref name="vt-207-241">{{Cite web|url=https://www.virustotal.com/en/ip-address/207.241.226.190/information/|title=207.241.226.190 IP address information|last=The VirusTotal Team|date=25 березня 2015|website=virustotal.com|publisher=[[VirusTotal]]|location=Dublin 2, Ireland|archiveurl=https://web.archive.org/web/20140714232311/https://www.virustotal.com/en/ip-address/207.241.226.190/information/|archivedate=July 14, 2014|deadurl=no|accessdate=25 березня 2015|quote=2015-03-25: Latest URLs hosted in this IP address detected by at least one URL scanner or malicious URL dataset. ... 2/62 2015-03-25 16:14:12 [complete URL redacted]/Renegotiating_TLS.pdf ... 1/62 2015-03-25 04:46:34 [complete URL redacted]/CBLightSetup.exe}}</ref><ref name="goog-sb-ia1">{{Cite web|url=http://www.google.com/safebrowsing/diagnostic?site=archive.org|title=Safe Browsing Diagnostic page for archive.org|last=Advisory provided by Google|date=25 березня 2015|website=google.com/safebrowsing|publisher=[[Google]]|location=Mountain View, CA, US|deadurl=no|accessdate=25 березня 2015|quote=2015-03-25: Part of this site was listed for suspicious activity 138 time(s) over the past 90 days. ... What happened when Google visited this site? ... Of the 42410 pages we tested on the site over the past 90 days, 450 page(s) resulted in malicious software being downloaded and installed without user consent. The last time Google visited this site was on 2015-03-25, and the last time suspicious content was found on this site was on 2015-03-25. ... Malicious software includes 169 trojan(s), 126 virus, 43 backdoor(s).|archiveurl=https://web.archive.org/web/20150406101743/http://www.google.com/safebrowsing/diagnostic?site=archive.org|archivedate=April 6, 2015}}</ref>.
У січні [[2013]] року Internet Archive оголосила про нову віху&nbsp;— 240 мільярдів відсканованих URL-адрес<ref>{{Cite web|url=http://blog.archive.org/2013/01/09/updated-wayback/|title=Wayback Machine: Now with 240,000,000,000 URLs &#124; Internet Archive Blogs|publisher=Blog.archive.org|date=9 січня 2013|accessdate=16 квітня 2014|deadurl=no|archiveurl=https://web.archive.org/web/20140414221120/http://blog.archive.org/2013/01/09/updated-wayback/|archivedate=April 14, 2014}}</ref>. У [[Жовтень|жовтні]] 2013 року компанія оголосила про введення функції «Save a Page»<ref name="ia-2013-10">{{Cite web|url=https://blog.archive.org/2013/10/25/fixing-broken-links/|title=Fixing Broken Links on the Internet|last=Rossi|first=Alexis|date=25 жовтня 2013|website=archive.org|publisher=Collections Team, the Internet Archive|location=San Francisco, CA, US|archiveurl=https://web.archive.org/web/20141107193437/http://blog.archive.org/2013/10/25/fixing-broken-links/|archivedate=November 7, 2014|deadurl=no|accessdate=25 березня 2015|quote=We have added the ability to archive a page instantly and get back a permanent URL for that page in the Wayback Machine. This service allows anyone – wikipedia editors, scholars, legal professionals, students, or home cooks like me – to create a stable URL to cite, share or bookmark any information they want to still have access to in the future.}}</ref>, що дозволяє користувачам Інтернету заархівувати вміст URL-адреси і швидко створює [[постійне посилання]] на відміну від попередньої функції ''liveweb''. Це стало загрозою зловживань з боку сервісу як {{нп|Drive-by download|хостингу шкідливих двійкових файлів|en|Drive-by download}}<ref name="vt-207-241">{{Cite web|url=https://www.virustotal.com/en/ip-address/207.241.226.190/information/|title=207.241.226.190 IP address information|last=The VirusTotal Team|date=25 березня 2015|website=virustotal.com|publisher=[[VirusTotal]]|location=Dublin 2, Ireland|archiveurl=https://web.archive.org/web/20140714232311/https://www.virustotal.com/en/ip-address/207.241.226.190/information/|archivedate=July 14, 2014|deadurl=no|accessdate=25 березня 2015|quote=2015-03-25: Latest URLs hosted in this IP address detected by at least one URL scanner or malicious URL dataset. ... 2/62 2015-03-25 16:14:12 [complete URL redacted]/Renegotiating_TLS.pdf ... 1/62 2015-03-25 04:46:34 [complete URL redacted]/CBLightSetup.exe}}</ref><ref name="goog-sb-ia1">{{Cite web|url=http://www.google.com/safebrowsing/diagnostic?site=archive.org|title=Safe Browsing Diagnostic page for archive.org|last=Advisory provided by Google|date=25 березня 2015|website=google.com/safebrowsing|publisher=[[Google]]|location=Mountain View, CA, US|deadurl=no|accessdate=25 березня 2015|quote=2015-03-25: Part of this site was listed for suspicious activity 138 time(s) over the past 90 days. ... What happened when Google visited this site? ... Of the 42410 pages we tested on the site over the past 90 days, 450 page(s) resulted in malicious software being downloaded and installed without user consent. The last time Google visited this site was on 2015-03-25, and the last time suspicious content was found on this site was on 2015-03-25. ... Malicious software includes 169 trojan(s), 126 virus, 43 backdoor(s).|archiveurl=https://web.archive.org/web/20150406101743/http://www.google.com/safebrowsing/diagnostic?site=archive.org|archivedate=April 6, 2015}}</ref>.


{{Станом на|2014|12}} Wayback Machine містила 435 мільярдів вебсторінок обсягом майже дев'ять петабайтів, і зростала приблизно на 20 терабайтів щотижня<ref>{{Cite web|title=Internet Archive Frequently Asked Questions|url=https://archive.org/about/faqs.php|date=|accessdate=17 січня 2015|deadurl=no|archiveurl=https://web.archive.org/web/20091021003552/https://archive.org/about/faqs.php|archivedate=October 21, 2009}}</ref><ref name="Arora (2015)">{{cite journal |last=Arora |first=Sanjay K. |last2=Li |first2=Yin |last3=Youtie |first3=Jan |last4=Shapira |first4=Philip |date=5 травня 2015 |title=Using the wayback machine to mine websites in the social sciences: A methodological resource |journal=Journal of the Association for Information Science and Technology |language=en |volume=67 |issue=8 |pages=1904–1915 |doi=10.1002/asi.23503 |issn=2330-1635}}</ref><ref>{{Cite web|url=https://archive.org/about/faqs.php|archiveurl=https://web.archive.org/web/20141218203115/https://archive.org/about/faqs.php|deadurl=yes|archivedate=December 18, 2014|title=Internet Archive Frequently Asked Questions|date=18 грудня 2014|accessdate=13 грудня 2018}}</ref>.
{{Станом на|2014|12}} Wayback Machine містила 435 мільярдів вебсторінок обсягом майже дев'ять петабайтів, і зростала приблизно на 20 терабайтів щотижня<ref>{{Cite web|title=Internet Archive Frequently Asked Questions|url=https://archive.org/about/faqs.php|accessdate=17 січня 2015|deadurl=no|archiveurl=https://web.archive.org/web/20091021003552/https://archive.org/about/faqs.php|archivedate=October 21, 2009}}</ref><ref name="Arora (2015)">{{cite journal|last=Arora|first=Sanjay K.|last2=Li|first2=Yin|last3=Youtie|first3=Jan|last4=Shapira|first4=Philip|date=5 травня 2015|title=Using the wayback machine to mine websites in the social sciences: A methodological resource|journal=Journal of the Association for Information Science and Technology|language=en|volume=67|issue=8|pages=1904–1915|doi=10.1002/asi.23503 |issn=2330-1635}}</ref><ref>{{Cite web|url=https://archive.org/about/faqs.php|archiveurl=https://web.archive.org/web/20141218203115/https://archive.org/about/faqs.php|deadurl=yes|archivedate=December 18, 2014|title=Internet Archive Frequently Asked Questions|date=18 грудня 2014|accessdate=13 грудня 2018}}</ref>.


{{Станом на|2016|19}} Wayback Machine містила близько 15 петабайт даних<ref>{{Cite web|title=Can the manipulation of big data change the way the world thinks?|website=The National|url=http://www.thenational.ae/opinion/comment/can-the-manipulation-of-big-data-change-the-way-the-world-thinks|accessdate=14 травня 2017|deadurl=no|archiveurl=https://web.archive.org/web/20170112060354/http://www.thenational.ae/opinion/comment/can-the-manipulation-of-big-data-change-the-way-the-world-thinks|archivedate=January 12, 2017}}</ref>.
{{Станом на|2016|19}} Wayback Machine містила близько 15 петабайт даних<ref>{{Cite web|title=Can the manipulation of big data change the way the world thinks?|website=The National|url=http://www.thenational.ae/opinion/comment/can-the-manipulation-of-big-data-change-the-way-the-world-thinks|accessdate=14 травня 2017|deadurl=no|archiveurl=https://web.archive.org/web/20170112060354/http://www.thenational.ae/opinion/comment/can-the-manipulation-of-big-data-change-the-way-the-world-thinks|archivedate=January 12, 2017}}</ref>.


Станом на [[вересень]] [[2018]] року Wayback Machine містила понад 25 петабайтів даних<ref>{{Cite news|url=https://thehustle.co/inside-wayback-machine-internet-archive|title=Inside Wayback Machine, the internet’s time capsule|last=Crockett|first=Zachary|date=28 вересня 2018|work=The Hustle|accessdate=26 жовтня 2018|language=en-US|archiveurl=https://web.archive.org/web/20181002145800/https://thehustle.co/inside-wayback-machine-internet-archive|archivedate=October 2, 2018|deadurl=no}}</ref><ref>{{Cite news|url=https://www.wired.com/story/wired25-virginia-heffernan-internet-archive-wayback-machine/|title=Things Break and Decay on the Internet—That's a Good Thing|last=Heffernan|first=Virginia|date=18 вересня 2018|work=WIRED|accessdate=26 жовтня 2018|language=en-US|archiveurl=https://web.archive.org/web/20180925130510/https://www.wired.com/story/wired25-virginia-heffernan-internet-archive-wayback-machine/|archivedate=September 25, 2018|deadurl=no}}</ref>.
Станом на [[вересень]] [[2018]] року Wayback Machine містила понад 25 петабайтів даних<ref>{{Cite news|url=https://thehustle.co/inside-wayback-machine-internet-archive|title=Inside Wayback Machine, the internet’s time capsule|last=Crockett|first=Zachary|date=28 вересня 2018|work=The Hustle|accessdate=26 жовтня 2018|language=en-US|archiveurl=https://web.archive.org/web/20181002145800/https://thehustle.co/inside-wayback-machine-internet-archive|archivedate=October 2, 2018|deadurl=no}}</ref><ref>{{Cite news|url=https://www.wired.com/story/wired25-virginia-heffernan-internet-archive-wayback-machine/|title=Things Break and Decay on the Internet—That's a Good Thing|last=Heffernan|first=Virginia|date=18 вересня 2018|work=WIRED|accessdate=26 жовтня 2018|language=en|archiveurl=https://web.archive.org/web/20180925130510/https://www.wired.com/story/wired25-virginia-heffernan-internet-archive-wayback-machine/|archivedate=September 25, 2018|deadurl=no}}</ref>.


Станом на [[грудень]] [[2020]] року Wayback Machine містила понад 70 петабайтів даних<ref>{{cite web |url=https://blog.adafruit.com/2020/12/01/donate-to-the-internet-archive-digital-library-of-free-borrowable-books-movies-music-wayback-machine-internetarchive/ |title=Donate to the Internet Archive: Digital Library of Free & Borrowable Books, Movies, Music & Wayback Machine |publisher=adafruit |access-date=2 грудня 2020 |archive-date=2 грудня 2020 |archive-url=https://web.archive.org/web/20201202065323/https://blog.adafruit.com/2020/12/01/donate-to-the-internet-archive-digital-library-of-free-borrowable-books-movies-music-wayback-machine-internetarchive/ |url-status=live }}</ref>.
Станом на грудень 2020 року Wayback Machine містила понад 70 петабайтів даних<ref>{{cite web|url=https://blog.adafruit.com/2020/12/01/donate-to-the-internet-archive-digital-library-of-free-borrowable-books-movies-music-wayback-machine-internetarchive/|title=Donate to the Internet Archive: Digital Library of Free & Borrowable Books, Movies, Music & Wayback Machine|publisher=adafruit|accessdate=2 грудня 2020|archivedate=2 грудня 2020|archiveurl=https://web.archive.org/web/20201202065323/https://blog.adafruit.com/2020/12/01/donate-to-the-internet-archive-digital-library-of-free-borrowable-books-movies-music-wayback-machine-internetarchive/}}</ref>.


=== Зростання ===
=== Зростання ===
За період з жовтня 2013 року по березень 2015 року в глобальному рейтингу Alexa сайт Wayback Machine опустився зі 163-го<ref name="alexa-2013-10">{{Cite web|url=http://www.alexa.com/siteinfo/archive.org|title=Archive.org Site Info|publisher=[[Alexa Internet]]|archiveurl=https://web.archive.org/web/20131028025923/http://www.alexa.com/siteinfo/archive.org|archivedate=October 28, 2013|deadurl=yes|accessdate=29 жовтня 2013}}</ref> на 208-ме місце<ref name="alexa-2015-03">{{Cite web|url=http://www.alexa.com/siteinfo/archive.org|title=Archive.org Site Overview|publisher=Alexa Internet|archiveurl=https://web.archive.org/web/20150409101131/http://www.alexa.com/siteinfo/archive.org|archivedate=April 9, 2015|deadurl=yes<!-- set to yes, because the alexa page will show a new current rank, not the as-of-date rank, invalidating this reference. -->|accessdate=9 квітня 2015}}</ref>. У березні [[2019]] сайт був на 244-му місці<ref>{{Cite web|url=https://www.alexa.com/siteinfo/archive.org|title=Archive.org Traffic, Demographics and Competitors - Alexa|date=2019-03-23|website=web.archive.org|accessdate=2019-04-05|archive-date=2019-03-23|archive-url=https://web.archive.org/web/20190323051243/https://www.alexa.com/siteinfo/archive.org}}</ref>.
За період з жовтня 2013 року по березень 2015 року в глобальному рейтингу Alexa сайт Wayback Machine опустився зі 163-го<ref name="alexa-2013-10">{{Cite web|url=http://www.alexa.com/siteinfo/archive.org|title=Archive.org Site Info|publisher=[[Alexa Internet]]|archiveurl=https://web.archive.org/web/20131028025923/http://www.alexa.com/siteinfo/archive.org|archivedate=October 28, 2013|deadurl=yes|accessdate=29 жовтня 2013}}</ref> на 208-ме місце<ref name="alexa-2015-03">{{Cite web|url=http://www.alexa.com/siteinfo/archive.org|title=Archive.org Site Overview|publisher=Alexa Internet|archiveurl=https://web.archive.org/web/20150409101131/http://www.alexa.com/siteinfo/archive.org|archivedate=April 9, 2015|deadurl=yes|accessdate=9 квітня 2015}}</ref>. У березні [[2019]] сайт був на 244-му місці<ref>{{Cite web|url=https://www.alexa.com/siteinfo/archive.org|title=Archive.org Traffic, Demographics and Competitors - Alexa|date=2019-03-23|website=web.archive.org|accessdate=2019-04-05|archivedate=2019-03-23|archiveurl=https://web.archive.org/web/20190323051243/https://www.alexa.com/siteinfo/archive.org}}</ref>.


{{Bar chart
{{Bar chart
| title = Зростання Wayback Machine
| title = Зростання Wayback Machine
<ref>{{cite web |url=https://blog.archive.org/2014/05/09/wayback-machine-hits-400000000000 |title=Wayback Machine Hits 400,000,000,000! |author=michelle |publisher=Internet Archive |date=9 травня 2014 |archive-url=https://web.archive.org/web/20140826191225/http://blog.archive.org/2014/05/09/wayback-machine-hits-400000000000/ |archive-date=26 серпня 2014 |dead-url=no |access-date=25 березня 2015}}</ref>
<ref>{{cite web |url=https://blog.archive.org/2014/05/09/wayback-machine-hits-400000000000 |title=Wayback Machine Hits 400,000,000,000! |author=michelle |publisher=Internet Archive |date=9 травня 2014 |archiveurl=https://web.archive.org/web/20140826191225/http://blog.archive.org/2014/05/09/wayback-machine-hits-400000000000/ |archivedate=26 серпня 2014 |dead-url=no |accessdate=25 березня 2015}}</ref>


<ref>{{cite web |url=https://www.archive.org/ |archive-url=https://web.archive.org/web/20150213001303/https://archive.org/ |archive-date=13 лютого 2015 |dead-url=yes |title=Internet Archive Wayback Machine |publisher=Internet Archive |access-date=25 березня 2015}}<!-- Update me at end of 2015 --></ref>
<ref>{{cite web |url=https://www.archive.org/ |archiveurl=https://web.archive.org/web/20150213001303/https://archive.org/ |archivedate=13 лютого 2015|deadurl=yes|title=Internet Archive Wayback Machine |publisher=Internet Archive |accessdate=25 березня 2015}}</ref>
| label_type = Рік
| label_type = Рік
| data_type = Кількість заархівованих сторінок (мільярдів)
| data_type = Кількість заархівованих сторінок (мільярдів)
Рядок 80: Рядок 80:
Політика винятку заднім числом Wayback Machine частково ґрунтується на ''рекомендаціях з управління запитами на вилучення і збереження архівної цілісності'' ({{lang-en|Recommendations for Managing Removal Requests and Preserving Archival Integrity}}), опублікованих [[Школа інформаційного управління і систем Університету Каліфорнії(Берклі)|Школою інформаційного управління і систем]] в [[Університет Каліфорнії (Берклі)|Університеті Каліфорнії]] (Берклі) у [[2002]] році, які дають власникові сайту право заблокувати доступ до архіву сайту<ref>{{Cite web|title=Recommendations for Managing Removal Requests And Preserving Archival Integrity|date=14 грудня 2002|publisher=[[University of California]]|url=http://www2.sims.berkeley.edu/research/conferences/aps/removal-policy.html|accessdate=14 вересня 2017|deadurl=no|archiveurl=https://web.archive.org/web/20170918025220/http://www2.sims.berkeley.edu/research/conferences/aps/removal-policy.html|archivedate=September 18, 2017}}</ref>. Wayback дотримується цієї політики, щоб за можливості уникнути дорогих судових розглядів<ref>{{Cite web|title=Retroactive robots.txt removal of past crawls AKA Oakland Archive Policy|date=7 липня 2014|publisher=Internet Archive|url=https://archive.org/post/1019415/retroactive-robotstxt-removal-of-past-crawls-aka-oakland-archive-policy|accessdate=14 вересня 2017|deadurl=no|archiveurl=https://web.archive.org/web/20171010124036/https://archive.org/post/1019415/retroactive-robotstxt-removal-of-past-crawls-aka-oakland-archive-policy|archivedate=October 10, 2017}}</ref>.
Політика винятку заднім числом Wayback Machine частково ґрунтується на ''рекомендаціях з управління запитами на вилучення і збереження архівної цілісності'' ({{lang-en|Recommendations for Managing Removal Requests and Preserving Archival Integrity}}), опублікованих [[Школа інформаційного управління і систем Університету Каліфорнії(Берклі)|Школою інформаційного управління і систем]] в [[Університет Каліфорнії (Берклі)|Університеті Каліфорнії]] (Берклі) у [[2002]] році, які дають власникові сайту право заблокувати доступ до архіву сайту<ref>{{Cite web|title=Recommendations for Managing Removal Requests And Preserving Archival Integrity|date=14 грудня 2002|publisher=[[University of California]]|url=http://www2.sims.berkeley.edu/research/conferences/aps/removal-policy.html|accessdate=14 вересня 2017|deadurl=no|archiveurl=https://web.archive.org/web/20170918025220/http://www2.sims.berkeley.edu/research/conferences/aps/removal-policy.html|archivedate=September 18, 2017}}</ref>. Wayback дотримується цієї політики, щоб за можливості уникнути дорогих судових розглядів<ref>{{Cite web|title=Retroactive robots.txt removal of past crawls AKA Oakland Archive Policy|date=7 липня 2014|publisher=Internet Archive|url=https://archive.org/post/1019415/retroactive-robotstxt-removal-of-past-crawls-aka-oakland-archive-policy|accessdate=14 вересня 2017|deadurl=no|archiveurl=https://web.archive.org/web/20171010124036/https://archive.org/post/1019415/retroactive-robotstxt-removal-of-past-crawls-aka-oakland-archive-policy|archivedate=October 10, 2017}}</ref>.


Політика винятку заднім числом Wayback почала послаблюватися [[2017]] року, коли він перестав зважати на файли robots.txt на американських урядових і військових вебсайтах як для їх сканування, так і показу відсканованих вебсторінок. Станом на [[квітень]] 2017 Wayback ігнорує robots.txt в ширших межах, не тільки для урядових сайтів США<ref>{{Cite web|url=http://blog.archive.org/2017/04/17/robots-txt-meant-for-search-engines-dont-work-well-for-web-archives/|title=Robots.txt meant for search engines don't work well for web archives|website=Internet Archive Blogs|last=Mark Graham|date=17 квітня 2017|accessdate=16 квітня 2017|deadurl=no|archiveurl=https://web.archive.org/web/20170417131508/http://blog.archive.org/2017/04/17/robots-txt-meant-for-search-engines-dont-work-well-for-web-archives/|archivedate=April 17, 2017}}</ref><ref>{{Cite web|title=Archivierung des Internets: Internet Archive ignoriert künftig robots.txt|url=https://www.heise.de/newsticker/meldung/Archivierung-des-Internets-Internet-Archive-ignoriert-kuenftig-robots-txt-3693558.html|publisher=heise online|accessdate=14 травня 2017|language=de-DE|deadurl=no|archiveurl=https://web.archive.org/web/20170427035659/https://www.heise.de/newsticker/meldung/Archivierung-des-Internets-Internet-Archive-ignoriert-kuenftig-robots-txt-3693558.html|archivedate=April 27, 2017}}</ref><ref>{{Cite web|title=Suchmaschinen: Internet Archive will künftig Robots.txt-Einträge ignorieren – Golem.de|url=https://www.golem.de/news/suchmaschinen-internet-archive-will-kuenftig-robots-txt-eintraege-ignorieren-1704-127446.html|accessdate=14 травня 2017|language=de-DE|deadurl=no|archiveurl=https://web.archive.org/web/20170619210648/https://www.golem.de/news/suchmaschinen-internet-archive-will-kuenftig-robots-txt-eintraege-ignorieren-1704-127446.html|archivedate=June 19, 2017}}</ref><ref>{{Cite web|title=Internet Archive will ignore robots.txt files to keep historical record accurate|url=https://www.digitaltrends.com/computing/internet-archive-robots-txt/|publisher=Digital Trends|accessdate=14 травня 2017|date=24 квітня 2017|deadurl=no|archiveurl=https://web.archive.org/web/20170516130029/https://www.digitaltrends.com/computing/internet-archive-robots-txt/|archivedate=May 16, 2017}}</ref>.
Політика винятку заднім числом Wayback почала послаблюватися [[2017]] року, коли він перестав зважати на файли robots.txt на американських урядових і військових вебсайтах як для їх сканування, так і показу відсканованих вебсторінок. Станом на [[квітень]] 2017 Wayback ігнорує robots.txt в ширших межах, не тільки для урядових сайтів США<ref>{{Cite web|url=http://blog.archive.org/2017/04/17/robots-txt-meant-for-search-engines-dont-work-well-for-web-archives/|title=Robots.txt meant for search engines don't work well for web archives|website=Internet Archive Blogs|last=Mark Graham|date=17 квітня 2017|accessdate=16 квітня 2017|deadurl=no|archiveurl=https://web.archive.org/web/20170417131508/http://blog.archive.org/2017/04/17/robots-txt-meant-for-search-engines-dont-work-well-for-web-archives/|archivedate=April 17, 2017}}</ref><ref>{{Cite web|title=Archivierung des Internets: Internet Archive ignoriert künftig robots.txt|url=https://www.heise.de/newsticker/meldung/Archivierung-des-Internets-Internet-Archive-ignoriert-kuenftig-robots-txt-3693558.html|publisher=heise online|accessdate=14 травня 2017|language=de|deadurl=no|archiveurl=https://web.archive.org/web/20170427035659/https://www.heise.de/newsticker/meldung/Archivierung-des-Internets-Internet-Archive-ignoriert-kuenftig-robots-txt-3693558.html|archivedate=April 27, 2017}}</ref><ref>{{Cite web|title=Suchmaschinen: Internet Archive will künftig Robots.txt-Einträge ignorieren – Golem.de|url=https://www.golem.de/news/suchmaschinen-internet-archive-will-kuenftig-robots-txt-eintraege-ignorieren-1704-127446.html|accessdate=14 травня 2017|language=de|deadurl=no|archiveurl=https://web.archive.org/web/20170619210648/https://www.golem.de/news/suchmaschinen-internet-archive-will-kuenftig-robots-txt-eintraege-ignorieren-1704-127446.html|archivedate=June 19, 2017}}</ref><ref>{{Cite web|title=Internet Archive will ignore robots.txt files to keep historical record accurate|url=https://www.digitaltrends.com/computing/internet-archive-robots-txt/|publisher=Digital Trends|accessdate=14 травня 2017|date=24 квітня 2017|deadurl=no|archiveurl=https://web.archive.org/web/20170516130029/https://www.digitaltrends.com/computing/internet-archive-robots-txt/|archivedate=May 16, 2017}}</ref>.


== Використання ==
== Використання ==
Рядок 87: Рядок 87:
Коли Wayback Machine архівує сторінку, вона зазвичай вміщує більшість [[Гіперпосилання|гіперпосилань]], зберігаючи ці посилання активними, коли вони запросто могли бути порушені нестабільністю Інтернету. [[Індія|Індійські]] вчені вивчали здатність Wayback Machine зберігати гіперпосилання в наукових онлайн-публікаціях і визначили, що вона зберігає трохи більш як половину з них<ref>{{cite journal |last=Sampath Kumar |first=B.T. |last2=Prithviraj |first2=K.R. |date=21 жовтня 2014 |title=Bringing life to dead: Role of Wayback Machine in retrieving vanished URLs |journal=Journal of Information Science |language=en |volume=41 |issue=1 |pages=71–81 |doi=10.1177/0165551514552752 |issn=0165-5515}}</ref>.
Коли Wayback Machine архівує сторінку, вона зазвичай вміщує більшість [[Гіперпосилання|гіперпосилань]], зберігаючи ці посилання активними, коли вони запросто могли бути порушені нестабільністю Інтернету. [[Індія|Індійські]] вчені вивчали здатність Wayback Machine зберігати гіперпосилання в наукових онлайн-публікаціях і визначили, що вона зберігає трохи більш як половину з них<ref>{{cite journal |last=Sampath Kumar |first=B.T. |last2=Prithviraj |first2=K.R. |date=21 жовтня 2014 |title=Bringing life to dead: Role of Wayback Machine in retrieving vanished URLs |journal=Journal of Information Science |language=en |volume=41 |issue=1 |pages=71–81 |doi=10.1177/0165551514552752 |issn=0165-5515}}</ref>.


Журналісти використовують Wayback Machine, щоб переглядати мертві сайти, застарілі новини і зміни в змісті сайту. Його зміст використовують, щоб притягати [[політик]]ів до відповідальності й викривати брехню в зображенні подій на полі бою<ref name="usn1">{{Cite web|url=https://www.usnews.com/news/articles/2016-08-17/wayback-machine-wont-censor-archive-for-taste-director-says-after-olympics-article-scrubbed|title=Wayback Machine Won't Censor Archive for Taste, Director Says After Olympics Article Scrubbed|archiveurl=https://web.archive.org/web/20170106151933/http://www.usnews.com/news/articles/2016-08-17/wayback-machine-wont-censor-archive-for-taste-director-says-after-olympics-article-scrubbed|archivedate=January 6, 2017|deadurl=no|accessdate=14 травня 2017}}</ref>. 2014 року заархівована з соціальної мережі сторінка [[Гіркін Ігор Всеволодович|Ігоря Гіркина]] засвідчила, як він хвалиться, що його бійці збили нібито український військовий літак. Коли ж стало відомо, що [[Збиття Boeing 777 біля Донецька|насправді це цивільний літак Малайзійських авіаліній]], Гіркін видалив пост і звинуватив українських військових у знищенні літака<ref name="usn1" /><ref>{{Cite web|title=What the Web Said Yesterday|url=http://www.newyorker.com/magazine/2015/01/26/cobweb|publisher=The New Yorker|accessdate=14 травня 2017|deadurl=no|archiveurl=https://web.archive.org/web/20150125141230/http://www.newyorker.com/magazine/2015/01/26/cobweb|archivedate=January 25, 2015}}</ref>. [[Марш за науку]] в березні 2017 року розпочався з обговорення на [[Reddit]], яке показало, що хтось відвідав Archive.org і виявив, що з сайту [[Білий дім|Білого дому]] вилучено всі посилання на [[Зміна клімату|зміну клімату]]. У відповідь один з користувачів написав: «Має бути хода науковців на [[Вашингтон]]<nowiki/>»<ref>{{Cite web|title=The March for Science began with this person's 'throwaway line' on Reddit|url=https://www.washingtonpost.com/news/speaking-of-science/wp/2017/04/21/the-march-for-science-began-with-this-persons-throwaway-line-on-reddit/|publisher=Washington Post|accessdate=23 квітня 2017|deadurl=no|archiveurl=https://web.archive.org/web/20170423081417/https://www.washingtonpost.com/news/speaking-of-science/wp/2017/04/21/the-march-for-science-began-with-this-persons-throwaway-line-on-reddit/|archivedate=April 23, 2017}}</ref><ref name=":1">{{Cite web|url=https://www.washingtonpost.com/news/speaking-of-science/wp/2017/01/24/are-scientists-going-to-march-on-washington/|title=Are scientists going to march on Washington?|website=The Washington Post|accessdate=31 січня 2017|deadurl=no|archiveurl=https://web.archive.org/web/20170131152535/https://www.washingtonpost.com/news/speaking-of-science/wp/2017/01/24/are-scientists-going-to-march-on-washington/|archivedate=January 31, 2017}}</ref><ref>{{Cite web|last=Foley|first=Katherine Ellen|title=The global March for Science started with a single Reddit thread|url=https://qz.com/965485/the-global-march-for-science-started-with-a-single-reddit-thread/|publisher=Quartz|accessdate=23 квітня 2017|deadurl=no|archiveurl=https://web.archive.org/web/20170424004314/https://qz.com/965485/the-global-march-for-science-started-with-a-single-reddit-thread/|archivedate=April 24, 2017}}</ref>.
Журналісти використовують Wayback Machine, щоб переглядати мертві сайти, застарілі новини і зміни в змісті сайту. Його зміст використовують, щоб притягати [[політик]]ів до відповідальності й викривати брехню в зображенні подій на полі бою<ref name="usn1">{{Cite web|url=https://www.usnews.com/news/articles/2016-08-17/wayback-machine-wont-censor-archive-for-taste-director-says-after-olympics-article-scrubbed|title=Wayback Machine Won't Censor Archive for Taste, Director Says After Olympics Article Scrubbed|archiveurl=https://web.archive.org/web/20170106151933/http://www.usnews.com/news/articles/2016-08-17/wayback-machine-wont-censor-archive-for-taste-director-says-after-olympics-article-scrubbed|archivedate=January 6, 2017|deadurl=no|accessdate=14 травня 2017}}</ref>. 2014 року заархівована з соціальної мережі сторінка [[Гіркін Ігор Всеволодович|Ігоря Гіркина]] засвідчила, як він хвалиться, що його бійці збили нібито український військовий літак. Коли ж стало відомо, що [[Збиття Boeing 777 біля Донецька|насправді це цивільний літак Малайзійських авіаліній]], Гіркін видалив пост і звинуватив українських військових у знищенні літака<ref name="usn1" /><ref>{{Cite web|title=What the Web Said Yesterday|url=http://www.newyorker.com/magazine/2015/01/26/cobweb|publisher=The New Yorker|accessdate=14 травня 2017|deadurl=no|archiveurl=https://web.archive.org/web/20150125141230/http://www.newyorker.com/magazine/2015/01/26/cobweb|archivedate=January 25, 2015}}</ref>. [[Марш за науку]] в березні 2017 року розпочався з обговорення на [[Reddit]], яке показало, що хтось відвідав Archive.org і виявив, що з сайту [[Білий дім|Білого дому]] вилучено всі посилання на [[Зміна клімату|зміну клімату]]. У відповідь один з користувачів написав: «Має бути хода науковців на [[Вашингтон]]»<ref>{{Cite web|title=The March for Science began with this person's 'throwaway line' on Reddit|url=https://www.washingtonpost.com/news/speaking-of-science/wp/2017/04/21/the-march-for-science-began-with-this-persons-throwaway-line-on-reddit/|publisher=Washington Post|accessdate=23 квітня 2017|deadurl=no|archiveurl=https://web.archive.org/web/20170423081417/https://www.washingtonpost.com/news/speaking-of-science/wp/2017/04/21/the-march-for-science-began-with-this-persons-throwaway-line-on-reddit/|archivedate=April 23, 2017}}</ref><ref name=":1">{{Cite web|url=https://www.washingtonpost.com/news/speaking-of-science/wp/2017/01/24/are-scientists-going-to-march-on-washington/|title=Are scientists going to march on Washington?|website=The Washington Post|accessdate=31 січня 2017|deadurl=no|archiveurl=https://web.archive.org/web/20170131152535/https://www.washingtonpost.com/news/speaking-of-science/wp/2017/01/24/are-scientists-going-to-march-on-washington/|archivedate=January 31, 2017}}</ref><ref>{{Cite web|last=Foley|first=Katherine Ellen|title=The global March for Science started with a single Reddit thread|url=https://qz.com/965485/the-global-march-for-science-started-with-a-single-reddit-thread/|publisher=Quartz|accessdate=23 квітня 2017|deadurl=no|archiveurl=https://web.archive.org/web/20170424004314/https://qz.com/965485/the-global-march-for-science-started-with-a-single-reddit-thread/|archivedate=April 24, 2017}}</ref>.


Крім того, сайт активно використовується для [[Верифікація|верифікації]], забезпечуючи [[Вікіспільнота|редакторам Вікіпедії]] доступ до посилань і можливість створювати контент<ref>http://blog.archive.org/2018/10/01/more-than-9-million-broken-links-on-wikipedia-are-now-rescued</ref>.
Крім того, сайт активно використовується для [[Верифікація|верифікації]], забезпечуючи [[Вікіспільнота|редакторам Вікіпедії]] доступ до посилань і можливість створювати контент<ref>http://blog.archive.org/2018/10/01/more-than-9-million-broken-links-on-wikipedia-are-now-rescued</ref>.


=== Обмеження ===
=== Обмеження ===
Попри свої можливості, Wayback Machine також має деякі обмеження. У 2014 році затримка між скануванням вмісту сайтів і часом, коли він був доступним на Wayback Machine, становила шість місяців<ref>{{Cite web|url=https://archive.org/about/faqs.php|title=Internet Archive Frequently Asked Questions|last=|first=|date=2 квітня 2014|website=Internet Archive|archiveurl=https://web.archive.org/web/20140402223358/https://archive.org/about/faqs.php|archivedate=2014-04-02|deadurl=yes|accessdate=23 листопада 2018}}</ref>. Станом на [[листопад]] 2018 року час затримки становив від 3 до 10 годин<ref>{{Cite web|url=https://archive.org/about/faqs.php|title=Internet Archive Frequently Asked Questions|website=archive.org|language=en|accessdate=23 листопада 2018}}</ref>. Wayback Machine не є «історичним [[Google (пошуковик)|Google]]<nowiki/>»; користувачі самі мають знати URL-адреси вебсайтів, які вони хочуть переглянути<ref name=":4" />. Існує функція «Site Search» (пошук сайту), яка дозволяє користувачам знайти сайт на основі слів, що описують сайт, а не слів, знайдених на самих вебсторінках<ref name=":4" />.
Попри свої можливості, Wayback Machine також має деякі обмеження. У 2014 році затримка між скануванням вмісту сайтів і часом, коли він був доступним на Wayback Machine, становила шість місяців<ref>{{Cite web|url=https://archive.org/about/faqs.php|title=Internet Archive Frequently Asked Questions|date=2 квітня 2014|website=Internet Archive|archiveurl=https://web.archive.org/web/20140402223358/https://archive.org/about/faqs.php|archivedate=2014-04-02|deadurl=yes|accessdate=23 листопада 2018}}</ref>. Станом на [[листопад]] 2018 року час затримки становив від 3 до 10 годин<ref>{{Cite web|url=https://archive.org/about/faqs.php|title=Internet Archive Frequently Asked Questions|website=archive.org|language=en|accessdate=23 листопада 2018}}</ref>. Wayback Machine не є «історичним [[Google (пошуковик)|Google]]»; користувачі самі мають знати URL-адреси вебсайтів, які вони хочуть переглянути<ref name=":4" />. Існує функція «Site Search» (пошук сайту), яка дозволяє користувачам знайти сайт на основі слів, що описують сайт, а не слів, знайдених на самих вебсторінках<ref name=":4" />.


Wayback Machine не містить усіх сторінок, коли-небудь створених, через обмеження свого [[вебкраулер]]а. Wayback Machine не може повністю архівувати вебсторінки, які містять інтерактивні функції, як-от Флеш-платформи і форми, написані на [[JavaScript]], бо ці функції вимагають взаємодії з хост-сайтом. Вебкраулеру складно відсканувати все, що закодовано не в [[HTML]] (або одному з його варіантів), що часто призводить до зламаних гіперпосилань та відсутніх зображень. Через це вебкраулер не архівує «сторінок-сиріт», які не містять посилань на інші сторінки<ref name=":2">{{Cite web|url=https://archive.org/about/faqs.php|title=Internet Archive Frequently Asked Questions|website=archive.org|language=en|accessdate=18 жовтня 2018|archiveurl=https://web.archive.org/web/20130420213122/http://archive.org/about/faqs.php|archivedate=April 20, 2013|deadurl=no}}</ref><ref name=":4">{{cite journal |last=Bates |first=Mary Ellen |date=2002 |title=The Wayback Machine |url= |journal=Online |volume=26 |pages=80 |via=EBSCOhost}}</ref>. Краулер Wayback Machine може відсканувати лише наперед визначену кількість гіперпосилань, згідно з наперед заданим обмеженням глибини, тому він не може заархівувати всі гіперпосилання на кожній сторінці<ref name=":3" />.
Wayback Machine не містить усіх сторінок, коли-небудь створених, через обмеження свого [[вебкраулер]]а. Wayback Machine не може повністю архівувати вебсторінки, які містять інтерактивні функції, як-от Флеш-платформи і форми, написані на [[JavaScript]], бо ці функції вимагають взаємодії з хост-сайтом. Вебкраулеру складно відсканувати все, що закодовано не в [[HTML]] (або одному з його варіантів), що часто призводить до зламаних гіперпосилань та відсутніх зображень. Через це вебкраулер не архівує «сторінок-сиріт», які не містять посилань на інші сторінки<ref name=":2">{{Cite web|url=https://archive.org/about/faqs.php|title=Internet Archive Frequently Asked Questions|website=archive.org|language=en|accessdate=18 жовтня 2018|archiveurl=https://web.archive.org/web/20130420213122/http://archive.org/about/faqs.php|archivedate=April 20, 2013|deadurl=no}}</ref><ref name=":4">{{cite journal |last=Bates |first=Mary Ellen |date=2002 |title=The Wayback Machine |url= |journal=Online |volume=26 |pages=80 |via=EBSCOhost}}</ref>. Краулер Wayback Machine може відсканувати лише наперед визначену кількість гіперпосилань, згідно з наперед заданим обмеженням глибини, тому він не може заархівувати всі гіперпосилання на кожній сторінці<ref name=":3" />.
Рядок 107: Рядок 107:
Netbula заперечила проти цього клопотання на тій підставі, що відповідач звертався з проханням змінити сайт Netbula, а йому слід було безпосередньо зробити запит до Інтернет-архіву за доступом до заархівованих сторінок<ref name="antonio_cortes">{{Cite web|last=Cortes|first=Antonio|date=October 2009|title=Motion Opposing Removal of Robots.txt|url=http://www.american-justice.org/index.cgi/Page/116/OPPOSITION-TO-MOTION-TO-COMPEL-REMOVAL-OF-ROBOT-TXT-FILE-FROM-WEBSITE/|accessdate=15 жовтня 2009|deadurl=yes|archiveurl=https://web.archive.org/web/20101027050350/http://www.american-justice.org/index.cgi/Page/116/OPPOSITION-TO-MOTION-TO-COMPEL-REMOVAL-OF-ROBOT-TXT-FILE-FROM-WEBSITE|archivedate=жовтень 27, 2010}}</ref>. Проте, співробітник Internet Archive подав заяву під присягою, в якій підтримав дію Chordiant, заявивши, що він не може видати вебсторінки за допомогою інших засобів «без значного навантаження, витрат і перебоїв у його роботі»<ref name="howard_lloyd"/>.
Netbula заперечила проти цього клопотання на тій підставі, що відповідач звертався з проханням змінити сайт Netbula, а йому слід було безпосередньо зробити запит до Інтернет-архіву за доступом до заархівованих сторінок<ref name="antonio_cortes">{{Cite web|last=Cortes|first=Antonio|date=October 2009|title=Motion Opposing Removal of Robots.txt|url=http://www.american-justice.org/index.cgi/Page/116/OPPOSITION-TO-MOTION-TO-COMPEL-REMOVAL-OF-ROBOT-TXT-FILE-FROM-WEBSITE/|accessdate=15 жовтня 2009|deadurl=yes|archiveurl=https://web.archive.org/web/20101027050350/http://www.american-justice.org/index.cgi/Page/116/OPPOSITION-TO-MOTION-TO-COMPEL-REMOVAL-OF-ROBOT-TXT-FILE-FROM-WEBSITE|archivedate=жовтень 27, 2010}}</ref>. Проте, співробітник Internet Archive подав заяву під присягою, в якій підтримав дію Chordiant, заявивши, що він не може видати вебсторінки за допомогою інших засобів «без значного навантаження, витрат і перебоїв у його роботі»<ref name="howard_lloyd"/>.


Суддя Говард Ллойд у Північному окрузі Каліфорнії, відділі Сан-Хосе, відхилив заперечення Netbula і наказав йому тимчасово вимкнути блокування robots.txt для того, щоб Chordiant отримав архівні сторінки<ref name="howard_lloyd">{{Cite web|last=Lloyd|first=Howard|date=October 2009|title=Order to Disable Robots.txt|url=http://www.american-justice.org/upload/page/123/69/docket-187-order-on-IA-motion.pdf|format=PDF|accessdate=15 жовтня 2009|archive-date=8 серпня 2019|archive-url=https://web.archive.org/web/20190808173832/http://www.american-justice.org/upload/page/123/69/docket-187-order-on-IA-motion.pdf}}</ref>.
Суддя Говард Ллойд у Північному окрузі Каліфорнії, відділі Сан-Хосе, відхилив заперечення Netbula і наказав йому тимчасово вимкнути блокування robots.txt для того, щоб Chordiant отримав архівні сторінки<ref name="howard_lloyd">{{Cite web|last=Lloyd|first=Howard|date=October 2009|title=Order to Disable Robots.txt|url=http://www.american-justice.org/upload/page/123/69/docket-187-order-on-IA-motion.pdf|format=PDF|accessdate=15 жовтня 2009|archivedate=8 серпня 2019|archiveurl=https://web.archive.org/web/20190808173832/http://www.american-justice.org/upload/page/123/69/docket-187-order-on-IA-motion.pdf}}</ref>.


===== Telewizja Polska =====
===== Telewizja Polska =====
У жовтні 2004 року у справі ''[[TVP|Telewizja Polska USA, Inc.]] проти Echostar Satellite'', No. 02&nbsp;°C 3293, 65 Fed. R. Evid. Serv. 673 (N.D. Ill. October 15, 2004) позивач, мабуть вперше в історії, намагався використати Wayback Machine як джерело допустимих доказів. Компанія Telewizja Polska є провайдером [[TVP Polonia]] і {{iw|EchoStar||}}, яка управляє [[Dish Network]]. До початку судового розгляду EchoStar вказала, що має намір запропонувати знімки Wayback Machine як доказ минулого змісту сайту Telewizja Polska. Компанія Telewizja Polska подала ''{{нп|Клопотання про нерозголошення||en|Motion in limine}}'', щоб завадити використанню знімків на тій підставі, що нібито це [[Свідчення з чужих слів|чутки]] і неперевірене джерело, але суддя Арландер, відхилив твердження Telewizja Polska, що нібито це чутки, й відмовив у клопотанні ''про нерозголошення'' щодо вилучення доказів з процесу<ref name="gelman">{{cite journal |last=Gelman |first=Lauren |date=17 листопада 2004 |title=Internet Archive's Web Page Snapshots Held Admissible as Evidence |journal=Packets |volume=2 |issue=3 |url=http://cyberlaw.stanford.edu/packets002728.shtml |accessdate=4 січня 2007 |archive-url=https://web.archive.org/web/20110430095339/http://cyberlaw.stanford.edu/packets002728.shtml |archive-date=30 квітня 2011 |dead-url=no |df= }}</ref><ref name="howell">{{cite journal |last=Howell |first=Beryl A. |date=February 2006 |title=Proving Web History: How to use the Internet Archive |journal=Journal of Internet Law |pages=3–9 |url=http://www.strozfriedberg.com/files/Publication/fee98a34-d739-478b-a7db-6af37b757714/Presentation/PublicationAttachment/aae88469-9835-4fe4-ae5f-38637924314f/BAHPROVINGWEBHISTORY.pdf |archive-url=https://web.archive.org/web/20100705043226/http://www.strozfriedberg.com/files/Publication/fee98a34-d739-478b-a7db-6af37b757714/Presentation/PublicationAttachment/aae88469-9835-4fe4-ae5f-38637924314f/BAHPROVINGWEBHISTORY.pdf |dead-url=yes |archive-date=5 липня 2010 |format=PDF |accessdate=6 серпня 2008}}</ref>.
У жовтні 2004 року у справі ''[[TVP|Telewizja Polska USA, Inc.]] проти Echostar Satellite'', No. 02&nbsp;°C 3293, 65 Fed. R. Evid. Serv. 673 (N.D. Ill. October 15, 2004) позивач, мабуть вперше в історії, намагався використати Wayback Machine як джерело допустимих доказів. Компанія Telewizja Polska є провайдером [[TVP Polonia]] і {{iw|EchoStar||}}, яка управляє [[Dish Network]]. До початку судового розгляду EchoStar вказала, що має намір запропонувати знімки Wayback Machine як доказ минулого змісту сайту Telewizja Polska. Компанія Telewizja Polska подала ''{{нп|Клопотання про нерозголошення||en|Motion in limine}}'', щоб завадити використанню знімків на тій підставі, що нібито це [[Свідчення з чужих слів|чутки]] і неперевірене джерело, але суддя Арландер, відхилив твердження Telewizja Polska, що нібито це чутки, й відмовив у клопотанні ''про нерозголошення'' щодо вилучення доказів з процесу<ref name="gelman">{{cite journal |last=Gelman |first=Lauren |date=17 листопада 2004 |title=Internet Archive's Web Page Snapshots Held Admissible as Evidence |journal=Packets |volume=2 |issue=3 |url=http://cyberlaw.stanford.edu/packets002728.shtml|accessdate=4 січня 2007 |archiveurl=https://web.archive.org/web/20110430095339/http://cyberlaw.stanford.edu/packets002728.shtml |archivedate=30 квітня 2011|deadurl=no}}</ref><ref name="howell">{{cite journal|last=Howell|first=Beryl A. |date=February 2006 |title=Proving Web History: How to use the Internet Archive|journal=Journal of Internet Law |pages=3–9 |url=http://www.strozfriedberg.com/files/Publication/fee98a34-d739-478b-a7db-6af37b757714/Presentation/PublicationAttachment/aae88469-9835-4fe4-ae5f-38637924314f/BAHPROVINGWEBHISTORY.pdf |archiveurl=https://web.archive.org/web/20100705043226/http://www.strozfriedberg.com/files/Publication/fee98a34-d739-478b-a7db-6af37b757714/Presentation/PublicationAttachment/aae88469-9835-4fe4-ae5f-38637924314f/BAHPROVINGWEBHISTORY.pdf|deadurl=yes|archivedate=5 липня 2010|format=PDF|accessdate=6 серпня 2008}}</ref>.


==== Патентне право ====
==== Патентне право ====
Рядок 122: Рядок 122:
Відомі окремі випадки, коли сайт закрив онлайн-доступ до матеріалів, через які «випадкові» люди опинились у небезпеці<ref name="usn1"/>.
Відомі окремі випадки, коли сайт закрив онлайн-доступ до матеріалів, через які «випадкові» люди опинились у небезпеці<ref name="usn1"/>.


Серед інших загроз: стихійні лиха<ref>{{Cite web|title=Help Us Keep the Archive Free, Accessible, and Reader Private {{!}} Internet Archive Blogs|url=https://blog.archive.org/2016/11/29/help-us-keep-the-archive-free-accessible-and-private/|accessdate=14 травня 2017|deadurl=no|archiveurl=https://web.archive.org/web/20170521080543/http://blog.archive.org/2016/11/29/help-us-keep-the-archive-free-accessible-and-private/|archivedate=May 21, 2017}}</ref>, знищення (дистанційне або фізичне), маніпуляція вмістом архіву (див. також: [[хакерська атака]], [[резервне копіювання]]), проблематичне авторське право<ref>{{Cite web|title=Internet Archive: Proposed Changes To DMCA Would Make Us "Censor The Web"|url=https://consumerist.com/2016/06/07/internet-archive-proposed-changes-to-dmca-would-make-us-censor-the-web/|publisher=Consumerist|accessdate=14 травня 2017|date=7 червня 2016|deadurl=no|archiveurl=https://web.archive.org/web/20161111161239/https://consumerist.com/2016/06/07/internet-archive-proposed-changes-to-dmca-would-make-us-censor-the-web/|archivedate=November 11, 2016}}</ref> і спостереження за користувачами сайту<ref>{{Cite web|last=Herb|first=Ulrich|title=Die Trump-Angst grassiert|url=https://www.heise.de/tp/features/Die-Trump-Angst-grassiert-3549579.html|publisher=heise online|accessdate=14 травня 2017|language=de-DE|deadurl=no|archiveurl=https://web.archive.org/web/20161207164413/https://www.heise.de/tp/features/Die-Trump-Angst-grassiert-3549579.html|archivedate=December 7, 2016}}</ref>.
Серед інших загроз: стихійні лиха<ref>{{Cite web|title=Help Us Keep the Archive Free, Accessible, and Reader Private {{!}} Internet Archive Blogs|url=https://blog.archive.org/2016/11/29/help-us-keep-the-archive-free-accessible-and-private/|accessdate=14 травня 2017|deadurl=no|archiveurl=https://web.archive.org/web/20170521080543/http://blog.archive.org/2016/11/29/help-us-keep-the-archive-free-accessible-and-private/|archivedate=May 21, 2017}}</ref>, знищення (дистанційне або фізичне), маніпуляція вмістом архіву (див. також: [[хакерська атака]], [[резервне копіювання]]), проблематичне авторське право<ref>{{Cite web|title=Internet Archive: Proposed Changes To DMCA Would Make Us "Censor The Web"|url=https://consumerist.com/2016/06/07/internet-archive-proposed-changes-to-dmca-would-make-us-censor-the-web/|publisher=Consumerist|accessdate=14 травня 2017|date=7 червня 2016|deadurl=no|archiveurl=https://web.archive.org/web/20161111161239/https://consumerist.com/2016/06/07/internet-archive-proposed-changes-to-dmca-would-make-us-censor-the-web/|archivedate=November 11, 2016}}</ref> і спостереження за користувачами сайту<ref>{{Cite web|last=Herb|first=Ulrich|title=Die Trump-Angst grassiert|url=https://www.heise.de/tp/features/Die-Trump-Angst-grassiert-3549579.html|publisher=heise online|accessdate=14 травня 2017|language=de|deadurl=no|archiveurl=https://web.archive.org/web/20161207164413/https://www.heise.de/tp/features/Die-Trump-Angst-grassiert-3549579.html|archivedate=December 7, 2016}}</ref>.


Кевін Воен підозрює, що в довгостроковій перспективі багатьох поколінь «майже нічого» не залишиться такого, щоб цим можна було практично скористатись, але «якщо збережеться наступність нашої технологічної цивілізації», то «значну частину голих даних можна буде знайти й дослідити»<ref>{{Cite web|last=LaFrance|first=Adrienne|title=The Internet's Dark Ages|url=https://www.theatlantic.com/technology/archive/2015/10/raiders-of-the-lost-web/409210/|publisher=The Atlantic|accessdate=14 травня 2017|deadurl=no|archiveurl=https://web.archive.org/web/20170507173716/https://www.theatlantic.com/technology/archive/2015/10/raiders-of-the-lost-web/409210/|archivedate=May 7, 2017}}</ref>.
Кевін Воен підозрює, що в довгостроковій перспективі багатьох поколінь «майже нічого» не залишиться такого, щоб цим можна було практично скористатись, але «якщо збережеться наступність нашої технологічної цивілізації», то «значну частину голих даних можна буде знайти й дослідити»<ref>{{Cite web|last=LaFrance|first=Adrienne|title=The Internet's Dark Ages|url=https://www.theatlantic.com/technology/archive/2015/10/raiders-of-the-lost-web/409210/|publisher=The Atlantic|accessdate=14 травня 2017|deadurl=no|archiveurl=https://web.archive.org/web/20170507173716/https://www.theatlantic.com/technology/archive/2015/10/raiders-of-the-lost-web/409210/|archivedate=May 7, 2017}}</ref>.
Рядок 145: Рядок 145:
* {{Official}}
* {{Official}}
* {{Cite web|url=https://archive.org/about/terms.php/|title=Terms of use, privacy and copyright policy|website=archive.org|date=31 грудня 2014}}
* {{Cite web|url=https://archive.org/about/terms.php/|title=Terms of use, privacy and copyright policy|website=archive.org|date=31 грудня 2014}}
* {{Cite web|url=https://m.wikihow.com/Use-the-Internet-Archive's-Wayback-Machine/|title=Basic users'how-to guide for searching or saving ''web pages''|website=[[WikiHow]][[.com]]|language=en, de, es, fr, it|accessdate=20 квітня 2019|archive-date=15 березня 2020|archive-url=https://web.archive.org/web/20200315011623/https://m.wikihow.com/Use-the-Internet-Archive's-Wayback-Machine}}
* {{Cite web|url=https://m.wikihow.com/Use-the-Internet-Archive's-Wayback-Machine/|title=Basic users'how-to guide for searching or saving ''web pages''|website=[[WikiHow]][[.com]]|language=en, de, es, fr, it|accessdate=20 квітня 2019|archivedate=15 березня 2020|archiveurl=https://web.archive.org/web/20200315011623/https://m.wikihow.com/Use-the-Internet-Archive's-Wayback-Machine}}
* {{Cite video|url=https://www.youtube.com/watch?v=K8I28erYFLc|title=Internet history is fragile. This archive is making sure it doesn’t disappear}} {{Webarchive|url=https://web.archive.org/web/20210408020519/https://www.youtube.com/watch?v=K8I28erYFLc |date=8 квітня 2021 }}
* {{Cite video|url=https://www.youtube.com/watch?v=K8I28erYFLc|title=Internet history is fragile. This archive is making sure it doesn’t disappear}} {{Webarchive|url=https://web.archive.org/web/20210408020519/https://www.youtube.com/watch?v=K8I28erYFLc |date=8 квітня 2021 }}


=== Дзеркала ===
=== Дзеркала ===
* {{Cite web|url=http://archive.bibalex.org/|title=Official mirror of the Wayback Machine|accessdate=20 квітня 2019|archive-date=28 листопада 2012|archive-url=https://www.webcitation.org/6CV4jLIoP?url=http://www.bibalex.org/isis/frontend/archive/archive_web.aspx}}
* {{Cite web|url=http://archive.bibalex.org/|title=Official mirror of the Wayback Machine|accessdate=20 квітня 2019|archivedate=28 листопада 2012|archiveurl=https://www.webcitation.org/6CV4jLIoP?url=http://www.bibalex.org/isis/frontend/archive/archive_web.aspx}}


=== Утиліти ===
=== Утиліти ===
* {{Cite web|url=http://archive-access.sourceforge.net/projects/wayback/|title=OpenWayback. FOSS java and perl, with proxy replay mode|website=[[sourceforge]][[.net]]|accessdate=20 квітня 2019|archive-date=16 вересня 2011|archive-url=https://web.archive.org/web/20110916170854/http://archive-access.sourceforge.net/projects/wayback/}} (за IIPC)
* {{Cite web|url=http://archive-access.sourceforge.net/projects/wayback/|title=OpenWayback. FOSS java and perl, with proxy replay mode|website=[[sourceforge]][[.net]]|accessdate=20 квітня 2019|archivedate=16 вересня 2011|archiveurl=https://web.archive.org/web/20110916170854/http://archive-access.sourceforge.net/projects/wayback/}} (за IIPC)
* {{Cite web|url=https://github.com/hartator/wayback-machine-downloader/|title=Tool to retrieve a backup from the Wayback Machine|website=[[github]].com|accessdate=20 квітня 2019|archive-date=3 травня 2021|archive-url=https://web.archive.org/web/20210503013421/https://github.com/hartator/wayback-machine-downloader}}
* {{Cite web|url=https://github.com/hartator/wayback-machine-downloader/|title=Tool to retrieve a backup from the Wayback Machine|website=[[github]].com|accessdate=20 квітня 2019|archivedate=3 травня 2021|archiveurl=https://web.archive.org/web/20210503013421/https://github.com/hartator/wayback-machine-downloader}}
* {{Cite web|url=https://expired1.com/wayback-machine-downloader/|title=Wayback Machine Downloader Online|language=en, pl|accessdate=20 квітня 2019|archiveurl=https://web.archive.org/web/20180321192602/https://expired1.com/wayback-machine-downloader/|archivedate=21 березня 2018|deadurl=yes}}
* {{Cite web|url=https://expired1.com/wayback-machine-downloader/|title=Wayback Machine Downloader Online|language=en, pl|accessdate=20 квітня 2019|archiveurl=https://web.archive.org/web/20180321192602/https://expired1.com/wayback-machine-downloader/|archivedate=21 березня 2018|deadurl=yes}}



Поточна версія на 19:35, 24 квітня 2024

Wayback Machine
Логотип
Логотип
Знімок часового зрізу заархівованих сторінок www.wikipedia.org на сайті Wayback Machine від 21 грудня 2015 року
Посилання web.archive.org
Тип Archive
Реєстрація Optional
Мови англійська
Власник Internet Archive
Автор Брюстер Кейгл і Брюс Джильятd
Започатковано 24 жовтня 2001; 22 роки тому (2001-10-24)[1][2]
Стан Active
Рейтинг Alexa 253 (February 2019)[3]
Мова програмування C, Perl, Java і Python
CMNS: Wayback Machine у Вікісховищі

Wayback Machine — цифровий архів всесвітньої павутини та іншої інформації в Інтернеті. Його запустила 2001 року неприбуткова організація під назвою Internet Archive, що базується в Сан-Франциско (Каліфорнія, США).

Історія[ред. | ред. код]

2001 року засновники Internet Archive Брюстер Кале і Брюс Джилліат[en] запустили проект Wayback Machine, щоб розв'язати проблему зникнення контенту вебсайтів щоразу, коли їх змінюють або закривають[4]. Сервіс дозволяє користувачам переглядати архівні версії вебсторінок, як вони змінювались з часом, які в архіві називаються «тривимірним індексом»[5]. Кале і Джилліат створили сервіс, сподіваючись заархівувати весь інтернет і забезпечити «загальний доступ до всіх знань»[6].

Назву Wayback Machine вибрали як посилання на пристрій для подорожей у часі, який застосовують персонажі Містер Пібоді[en] і Шерман в анімаційному фільмі Шоу Роккі та Буллвінкля[en][7][8] під назвою «WABAC machine[en]» (вимовляється вей-бек). В одній з частин цього анімаційного мультфільму, Неймовірна історія Пібоді[en], персонажі за допомогою машини часу часто стають свідками відомих історичних подій, беруть в них участь і, здебільшого, змінюють їхній перебіг.

У травні 1996 року Wayback Machine почала архівувати кешовані вебсторінки з метою через п'ять років зробити послугу доступною громадськості[9]. Від 1996 до 2001 року інформація зберігалася на магнітних стрічках, а Кале зрідка дозволяв дослідникам і науковцям під'єднуватись до громіздкої бази даних[10]. 2001 року, коли архівові виповнилося п'ять років, відбулась церемонія його відкриття громадськості в Університеті Каліфорнії (Берклі)[11]. На час запуску Wayback Machine вона вже містила понад 10 мільярдів архівованих сторінок[12].

Нині дані зберігаються на великому кластері обчислювальних вузлів Linux компанії Internet Archive[6]. Він час від часу заново відвідує і архівує нові версії вебсайтів (див. технічні дані нижче)[13]. Сторінки також можна архівувати вручну, вводячи їх URL-адреси в поле пошуку, за умови, що вебсайти дозволяють пошуковому роботу Wayback Machine просканувати їх і зберегти дані[9].

Технічні деталі[ред. | ред. код]

Wayback Machine за допомогою спеціального пошукового робота сканує Інтернет і завантажує всі загальнодоступні вебсторінки, ієрархію Gopher, електронну дошку оголошень Usenet, а також завантажуване програмне забезпечення[14]. Ці роботи можуть відсканувати не всю доступну в Інтернеті інформацію, оскільки доступ до значної частини даних обмежують власники сайтів, або ж ці дані зберігається в недоступних базах даних. Щоб подолати неузгодженості частково кешованих вебсайтів, 2005 року компанія Internet Archive створила сайт Archive-It.org як засіб, що дозволяє установам і творцям контенту за власним бажанням збирати і зберігати зібрання цифрового контенту та створювати цифрові архіви[15].

Сканування надходять з різних джерел. Деякі імпортуються від третіх сторін, тоді як інші генеруються всередині самого Архіву[13]. Наприклад, сканування надходять від Фундації Альфреда Слоуна і Alexa, сканування зроблені ІА для Національного управління архівів та документації та Internet Memory Foundation[en], дзеркал Common Crawl[en][13]. «Worldwide Web Crawls» працює з 2010 року і сканує всемережжя[16][13].

Частота зроблених знімків сторінок змінюється в залежності від вебсайту[13]. Сайти у «Worldwide Web Crawls» вміщені в «список сканувань». Один сайт архівується раз за сканування[13]. Сканування може тривати кілька місяців або навіть років у залежності від розміру[13]. Наприклад, «Wide Crawl Number 13» розпочався 9 січня 2015 року й завершився 11 липня 2016 року[17]. Однак, в один і той самий час може відбуватись кілька сканувань, і сайт може бути вміщено в понад один список сканувань, тож частота сканування сайтів змінюється в широких межах[13].

Місткість сховища та її зростання[ред. | ред. код]

Разом з розвитком технології впродовж років зростала й місткість сховища Wayback Machine. У 2003 році, через два роки після того, як доступ став публічним, Wayback Machine зростала зі швидкістю 12 терабайтів на місяць. Дані зберігаються на зробленій на замовлення системі стелажування PetaBox[en], розробленій співробітниками інтернет-архіву. Перший стелаж на 100ТВ повністю увійшов у дію в червні 2004 року, хоча невдовзі стало зрозуміло, що потрібно значно більше обсягу пам'яті, ніж він має[18][19].

2009 року Internet Archive перевів свою спеціалізовану архітектуру зберігання до Sun Open Storage[en], і має у своїй власності новий центр обробки даних у Sun Modular Datacenter[en] у каліфорнійському кампусі Sun Microsystems[20]. Станом на 2009 Wayback Machine містила приблизно три петабайти даних і зростала зі швидкістю 100 терабайт на місяць[21].

Нова, поліпшена версія Wayback Machine, з оновленим інтерфейсом і новішим покажчиком архівних матеріалів, стала доступною для публічного тестування у 2011 році[22]. У березні того самого року на форумі Wayback Machine було сказано, що «бета-версія нової Wayback Machine має повніший і актуальніший покажчик всіх відсканованих матеріалів до 2010 року, й продовжить регулярно оновлюватися. Покажчик, який управляв старою Wayback Machine, має небагато матеріалів після 2008 року, і жодних його подальших оновлень не планується, оскільки цього року його припинять використовувати»[23]. Також 2011 року інтернет-архів встановив свою шосту пару стелажів PetaBox, що дозволило збільшити місткість Wayback Machine на 700 терабайт[24].

У січні 2013 року Internet Archive оголосила про нову віху — 240 мільярдів відсканованих URL-адрес[25]. У жовтні 2013 року компанія оголосила про введення функції «Save a Page»[26], що дозволяє користувачам Інтернету заархівувати вміст URL-адреси і швидко створює постійне посилання на відміну від попередньої функції liveweb. Це стало загрозою зловживань з боку сервісу як хостингу шкідливих двійкових файлів[en][27][28].

Станом на грудень 2014 Wayback Machine містила 435 мільярдів вебсторінок обсягом майже дев'ять петабайтів, і зростала приблизно на 20 терабайтів щотижня[29][12][30].

Станом на липень 2016 Wayback Machine містила близько 15 петабайт даних[31].

Станом на вересень 2018 року Wayback Machine містила понад 25 петабайтів даних[32][33].

Станом на грудень 2020 року Wayback Machine містила понад 70 петабайтів даних[34].

Зростання[ред. | ред. код]

За період з жовтня 2013 року по березень 2015 року в глобальному рейтингу Alexa сайт Wayback Machine опустився зі 163-го[35] на 208-ме місце[36]. У березні 2019 сайт був на 244-му місці[37].

Зростання Wayback Machine [38] [39]
Рік Кількість заархівованих сторінок (мільярдів)
2005
40
2008
85
2012
150
2013
373
2014
400
2015
452

Політики винятків вебсайтів[ред. | ред. код]

Історично, Wayback Machine поважав стандарт винятків для роботів (Robots.txt), визначаючи коли сайт можна сканувати; або ж, якщо вже робот його обійшов, чи ці архіви будуть у відкритому доступі. Власники вебсайту мають можливість зробити його недоступним для Wayback Machine за допомогою robots.txt. Правила robots.txt застосовуються заднім числом; якщо власник сайту заблокував для інтернет-архіву доступ до нього, то всі заархівовані раніше сторінки з цього домену також одразу ж стають недоступними. Крім того, працівники Internet Archive заявили, що «іноді власник сайту зв'язується з нами і просить зупинити сканування та архівацію сайту. Ми виконуємо ці запити»[40]. Крім того, на сайті написано: «Internet Archive не зацікавлений у скануванні вебсайту та інших інтернет-документів, або наданні доступу до них, якщо власники не хочуть, щоб вони були в зібранні»[41][42].

Оклендська архівна політика[ред. | ред. код]

Політика винятку заднім числом Wayback Machine частково ґрунтується на рекомендаціях з управління запитами на вилучення і збереження архівної цілісності (англ. Recommendations for Managing Removal Requests and Preserving Archival Integrity), опублікованих Школою інформаційного управління і систем в Університеті Каліфорнії (Берклі) у 2002 році, які дають власникові сайту право заблокувати доступ до архіву сайту[43]. Wayback дотримується цієї політики, щоб за можливості уникнути дорогих судових розглядів[44].

Політика винятку заднім числом Wayback почала послаблюватися 2017 року, коли він перестав зважати на файли robots.txt на американських урядових і військових вебсайтах як для їх сканування, так і показу відсканованих вебсторінок. Станом на квітень 2017 Wayback ігнорує robots.txt в ширших межах, не тільки для урядових сайтів США[45][46][47][48].

Використання[ред. | ред. код]

Від 2001 року, коли Wayback Machine стала доступною громадськості, науковці вивчали як способи, якими вона зберігає і збирає дані, так і самі сторінки, що вже містяться в її архіві. Станом на 2013 рік науковці написали близько 350 статей про Wayback Machine, здебільшого в галузях інформаційних технологій, бібліотекознавства та суспільних наук. Представники суспільних наук скористалися Wayback Machine, щоб проаналізувати, як розвиток вебсайтів, починаючи з середини 1990-х років і дотепер вплинув на темпи зростання компаній[12].

Коли Wayback Machine архівує сторінку, вона зазвичай вміщує більшість гіперпосилань, зберігаючи ці посилання активними, коли вони запросто могли бути порушені нестабільністю Інтернету. Індійські вчені вивчали здатність Wayback Machine зберігати гіперпосилання в наукових онлайн-публікаціях і визначили, що вона зберігає трохи більш як половину з них[49].

Журналісти використовують Wayback Machine, щоб переглядати мертві сайти, застарілі новини і зміни в змісті сайту. Його зміст використовують, щоб притягати політиків до відповідальності й викривати брехню в зображенні подій на полі бою[50]. 2014 року заархівована з соціальної мережі сторінка Ігоря Гіркина засвідчила, як він хвалиться, що його бійці збили нібито український військовий літак. Коли ж стало відомо, що насправді це цивільний літак Малайзійських авіаліній, Гіркін видалив пост і звинуватив українських військових у знищенні літака[50][51]. Марш за науку в березні 2017 року розпочався з обговорення на Reddit, яке показало, що хтось відвідав Archive.org і виявив, що з сайту Білого дому вилучено всі посилання на зміну клімату. У відповідь один з користувачів написав: «Має бути хода науковців на Вашингтон»[52][53][54].

Крім того, сайт активно використовується для верифікації, забезпечуючи редакторам Вікіпедії доступ до посилань і можливість створювати контент[55].

Обмеження[ред. | ред. код]

Попри свої можливості, Wayback Machine також має деякі обмеження. У 2014 році затримка між скануванням вмісту сайтів і часом, коли він був доступним на Wayback Machine, становила шість місяців[56]. Станом на листопад 2018 року час затримки становив від 3 до 10 годин[57]. Wayback Machine не є «історичним Google»; користувачі самі мають знати URL-адреси вебсайтів, які вони хочуть переглянути[58]. Існує функція «Site Search» (пошук сайту), яка дозволяє користувачам знайти сайт на основі слів, що описують сайт, а не слів, знайдених на самих вебсторінках[58].

Wayback Machine не містить усіх сторінок, коли-небудь створених, через обмеження свого вебкраулера. Wayback Machine не може повністю архівувати вебсторінки, які містять інтерактивні функції, як-от Флеш-платформи і форми, написані на JavaScript, бо ці функції вимагають взаємодії з хост-сайтом. Вебкраулеру складно відсканувати все, що закодовано не в HTML (або одному з його варіантів), що часто призводить до зламаних гіперпосилань та відсутніх зображень. Через це вебкраулер не архівує «сторінок-сиріт», які не містять посилань на інші сторінки[59][58]. Краулер Wayback Machine може відсканувати лише наперед визначену кількість гіперпосилань, згідно з наперед заданим обмеженням глибини, тому він не може заархівувати всі гіперпосилання на кожній сторінці[16].

Деякі власники поміщають на свій сайт файл robots.txt, який не дозволяє Wayback Machine знаходити та архівувати їх. Крім того, власники вебсайтів також можуть безпосередньо зв'язатися з Інтернет-архівом і просити, щоб їх сторінки було вилучено з архіву[59].

Як юридичні докази[ред. | ред. код]

Цивільне судочинство[ред. | ред. код]

Netbula LLC проти Chordiant Software Inc.[ред. | ред. код]

У справі 2009 року Netbula, LLC проти Chordiant Software Inc відповідач Chordiant подав клопотання, щоб Netbula на своєму сайті вимкнула файл robots.txt, який змушував Wayback Machine заднім числом закривати доступ до попередніх версій сторінок, заархівованих з сайту Netbula, які, на думку Chordiant могли б свідчити на користь захисту[60].

Netbula заперечила проти цього клопотання на тій підставі, що відповідач звертався з проханням змінити сайт Netbula, а йому слід було безпосередньо зробити запит до Інтернет-архіву за доступом до заархівованих сторінок[61]. Проте, співробітник Internet Archive подав заяву під присягою, в якій підтримав дію Chordiant, заявивши, що він не може видати вебсторінки за допомогою інших засобів «без значного навантаження, витрат і перебоїв у його роботі»[60].

Суддя Говард Ллойд у Північному окрузі Каліфорнії, відділі Сан-Хосе, відхилив заперечення Netbula і наказав йому тимчасово вимкнути блокування robots.txt для того, щоб Chordiant отримав архівні сторінки[60].

Telewizja Polska[ред. | ред. код]

У жовтні 2004 року у справі Telewizja Polska USA, Inc. проти Echostar Satellite, No. 02 °C 3293, 65 Fed. R. Evid. Serv. 673 (N.D. Ill. October 15, 2004) позивач, мабуть вперше в історії, намагався використати Wayback Machine як джерело допустимих доказів. Компанія Telewizja Polska є провайдером TVP Polonia і EchoStar[en], яка управляє Dish Network. До початку судового розгляду EchoStar вказала, що має намір запропонувати знімки Wayback Machine як доказ минулого змісту сайту Telewizja Polska. Компанія Telewizja Polska подала Клопотання про нерозголошення[en], щоб завадити використанню знімків на тій підставі, що нібито це чутки і неперевірене джерело, але суддя Арландер, відхилив твердження Telewizja Polska, що нібито це чутки, й відмовив у клопотанні про нерозголошення щодо вилучення доказів з процесу[62][63].

Патентне право[ред. | ред. код]

За умови виконання деяких додаткових вимог (наприклад, надання авторитетної заяви архівіста), Відомство з патентів і торгових знаків США[en] і Європейське патентне відомство[en] приймають від Інтернет-архіву відмітки часу як доказ того, коли ця вебсторінка була доступна громадськості. Ці дані використовуються для визначення, чи вебсторінку можна вважати prior art, наприклад, під час розгляду заявки на патент[64].

Цензура та інші загрози[ред. | ред. код]

Станом на грудень 2016 року Archive.org заблокований у Китаї[en][65][66].

Елісон Макріна, директорка Library Freedom Project, зазначає, що «хоча бібліотекарі глибоко цінують недоторканість приватного життя, ми також рішуче виступаємо проти цензури»[50].

Відомі окремі випадки, коли сайт закрив онлайн-доступ до матеріалів, через які «випадкові» люди опинились у небезпеці[50].

Серед інших загроз: стихійні лиха[67], знищення (дистанційне або фізичне), маніпуляція вмістом архіву (див. також: хакерська атака, резервне копіювання), проблематичне авторське право[68] і спостереження за користувачами сайту[69].

Кевін Воен підозрює, що в довгостроковій перспективі багатьох поколінь «майже нічого» не залишиться такого, щоб цим можна було практично скористатись, але «якщо збережеться наступність нашої технологічної цивілізації», то «значну частину голих даних можна буде знайти й дослідити»[70].

Власники Інтернет-архіву заявляють, що він побудований з розрахунком на тривалу перспективу[71]. Втім, автори статті у журналі The Atlantic описують його роботу як "несамовите намагання вихопити дані перш ніж вони зникнуть, не маючи для цього якоїсь більш-менш надійної тривалої інфраструктури[72].

Див. також[ред. | ред. код]

Примітки[ред. | ред. код]

  1. WayBackMachine.org WHOIS, DNS, & Domain Info – DomainTools. WHOIS. Архів оригіналу за 14 травня 2020. Процитовано 13 березня 2016.
  2. InternetArchive.org WHOIS, DNS, & Domain Info – DomainTools. WHOIS. Архів оригіналу за 12 травня 2020. Процитовано 13 березня 2016.
  3. Archive.org Traffic, Demographics and Competitors - Alexa. alexa.com. Архів оригіналу за 23 березня 2019. Процитовано 4 лютого 2019.
  4. Notess, Greg R. (March–April 2002). The Wayback Machine: The Web's Archive. Online. 26: 59—61 — через EBSCOhost.
  5. The Wayback Machine, Frequently Asked Questions, архів оригіналу за 18 вересня 2018, процитовано 18 вересня 2018
  6. а б 20,000 Hard Drives on a Mission | Internet Archive Blogs. blog.archive.org (англ.). Архів оригіналу за 20 жовтня 2018. Процитовано 15 жовтня 2018.
  7. Green, Heather (28 лютого 2002). A Library as Big as the World. BusinessWeek. Архів оригіналу за 20 грудня 2011.
  8. Tong, Judy (8 вересня 2002). Responsible Party – Brewster Kahle; A Library Of the Web, On the Web. New York Times. Архів оригіналу за 20 лютого 2011. Процитовано 15 серпня 2011.
  9. а б Internet Archive: Wayback Machine. archive.org (англ.). Архів оригіналу за 3 січня 2014. Процитовано 15 жовтня 2018.
  10. Cook, John (1 листопада 2001). Web site takes you way back in Internet history. Seattle Post-Intelligencer. Архів оригіналу за 12 серпня 2014. Процитовано 15 серпня 2011.
  11. Wayback Goes Way Back on Web. Wired. 28 жовтня 2001. Архів оригіналу за 16 жовтня 2017. Процитовано 16 жовтня 2017.
  12. а б в Arora, Sanjay K.; Li, Yin; Youtie, Jan; Shapira, Philip (5 травня 2015). Using the wayback machine to mine websites in the social sciences: A methodological resource. Journal of the Association for Information Science and Technology (англ.). 67 (8): 1904—1915. doi:10.1002/asi.23503. ISSN 2330-1635.
  13. а б в г д е ж и Kalev Leetaru (28 січня 2016). The Internet Archive Turns 20: A Behind the Scenes Look at Archiving the Web. Forbes. Архів оригіналу за 16 жовтня 2017. Процитовано 16 жовтня 2017.
  14. Kahle, Brewster. Archiving the Internet. Scientific American – March 1997 Issue. Архів оригіналу за 3 квітня 2012. Процитовано 19 серпня 2011.
  15. Jeff Kaplan (27 жовтня 2014). Archive-It: Crawling the Web Together. Internet Archive Blogs. Архів оригіналу за 12 жовтня 2017. Процитовано 16 жовтня 2017.
  16. а б Worldwide Web Crawls. Internet Archive. Архів оригіналу за 19 жовтня 2017. Процитовано 16 жовтня 2017.
  17. Wide Crawl Number 13. Internet Archive. Архів оригіналу за 19 жовтня 2017. Процитовано 16 жовтня 2017.
  18. Internet Archive: Petabox. archive.org (англ.). Процитовано 25 жовтня 2018.
  19. Kanellos, Michael (29 липня 2005). Big storage on the cheap. CNET News.com. Архів оригіналу за 3 квітня 2007. Процитовано 29 липня 2007.
  20. Internet Archive and Sun Microsystems Create Living History of the Internet. Sun Microsystems. 25 березня 2009. Архів оригіналу за 26 березня 2009. Процитовано 27 березня 2009.
  21. Mearian, Lucas (19 березня 2009). Internet Archive to unveil massive Wayback Machine data center. Computerworld.com. Архів оригіналу за 23 березня 2009. Процитовано 22 березня 2009.
  22. Updated Wayback Machine in Beta Testing. Archive.org. Архів оригіналу за 23 серпня 2011. Процитовано 19 серпня 2011.
  23. Beta Wayback Machine, in forum. Archive.org. Архів оригіналу за 17 квітня 2014. Процитовано 16 квітня 2014.
  24. Internet Archive Forums: 6th pair of racks go into service: over 2PB of data space used. archive.org (англ.). Архів оригіналу за 24 жовтня 2016. Процитовано 25 жовтня 2018.
  25. Wayback Machine: Now with 240,000,000,000 URLs | Internet Archive Blogs. Blog.archive.org. 9 січня 2013. Архів оригіналу за 14 квітня 2014. Процитовано 16 квітня 2014.
  26. Rossi, Alexis (25 жовтня 2013). Fixing Broken Links on the Internet. archive.org. San Francisco, CA, US: Collections Team, the Internet Archive. Архів оригіналу за 7 листопада 2014. Процитовано 25 березня 2015. We have added the ability to archive a page instantly and get back a permanent URL for that page in the Wayback Machine. This service allows anyone – wikipedia editors, scholars, legal professionals, students, or home cooks like me – to create a stable URL to cite, share or bookmark any information they want to still have access to in the future.
  27. The VirusTotal Team (25 березня 2015). 207.241.226.190 IP address information. virustotal.com. Dublin 2, Ireland: VirusTotal. Архів оригіналу за 14 липня 2014. Процитовано 25 березня 2015. 2015-03-25: Latest URLs hosted in this IP address detected by at least one URL scanner or malicious URL dataset. ... 2/62 2015-03-25 16:14:12 [complete URL redacted]/Renegotiating_TLS.pdf ... 1/62 2015-03-25 04:46:34 [complete URL redacted]/CBLightSetup.exe
  28. Advisory provided by Google (25 березня 2015). Safe Browsing Diagnostic page for archive.org. google.com/safebrowsing. Mountain View, CA, US: Google. Архів оригіналу за 6 квітня 2015. Процитовано 25 березня 2015. 2015-03-25: Part of this site was listed for suspicious activity 138 time(s) over the past 90 days. ... What happened when Google visited this site? ... Of the 42410 pages we tested on the site over the past 90 days, 450 page(s) resulted in malicious software being downloaded and installed without user consent. The last time Google visited this site was on 2015-03-25, and the last time suspicious content was found on this site was on 2015-03-25. ... Malicious software includes 169 trojan(s), 126 virus, 43 backdoor(s).
  29. Internet Archive Frequently Asked Questions. Архів оригіналу за 21 жовтня 2009. Процитовано 17 січня 2015.
  30. Internet Archive Frequently Asked Questions. 18 грудня 2014. Архів оригіналу за 18 грудня 2014. Процитовано 13 грудня 2018.
  31. Can the manipulation of big data change the way the world thinks?. The National. Архів оригіналу за 12 січня 2017. Процитовано 14 травня 2017.
  32. Crockett, Zachary (28 вересня 2018). Inside Wayback Machine, the internet’s time capsule. The Hustle (амер.). Архів оригіналу за 2 жовтня 2018. Процитовано 26 жовтня 2018.
  33. Heffernan, Virginia (18 вересня 2018). Things Break and Decay on the Internet—That's a Good Thing. WIRED (англ.). Архів оригіналу за 25 вересня 2018. Процитовано 26 жовтня 2018.
  34. Donate to the Internet Archive: Digital Library of Free & Borrowable Books, Movies, Music & Wayback Machine. adafruit. Архів оригіналу за 2 грудня 2020. Процитовано 2 грудня 2020.
  35. Archive.org Site Info. Alexa Internet. Архів оригіналу за 28 жовтня 2013. Процитовано 29 жовтня 2013.
  36. Archive.org Site Overview. Alexa Internet. Архів оригіналу за 9 квітня 2015. Процитовано 9 квітня 2015.
  37. Archive.org Traffic, Demographics and Competitors - Alexa. web.archive.org. 23 березня 2019. Архів оригіналу за 23 березня 2019. Процитовано 5 квітня 2019.
  38. michelle (9 травня 2014). Wayback Machine Hits 400,000,000,000!. Internet Archive. Архів оригіналу за 26 серпня 2014. Процитовано 25 березня 2015.
  39. Internet Archive Wayback Machine. Internet Archive. Архів оригіналу за 13 лютого 2015. Процитовано 25 березня 2015.
  40. Some sites are not available because of Robots.txt or other exclusions [Архівовано 15 квітня 2011 у Wayback Machine.]
  41. How can I remove my site's pages from the Wayback Machine? [Архівовано 17 квітня 2014 у Wayback Machine.]
  42. Cox, Joseph (22 травня 2018). The Wayback Machine Is Deleting Evidence of Malware Sold to Stalkers. Архів оригіналу за 23 травня 2018. Процитовано 23 травня 2018.
  43. Recommendations for Managing Removal Requests And Preserving Archival Integrity. University of California. 14 грудня 2002. Архів оригіналу за 18 вересня 2017. Процитовано 14 вересня 2017.
  44. Retroactive robots.txt removal of past crawls AKA Oakland Archive Policy. Internet Archive. 7 липня 2014. Архів оригіналу за 10 жовтня 2017. Процитовано 14 вересня 2017.
  45. Mark Graham (17 квітня 2017). Robots.txt meant for search engines don't work well for web archives. Internet Archive Blogs. Архів оригіналу за 17 квітня 2017. Процитовано 16 квітня 2017.
  46. Archivierung des Internets: Internet Archive ignoriert künftig robots.txt (нім.). heise online. Архів оригіналу за 27 квітня 2017. Процитовано 14 травня 2017.
  47. Suchmaschinen: Internet Archive will künftig Robots.txt-Einträge ignorieren – Golem.de (нім.). Архів оригіналу за 19 червня 2017. Процитовано 14 травня 2017.
  48. Internet Archive will ignore robots.txt files to keep historical record accurate. Digital Trends. 24 квітня 2017. Архів оригіналу за 16 травня 2017. Процитовано 14 травня 2017.
  49. Sampath Kumar, B.T.; Prithviraj, K.R. (21 жовтня 2014). Bringing life to dead: Role of Wayback Machine in retrieving vanished URLs. Journal of Information Science (англ.). 41 (1): 71—81. doi:10.1177/0165551514552752. ISSN 0165-5515.
  50. а б в г Wayback Machine Won't Censor Archive for Taste, Director Says After Olympics Article Scrubbed. Архів оригіналу за 6 січня 2017. Процитовано 14 травня 2017.
  51. What the Web Said Yesterday. The New Yorker. Архів оригіналу за 25 січня 2015. Процитовано 14 травня 2017.
  52. The March for Science began with this person's 'throwaway line' on Reddit. Washington Post. Архів оригіналу за 23 квітня 2017. Процитовано 23 квітня 2017.
  53. Are scientists going to march on Washington?. The Washington Post. Архів оригіналу за 31 січня 2017. Процитовано 31 січня 2017.
  54. Foley, Katherine Ellen. The global March for Science started with a single Reddit thread. Quartz. Архів оригіналу за 24 квітня 2017. Процитовано 23 квітня 2017.
  55. http://blog.archive.org/2018/10/01/more-than-9-million-broken-links-on-wikipedia-are-now-rescued
  56. Internet Archive Frequently Asked Questions. Internet Archive. 2 квітня 2014. Архів оригіналу за 2 квітня 2014. Процитовано 23 листопада 2018.
  57. Internet Archive Frequently Asked Questions. archive.org (англ.). Процитовано 23 листопада 2018.
  58. а б в Bates, Mary Ellen (2002). The Wayback Machine. Online. 26: 80 — через EBSCOhost.
  59. а б Internet Archive Frequently Asked Questions. archive.org (англ.). Архів оригіналу за 20 квітня 2013. Процитовано 18 жовтня 2018.
  60. а б в Lloyd, Howard (October 2009). Order to Disable Robots.txt (PDF). Архів оригіналу (PDF) за 8 серпня 2019. Процитовано 15 жовтня 2009.
  61. Cortes, Antonio (October 2009). Motion Opposing Removal of Robots.txt. Архів оригіналу за жовтень 27, 2010. Процитовано 15 жовтня 2009.
  62. Gelman, Lauren (17 листопада 2004). Internet Archive's Web Page Snapshots Held Admissible as Evidence. Packets. 2 (3). Архів оригіналу за 30 квітня 2011. Процитовано 4 січня 2007.
  63. Howell, Beryl A. (February 2006). Proving Web History: How to use the Internet Archive (PDF). Journal of Internet Law: 3—9. Архів оригіналу (PDF) за 5 липня 2010. Процитовано 6 серпня 2008.
  64. Wynn W. Coggins (Fall 2002). Prior Art in the Field of Business Method Patents – When is an Electronic Document a Printed Publication for Prior Art Purposes?. USPTO. Архів оригіналу за 21 вересня 2012.
  65. Conger, Kate. Backing up the history of the internet in Canada to save it from Trump. TechCrunch. Архів оригіналу за 27 грудня 2016. Процитовано 14 травня 2017.
  66. Where to find what's disappeared online, and a whole lot more: the Internet Archive. Public Radio International. Архів оригіналу за 28 березня 2017. Процитовано 14 травня 2017.
  67. Help Us Keep the Archive Free, Accessible, and Reader Private | Internet Archive Blogs. Архів оригіналу за 21 травня 2017. Процитовано 14 травня 2017.
  68. Internet Archive: Proposed Changes To DMCA Would Make Us "Censor The Web". Consumerist. 7 червня 2016. Архів оригіналу за 11 листопада 2016. Процитовано 14 травня 2017.
  69. Herb, Ulrich. Die Trump-Angst grassiert (нім.). heise online. Архів оригіналу за 7 грудня 2016. Процитовано 14 травня 2017.
  70. LaFrance, Adrienne. The Internet's Dark Ages. The Atlantic. Архів оригіналу за 7 травня 2017. Процитовано 14 травня 2017.
  71. The Entire Internet Will Be Archived In Canada to Protect It From Trump (en-us) . Motherboard. Архів оригіналу за 16 травня 2017. Процитовано 14 травня 2017.
  72. LaFrance, Adrienne. The Human Fear of Total Knowledge. The Atlantic. Архів оригіналу за 2 грудня 2016. Процитовано 14 травня 2017.

Посилання[ред. | ред. код]

Дзеркала[ред. | ред. код]

Утиліти[ред. | ред. код]