Грандиозный прорыв: Times выложила в интернет весь свой архив

Издание Times выложило в интернет цифровые копии всех своих выпусков, начиная с 1785 года. В настоящий момент архив бесплатен, затем за контент придется платить.

Архив доступен по адресу http://archive.timesonline.co.uk/tol/archive/ и предлагает невероятную возможность познакомиться с развитием мировой истории глазами очевидцев. Корреспонденты Times описывали события от гильотинирования Марии Антуанетты, битвы при Ватерлоо, убийства президента Линкольна, зверства Джека-потрошителя до убийства Эрцгерцога Фердинанда, Великой депрессии, самоубийства Гитлера и многих, многих других.

Судя по тому, что сайт в настоящее время работает с некоторыми затруднениями, он пользуется огромной популярностью.

http://www.onliner.by/news/23.06.2008/17.56/

Комментарии

Ну, кто закачает на Либрусек? :D

Цитата:
начиная с 1785 года

пожелаем этому маньяку герою удачи! :)

хаха))) лол))

а я бы засел скачивать,но,языкам не обучен)) вот бы из наших кто такую же тему двинул,я бы Аиф зарядил на скачку

Плиз кто-нибудь скачайте и выложите!!!

самое правильное - попилить по годам, и каждый по году-два-три закачает
одному, естественно, качать будет совершенно невозможно

то же и насчет регистрации - зарегестрировать хотя бы ОДИН аккаунт, и выложить здесь параметры доступа

hagen
с удовольствием бы
а как?
они не выложили все страницы по порядку,
выдают отдельные вырезки в зависимости от того что забил в поиск

там есть форма "one day at a time" где высвечиваются все статьи за выбранный день.

Скачали бы, если бы только понять, что и как.. Страница регистрации у них сейчас дохнет, без нее доступ только к отдельным статьям. Прочитать выбранный номер постранично видимо невозможно, навигация только через поиск.

Если всё ещё интересна тема, всем желающим:
login:
pass: librusec12

Если кто качает - не дергайтесь, скрипт уже во всю тянет :-)
Вот только объем там не детский - первые пол-года заняли 160 метров...
Ну да торрент и не такое сжует

Гм... Я в раздумьях. Предполагаемый объем - от 150 гиг и дальше. Оно кому-то надо?
Если нет - то я прикрою закачку, пожалуй...

olleolle написал:
Гм... Я в раздумьях. Предполагаемый объем - от 150 гиг и дальше. Оно кому-то надо?
Если нет - то я прикрою закачку, пожалуй...

Я бы хотел заиметь. Так что не прерывайте, пожалуйста. Или, если есть технические трудности - я могу качать, если скриптом поделитесь.

Трудности только в том, что такой объем мне держать негде.
Скрипт кладу. там примитив - не ошибетесь, если соберетесь что-то менять.
Я качаю пока, а там видно будет - канал пустой, место пока есть...
Думаю, делиться смысла нет - все равно вам весь объем придется закачивать - хоть от меня, хоть непосредственно с сайта.

use Date::Calc qw (:all);
use LWP::Simple;

@mon = ('JAN', 'FEB', 'MAR', 'APR', 'may', 'jun', 'jul', 'aug', 'sep', 'oct', 'nov', 'dec');

$baseurl = 'http://archive.timesonline.co.uk/archiveimg/paid/';
$year = 1785;
$month = 1;
$day = 1;
$fileprefix = '0FFO';
$res = '80';

$page = 1;

$lastYear = 1985;

while (1) {
    $urlMon = sprintf("%02d", $month);
    $urlDay = sprintf("%02d", $day);
    $nameMon = uc $mon[$month-1];
#    $nameDay = sprintf("%02d", $day);
    $urlPage = sprintf("%02d", $page);

    $namePage =     $nameDay = sprintf("%03d", $page);

    $fname = "$fileprefix-$year-$nameMon$urlDay-$namePage-$res.jpg";
$url = "$baseurl$year/$urlMon/$urlDay/$urlPage/$fname";
print "$url\n";
$file = get($url);
if (defined($file) && length($file) > 200) {
open FILE, ">$fname";
binmode FILE;
print FILE $file;
close FILE;
++$page;
} else {
$page = 1;
($year, $month, $day) = Add_Delta_Days($year,$month,$day, 1);
next if $year > $lastYear;
}
}

2 olleolle

да, желающие есть,
160 Гб свободных найду,
какой там формат?
djvu?

а почему же 160 Гб?

полгода - 160 мб,
следовательно 200 лет =64 Гб.

Первые пол-года с большими пропусками.
Там в разное время разные предположения выходили.
Пока что стянул 31 год - 18 гиг. Получается около 120 гиг.
ФОрмат jpg, можно тянуть 1706х2734 (как у меня сейчас), размер - около 370 к
можно 1500х2400 - в переменной $res Заменить 80 на 50. Размер - около 700 к.
можно 900х1440 - заменить 80 на 19. Размер - около 600 к.
Как все это связано с качеством - черт его знает. Поглядите, что по вкусу придется...

Все. Куча извинений, но приходится прервать закачку. Скрипт дан выше - можете качать сами, или договориться с кем-нибудь...
Но по не зависящим от меня причинам моим закачкам временные тапки...

X