Очередное техническое извращение - индекс книг в открытом формате.

Значит так.

Мне приспичило для сугубо интимных целей проиндексировать свою коллекцию книг.
Чтобы поиск. Просто. Потому индекс - плоский.

Индексировал для своей собственной приблуды.
Приблуда - не десктопная, не форточная и, следовательно, нафиг никому, кроме меня, не нужная.
Индекс сделал в SQLite (3), который хорош ещё и тем, что база в нём - одинаковая для всех платформ.
Под виндами можно пользовать фриварный SQLite 2009 Pro Enterprise Manager.

up: обновил БД.

Кому надо - берите (подробности - под катом).

здесь - архив в 49М, в нём - 270М база

В БД проиндексированы книжки по 363999 (только FB2, валидный XML).
Индексировался раздел description на глубину в 3 тега (поля section, tag, subtag) так, чтобы был возможен текстовый поиск книги (файла) по полю value.

Структура:

Комментарии

Что заметил: с ростом базы SQLite начинает тормозить на INSERT'ах, как Oracl - скорость индексации падает с 3Мбайт/с до 500 кбайт/с. И это всего на 3.5 миллионах записей... Пичалька.

X