Учебные материалы на Либрусеке | Либрусек

Вы здесь Главная » Блоги » Блог пользователя kirushik Учебные материалы на Либрусеке Опубликовано пт, 15/02/2008 - 05:19 пользователем kirushik В сообществе МГУ возникла мысль создать централизованную онлайн-коллекцию учебно-научных материалов. И теперь нужна площадка для этого действа. С одной стороны, Либрусек вполне для этого подходит - выкладывабельны файлы любых форматов, возможны обсуждения, доступ прямо из браузера, равно как и скачка. С другой стороны, это идёт несколько вразрез с концепцией именно библиотеки, тем более, что под учебными материалами понимаются не только книги-статьи, но и рукописи - конспекты, разбор задач? Как многоуважаемая публика отнеслась бы к такому использованию Либрусека? Блог пользователя kirushik Войдите или зарегистрируйтесь, чтобы отправлять комментарии Комментарии Re: Учебные материалы на Либрусеке Постоянная ссылка (Permalink) Опубликовано пт, 15/02/2008 - 21:22 пользователем Warchoon +1 Если выкладывают деловые книги, научную, околонаучную и псевдонаучную литературу и, прости Господи, эзотерику, то почему бы не выкладывать учебные материалы? Re: Учебные материалы на Либрусеке Постоянная ссылка (Permalink) Опубликовано сб, 16/02/2008 - 11:21 пользователем computers Еще раз (уже писал) обращаю внимание публики на библиотеку http://ihtik.lib.ru, где множество учебной литературы, а также, что еще более ценно - научная и техническая. Ее тоже совсем неплохо бы закинуть на Либресек, целиком. Скачка там пока свободная, а что завтра будет - неизвестно. Для скачки - там адресная строка и модифицируемый номер, простейший скрипт будет работать - нужен просто хороший канал и ftp. У кого есть возможность перекинуть - подумайте! У меня, с компьютером дома и каналом 128 kbps - такой возможности нет. Re: Учебные материалы на Либрусеке Постоянная ссылка (Permalink) Опубликовано сб, 16/02/2008 - 11:58 пользователем larin Кое-что я у них брал. К сожалению, это не так просто, как хотелось бы. Качается-то замечательно, а вот потом начинаются сложности. Книги повторяются по несколько раз, никакой системы в названиях нет, автоматическая обработка невозможна. Re: Учебные материалы на Либрусеке Постоянная ссылка (Permalink) Опубликовано сб, 16/02/2008 - 13:42 пользователем computers Да, это так. К тому же все в основном djvu, и немного - pdf. Поэтому для массовой выкачки и упорядочения и потребуются добровольцы. Я, вообще, удивлен, что Ихтик еще не прикрыли, с российским рвением и идиотизмом ;). С другой стороны, поразительно, какой труд вложен создателями ресурса в сканирование книг. Жаль будет, если пропадет. Нигде дольше нет такого! Может, не мудрствуя лукаво, просто создать на Либрусеке копию? А систематика - ну ее в баню? Кому надо - разберется ;). Re: Учебные материалы на Либрусеке Постоянная ссылка (Permalink) Опубликовано сб, 16/02/2008 - 13:52 пользователем larin Движок либрусека требует, чтобы у книги было название, авторы, жанр и т.п. Из всего этого можно автоматом проставить только жанр. Название, авторы и прочая информация у ихтика забита в имя файла, причём неединообразно, автоматической обработке не подлежит. Я замучался всё это богатство причёсывать прорабатывая компьютерный раздел. Одних только дублей было несколько сотен. Причём когда я ему прислал список дублей - он не понял зачем это вообще нужно. К тому же большая часть ихтика не выложена онлайн, доступна только на dvd. Было бы неплохо выкупить у них всю коллекцию, причесать, поудалять дубли, проставить метаинформацию - но у меня сейчас на это времени нет. Да и сервер понадобится побольше, большая она очень. Хотя это как раз самое простое. Re: Учебные материалы на Либрусеке Постоянная ссылка (Permalink) Опубликовано пт, 15/02/2008 - 21:29 пользователем larin Можно выкладывать, я не против. Подумайте какой функционал для того потребен будет. Re: Учебные материалы на Либрусеке Постоянная ссылка (Permalink) Опубликовано сб, 16/02/2008 - 08:37 пользователем Undead Вообще было бы неплохо перекинуть на либрусек библиотеку колхоза (lib.homelinux.org) А то ее состояние(пароли и общее удобство пользования) вызывает некоторые опасения... Re: Учебные материалы на Либрусеке Постоянная ссылка (Permalink) Опубликовано сб, 16/02/2008 - 13:54 пользователем larin Возьмёшься? Re: Учебные материалы на Либрусеке Постоянная ссылка (Permalink) Опубликовано сб, 16/02/2008 - 16:00 пользователем kirushik А вот и ещё идея - раздел (просто пост, скажем), в котором вывешены текущие нужды библиотеки. Типа "Вон хттп://там лежат книги, их надо понемножку перевести к нам" или "Нужен такой модуль к Друпалу, который делает такую кнопку, от которой всем сразу становится хорошо". Эти задачи ставит только руководство:), а пользователи-волонтёры отмечаются и берутся решать ту или иную. Таким образом достаточно много народу можно мобилизовать, ИМХО. Из тех, кто просто не знает, как бы можно было поучаствовать... Я сам попытаюсь организовать МГУшную движуху, чтобы просто продумать, что нам конкретно понадобится. И потом, вероятно, и буду это реализвывать. --------- Терминаторы апокалипсис предотвращали-предотвращали, да не выпредотвратили; никак апокалипсис не предотвратить, не перепредотвратить, не перевыпредотвратить. Re: Учебные материалы на Либрусеке Постоянная ссылка (Permalink) Опубликовано сб, 16/02/2008 - 19:20 пользователем larin У библиотеки нужд нет. Ну, почти. Так, отлов багов. Нужды у пользователей - для того есть раздел на форуме http://lib.rus.ec/forums-6 Можно выбирать любую и слать патчи. Исходники доступны. Re: Учебные материалы на Либрусеке Постоянная ссылка (Permalink) Опубликовано вс, 17/02/2008 - 04:53 пользователем kirushik А, да. Форум же есть. Виноват, не приметил:) А под "библиотекой" я понимаю не только собственно сайт, но и его посетителей. (Их-то нужды я и имел в виду) --------- Терминаторы апокалипсис предотвращали-предотвращали, да не выпредотвратили; никак апокалипсис не предотвратить, не перепредотвратить, не перевыпредотвратить. Re: Учебные материалы на Либрусеке Постоянная ссылка (Permalink) Опубликовано сб, 16/02/2008 - 19:16 пользователем dzver А поделить работу никак нельзя..? Я возмусь сделать из основного индекса http://lib.homelinux.org/_djvu/_catalog/index_1.html, и всех страничек типа http://lib.homelinux.org/_djvu/_catalog/index_2.html , большой индексный текстовой файл, легко парсируемый где в каждой строке автор, название, год выпуска, тип файла, язык, ссылка для wget-a. Потом можно сделать скрипт который с того индекса заливает книжки в либрусеке и базу - но ето лучше сделать с твоей стороны - проще будет (не надо возиться с роботом который заливает на ftp, потом емулирует браузер для заливки каждого файла в либрусека и пр). И, бессмысленно сливать гигы с колхоза локально (он и без того у меня больно медленный) и потом обратно аплоадить в либрусеке. Re: Учебные материалы на Либрусеке Постоянная ссылка (Permalink) Опубликовано сб, 16/02/2008 - 19:18 пользователем larin Логично. Если будет легко парсируемый файл, то выкачать уже не составит проблем. Давай. Еще бы как-нибудь про дубли подумать... Можешь заодно и ихтиком заняться, той его частью, которая выкачивабельна. Re: Учебные материалы на Либрусеке Постоянная ссылка (Permalink) Опубликовано сб, 16/02/2008 - 20:27 пользователем dzver Договорились. Ихтик пока не хочу, там не вижу метод автоматически отделять имя автора от имя книги... Обычно разделены дефисом " - " но не всегда, имхо много хлама будет. Re: Учебные материалы на Либрусеке Постоянная ссылка (Permalink) Опубликовано вс, 17/02/2008 - 00:06 пользователем larin Там не только отделять. Там может быть Иван Иванов, может Иван Иванович Иванов, может быть Иванов Иван Иванович и т.п. А уж когда несколько авторов, что часто для научной литературы - совсем весело. Я аж в скрипт загнал часто встречающиеся имена и фамилии, чтоб он хоть как-то разбирался. Нужен ли народу неестественный интеллект? Имхо не нужен. Придётся ждать, пока ихтик осознает необходимость следования стандарту. (любому - лишь бы одному) Re: Учебные материалы на Либрусеке Постоянная ссылка (Permalink) Опубликовано пн, 18/02/2008 - 18:12 пользователем dzver Колхоз: Сделал индекс и залил на ftp, в директорию /kolhoz-superindex. Инструкции там же. Я сохранил классификацию колхоза в одно из полей, она очень хороша для поиска (типа поиск "Differential geometry"... и получил все книжки). Можно наверное создать новые "научные жанры", либо добавить к имени книжки /первое, конечно лучше/. Можешь и ее игнорировать. Иначе обычный текстовой файл, каждая строка - книжка. Удобно парсить с awk и пр. Я перекодировал кирилицу с 1251 на utf, надеюсь проблемы не будут. Если найдешь глюки или что-либо нужно изменить - скажи, перегенерю как надо /теперь ето просто/. Когда свой скрипт делаешь, обрати внимание на трансакционность... Колхоз довольно шаткий, нельзя рассчитывать что будет доступен или ошибки ни возникнут... У меня качается очень и очень медленно (1-5К/s). Тут только cron спасет. Re: Учебные материалы на Либрусеке Постоянная ссылка (Permalink) Опубликовано пн, 18/02/2008 - 19:35 пользователем larin запустил выкачку. мда, скорость ужасна. выкачиваться такими темпами будет не один месяц :( ладно, пусть качается. Может проверишь как-нибудь список на предмет дублей? Хотя бы крупные файлы чтоб не перекачивать. Re: Учебные материалы на Либрусеке Постоянная ссылка (Permalink) Опубликовано пн, 18/02/2008 - 19:57 пользователем dzver Дублей не должно быть. (внутри самого индекса, конечно - иначе насчет либрусека не знаю....) Вот проверяю по уникальность имени файла внизу. Но оказывается, проскользнули несколько "пустых" строк /без файла для скачки, может другое есть.../, скрипт что-то не так пропарсил или у них были пустые строки в таблиц. Все же делай простую верификацию... manul@siduxbox:~/piratek/homelinux$ awk -F "\|" '{ print $6 }' kolhoz-superindex.txt \| wc -l 20886 manul@siduxbox:~/piratek/homelinux$ awk -F "\|" '{ print $6 }' kolhoz-superindex.txt \| uniq \| wc -l 20833 manul@siduxbox:~/piratek/homelinux$ awk -F "\|" '{ print $6 }' kolhoz-superindex.txt \| uniq -d manul@siduxbox:~/piratek/homelinux$ awk -F "\|" '{ print $6 }' kolhoz-superindex.txt \| uniq -d \| wc -l 37 manul@siduxbox:~/piratek/homelinux$ cat kolhoz-superindex.txt \| wc -l 20886 manul@siduxbox:~/piratek/homelinux$ cat kolhoz-superindex.txt \| uniq \| wc -l 20886 manul@siduxbox:~/piratek/homelinux$ Кстати, прежде когда я заливал файлы через ftp (много fb2 упакованные в zip) твой скрипт отлова дублей отлично работал предоставляя вручную разборку дублей или подозрительных. Теперь ето не работает... Все заливается молчаливо. И точно дубли появляются каждый раз... Нельзя ли восстановить ето, когда у тебя время есть. Так хорошо было;) Re: Учебные материалы на Либрусеке Постоянная ссылка (Permalink) Опубликовано пн, 18/02/2008 - 20:11 пользователем larin интересно именно насчёт либрусека. чтобы не тянуть то, что уже есть. бо долго хотя бы самые толстые файлы проверить пустые строки моему скрипту пофиг, сожрёт дуполовку посмотрю. Re: Учебные материалы на Либрусеке Постоянная ссылка (Permalink) Опубликовано пн, 18/02/2008 - 20:20 пользователем dzver Насчет либрусека думаю много не будут... Не так уж много у тебя научной литературы. Иначе несколько точно есть... Я залил Хофштадтера и Пенроуза с колхоза же. Но 20000 книг вручную не проверить? Насчет размеров.. Там вообще почти все файлы толстые, не шутка. Total size of collection: 80 гига... Re: Учебные материалы на Либрусеке Постоянная ссылка (Permalink) Опубликовано пн, 18/02/2008 - 20:23 пользователем larin 80 гиг текущими темпами (1K/s) будет качаться больше трёх лет... Если поднимется до 5, как у тебя - управимся за год. Как-то это неправильно, тебе не кажется? Re: Учебные материалы на Либрусеке Постоянная ссылка (Permalink) Опубликовано пн, 18/02/2008 - 20:32 пользователем dzver ;) Неправильно конечно. Они весь уикенд были в дауне, я сегодня 1 день только html-индексы качал чтобы пропарсить. С другой стороны я думаю они специально лимитят скорость... Для всех IP или только для зарубежных не знаю. Можешь попытаться связаться с ними чтобы предоставили тебе канал потолще... Или лучше выслать все по почте;) Re: Учебные материалы на Либрусеке Постоянная ссылка (Permalink) Опубликовано пн, 18/02/2008 - 20:58 пользователем dzver Чего то исчезли "Последние поступления".. /только первая страница, остальные нормально/. Re: Учебные материалы на Либрусеке Постоянная ссылка (Permalink) Опубликовано вт, 19/02/2008 - 11:55 пользователем dzver Хоть одна книжка за день скачалась с колхоза? В каком жанре у тебя они поступать будут, а то не видно.... Re: Учебные материалы на Либрусеке Постоянная ссылка (Permalink) Опубликовано вс, 17/02/2008 - 00:15 пользователем computers Да, работа там большая. Но в принципе, если брать за имя автора (или сериала ;) просто первое слово строки, то процентов на 90 это решит вопрос. А 10%, конечно, будет хлам. Однако, во-первых, это не будет хуже, чем на самом Ихтике, а намного лучше ;) - все же по авторам сортировка получится. Во-вторых же, потом понемногу разгребем мусор вместе. Только для этого нужно будет на Либрусеке разместить материалы с Ихтика в отдельных разделах как-то, не мешать авторов в общую кучу. Вот тогда и я охотно помогу - когда качать не надо, а можно на месте почистить мусор. На первых порах можно английские/латинские названия исключить вообще, ограничившись только русскими - там гораздо лучше упорядочено - автор почти всегда на первом месте. ЗЫ. Лучше я знаком с разделом "Электроника", и предложения мои - в основном основаны на нем. Но во всех разделах как будто похоже в смысле мусора. Насчет ряда разделов (например, "Восточные учения, эзотерика, теософия, оккультизм, каббалистика и т.п.") можно не торопиться ;). Пусть меня назовут скептиком (или еще как ;), но, ИМХО, эта чушь не нужна вообще, ни там, ни тут. Опасная чушь, более того. Далеко не каждый может позволить себе риск читать это. ИМХО, конечно. Re: Учебные материалы на Либрусеке Постоянная ссылка (Permalink) Опубликовано пн, 18/02/2008 - 21:30 пользователем isagalov По учебным материалам советую глянуть на http://dmbooksprog.narod.ru/ Установка очень простая а литературы огромное количество Re: Учебные материалы на Либрусеке Постоянная ссылка (Permalink) Опубликовано ср, 05/03/2008 - 04:07 пользователем jd (ихтик) Много ручной работы. 1) Описания файлов могут не соответствовать содержимому файла. 2) Файл внутри архива может быть испорчен, как правило, из-за неполного скачивания. 3) Внутри архива может оказаться не сама книжка, а только её оглавление. 4) Много архивов, содержащие отдельные статьи, похожих на "Тезисы доклада 'к вопросу о что-то-там-в-носу'". Re: Учебные материалы на Либрусеке Постоянная ссылка (Permalink) Опубликовано ср, 05/03/2008 - 02:17 пользователем jd Нельзя все книги, например, по математике, когда их будет действительно много, держать в одном "разделе" sci_math. Для того, чтобы найти что-то подходящее, придётся просмотреть весь раздел. Либо надо делать древовидную систему жанров, либо делать поиск, например, по ключевым словам, либо делать механизм для работы с УДК, либо ёще что-то. Во времена, когда не было компьютеров, если надо было найти книгу в обычной библиотеке, то в каталоге искалась карточка. Если книги нет или она "на руках", с карточки переписывался УДК (или его узнавали заранее), затем просматривались в каталоге все карточки книг с похожими УДК, и подбиралась книжка (и не одна!) нужной темы. Т.е. нужен некий механизм поиска, которые сократит список найденных книг "по теме" до разумного размера. Нынешних поисков -- по жанру, по автору и по названию не хватает.	Вход на сайт Имя пользователя * Пароль * Запомнить меня Регистрация Забыли пароль? Навигация Книги Издательские серии Премии Рекомендации Библиотечное ЧаВо Вычитка Про вычитку Технические темы Последние материалы Поиск по блогам и форумам Поиск книг Фильтр-список Популярные книги User menu Чёрно-белый список Книжная полка Последние комментарии edvud RE:Подайте бедному копеечку на книжку с литреса... 3 часа Tramell RE:Серия "Библиотека французской литературы" (Макбел) 3 часа Nicout RE:Прошу переформатировать, распознать, etc... 2 недели akorish RE:Регистрация 3 недели Tramell RE:Серия "Очень прикольная книга", издательство Азбука-классика 3 недели Larisa_F RE:Серия "Я познаю мир" издательства "АСТ, Астрель, Олимп",... 3 недели konst1 RE:Ух, как я не люблю спамеров! 4 недели tvv RE:DNS 1 месяц sem14 RE:«Не забыть бы тогда, не простить бы и не потерять!»-2 ... 1 месяц larin RE:Заблокирован 1 месяц konst1 RE:Серия «Интеллектуальный детектив» изд-ва АСТ 2 месяца Larisa_F RE:Серия книг «Судьбы книг» издательства «Книга» 2 месяца fixel RE:Пропал абонемент 2 месяца sem14 RE:Книжная серия "Жизнь в искусстве" издательство "Искусство"... 3 месяца sibkron RE:"100 славянских романов", серия изд.-ва "Центр книги... 3 месяца Larisa_F RE:Серия "Новые сказочные повести" издательство "Самовар" ... 4 месяца sem14 RE:Серия "Символы времени" издательства "Аграф" 4 месяца tvv RE:faq brainstorm =) 4 месяца Впечатления о книгах Анни-Мари про Нельсон: Нетрадиционная медицина (Фэнтези, Самиздат, сетевая литература) 27 05 Можно сколько угодно твердить, что главный герой мужчина, но поверить в это все равно не получается. Larisa_F про Ткаченко: Зимняя сказка и другие новогодние истории (Сказка) 27 05 http://lib.rus.ec/b/815953 - здесь все страницы virtcatty про Горъ: Ухорез - 3 (Боевая фантастика, Фэнтези, Самиздат, сетевая литература) 27 05 Для tvv: Перейди на Флибу прямо сейчас, там есть и без картинок. francuzik про Яманов: Питбуль и Митрофанушка [СИ] (Боевая фантастика, Фэнтези, Современная проза, Попаданцы, Самиздат, сетевая литература) 25 05 На удивление хорошая книга. Не ожидал даже. Оценка: хорошо Barbud про Смолин: Дело №1979 (Альтернативная история, Детективы: прочее, Самиздат, сетевая литература) 24 05 Начал читать, через несколько минут закралось нехорошее подозрение, что этот стиль мне знаком, и называется он "нейросетевое творчество". Что-то сразу выдает - то ли короткие рубленые предложения, то ли повторы идентичных ……… Dead_Space про Гэддис: Распознавания (Классическая проза, Историческая проза) 24 05 Огромное спасибо, давно ждал, только вчера проверял на флибусте наличие, а её оказывается тут выложили. Оценка: отлично! mysevra про Сабин: Викка для начинающих. Основы философии и практики [Wicca for Beginners: Fundamentals of Philosophy & Practice ru] (Религия, Эзотерика) 24 05 На мой дилетантский взгляд, просто замечательно: чётко, ясно, по существу и без нагнетания эзотерической зауми. Кто заинтересовался, тот будет искать дальше. Оценка: отлично! mysevra про Иванов: Вегетация (Киберпанк, Постапокалипсис) 24 05 Хорошо пишет, и идея отличная, почти злободневная. Но слишком тягостно-упадническое ощущение, безнадёжные персонажи (все эти бабёшки, работяги, озабоченные 20 летние пубертаты), беспросветная грязь и бытовой цинизм – знать ……… Оценка: неплохо mysevra про Огнев: Тихое [litres] (Ужасы) 24 05 Дивная история! Это даже больше относится к жанру НФ. Оригинально, динамично, увлекательно, присутствует редкий зверь «обоснуй». Я буду фанатом этого автора. Оценка: отлично! Lan2292 про Сухов: Реабилитант [СИ] (Боевая фантастика, Космическая фантастика, Попаданцы, Самиздат, сетевая литература) 23 05 Очень понравилось, всем рекомендую. Оценка: отлично! Sello про Филдинг: История приключений Джозефа Эндруса и его друга Абраама Адамса (Классическая проза) 21 05 Литература того времени: черное - это черное, белое - это белое, никаких оттенков. Если любовь - то возвышенная, если мошенник - так закоренелый негодяй. Обязательный, как календарь, счастливый конец для хороших людей. Для ……… Дей про Эльфийский бык 20 05 Вот вроде бы грамотно пишет автор, и занимательно, но из-за дичайшего изобилия троеточий кажется, будто все герои умственно неполноценные. Сколько ни берусь, не могу читать. больше впечатлений