Тема: Цифровой Гербарий МГУ

По просьбе Алексея Петровича Серёгина

Друзья, заработал портал Гербария МГУ.

Сканы 155 900 образцов растений Сибири и Дальнего Востока в формате jpg c разрешением 300 dpi теперь может увидеть любой пользователь. Самая большая оцифрованная естественно-научная коллекция России заработала.

http://bio.labinform.ru/search/?FormNam … D%0A%0D%0A

Самый важный классификатор - "РАЙОН_ГЕРБАРИЯ", в который зашита структура районов гербария МГУ.

Коллекции из Восточной Европы (346 тыс. образцов) станут доступными как только портал переедет на сервере Центра обработки данных (ЦОД) МГУ. Пока для такого объема картинок банально не хватает железа.

Команда направления "Биологическая информация" гранта РНФ по депозитарию продолжит отладку рабочей версии системы хранения, обработки и выдачи информации по всем биоколлекциям университета, в т.ч. по гербарию. Эта версия пока имеет некоторое количество недостатков, которые постепенно будут устраняться.

Пожалуйста, максимально широко распространите эту информацию среди заинтересованных лиц.

Алексей Серёгин

ВАЖНО!
Пожалуйста, пишите именно здесь все пожелания-уточнения, сообщайте о неточностях - их исправляют.

Если нужно, Алексей Петрович будет отвечать тут на отдельные вопросы (или я скажу).

Re: Цифровой Гербарий МГУ

Да, я на связи. Пишите обо всех багах сюда, а я буду стучать разработчикам или что-то исправлять сам.

Re: Цифровой Гербарий МГУ

Поглядел, но, честно говоря, далеко не сразу понял, как пользоваться поиском. Совершенно серьёзно sad

То, что поле поиска надо вместо

/ТИП_ОБРАЗЦА="БИОМАТЕРИАЛ - ГЕРБАРНЫЙ ОБРАЗЕЦ"

надо написать, к примеру,

/Poa annua="БИОМАТЕРИАЛ - ГЕРБАРНЫЙ ОБРАЗЕЦ"

далеко не очевидно.

По-моему, такой низкоуровневый интерфейс вряд ли хорош для простых пользователей. Вот бы просто поле ввода для названия таксона, а "БИОМАТЕРИАЛ - ГЕРБАРНЫЙ ОБРАЗЕЦ" и альтернативные типы единиц хранения (если я правильно понял смысл этого текста) вынести в какой-то список снизу.

Re: Цифровой Гербарий МГУ

По поводу названия окошек поиска согласна с Дмитрием.
Поиск работает, если в окно ввести просто название вида, но эта фраза про "БИОМАТЕРИАЛ - ГЕРБАРНЫЙ ОБРАЗЕЦ" как-то немного в ступор вводит. Возникает вопрос: а что ещё можно посмотреть?

Re: Цифровой Гербарий МГУ

"ТИП_ОБРАЗЦА" тоже вводит в ступор. Вообще сначала думал, что "/ТИП_ОБРАЗЦА="БИОМАТЕРИАЛ - ГЕРБАРНЫЙ ОБРАЗЕЦ"" - это один из параметров запроса (типа как в URL канонической формы).

Re: Цифровой Гербарий МГУ

Ещё один вопрос: листы из Европейской части будет когда-нибудь в доступе?
Понимаю, что дело долгое и трудоёмкое, но тоже хотелось бы.

Re: Цифровой Гербарий МГУ

Наталья Гамова пишет:

Коллекции из Восточной Европы (346 тыс. образцов) станут доступными как только портал переедет на сервере Центра обработки данных (ЦОД) МГУ. Пока для такого объема картинок банально не хватает железа.

Re: Цифровой Гербарий МГУ

Лена Глазунова пишет:

По поводу названия окошек поиска согласна с Дмитрием.
Поиск работает, если в окно ввести просто название вида, но эта фраза про "БИОМАТЕРИАЛ - ГЕРБАРНЫЙ ОБРАЗЕЦ" как-то немного в ступор вводит. Возникает вопрос: а что ещё можно посмотреть?

Лена, еще залито около 6 тыс. зоологических образцов, поскольку система разрабатывается для всего депозитария целиком. Я сократил поиск до "БИОМАТЕРИАЛ - ГЕРБАРНЫЙ ОБРАЗЕЦ", чтобы ботаникам был доступен только гербарный  массив.

Re: Цифровой Гербарий МГУ

Интерфейс поиска крайне недружелюбный, согласен. Меня не спрашивали, когда его делали smile Будут менять на окошки полей, но не уверен скоро ли. Между мной и интерфейсом цепочка аж из трех человек.

Re: Цифровой Гербарий МГУ

Окошко "Геоинформация" перекрывает "Таксономию". Не принципиально, но немного раздражает  smile

Спасибо за вашу работу!

Re: Цифровой Гербарий МГУ

Pulsatilla flavescens Идентификатор: MW0073960 - вот этот экземпляр, похоже, выудили прямиком из озера Байкал; нет, не из самой середины smile   карта изначально загружается с масштабом 500 метров;  - на мой взгляд, будет нагляднее, удобнее,  если карта станет загружаться с масштабом 50 км;

Re: Цифровой Гербарий МГУ

MW0073960 - это герб. сбор вот этого растения - .
Почему из озера?

Re: Цифровой Гербарий МГУ

Анна Бойко пишет:

Окошко "Геоинформация" перекрывает "Таксономию". Не принципиально, но немного раздражает  smile

Не очень понял. Дайте скриншот, пожалуйста

Re: Цифровой Гербарий МГУ

Юрий Постников пишет:

Pulsatilla flavescens Идентификатор: MW0073960 - вот этот экземпляр, похоже, выудили прямиком из озера Байкал; нет, не из самой середины smile   карта изначально загружается с масштабом 500 метров;  - на мой взгляд, будет нагляднее, удобнее,  если карта станет загружаться с масштабом 50 км;

Юрий, это временное явление. Пока тупо дан центроид района гербария, который у "Прибайкалья и Забайкалья" попал в Байкал. Бывает. Скоро будет в виде подсветки района. Геопривязка всех образцов для нас пока из-за трудозатратности недоступна.

Отредактировано Алексей Серегин (2016-04-07 21:27:30)

Re: Цифровой Гербарий МГУ

Кое-какие новости от общения с нашими программистами (дай бог мне здоровья):

[На просьбу по исправлению массовых ошибок]
Ответ: Вообще говоря, сейчас предусмотрено два варианта загрузки данных. Первый - это поточная загрузка, что и было проделано для Гербария. Если есть возможность скорректировать файлы, которые поставлялись, можно сделать повторную загрузку. Второй вариант - исправления через интерфейс админзоны. Если ни один из вариантов Вас не устроит - надо обсуждать работы по созданию ПО для массовой корректировки некорректных данных.

[Мой вопрос: У обычного вида Rubus arcticus нет авторов. Я стал разбираться, как так вышло. Оказалось, что в Catalogue of Life (http://www.catalogueoflife.org/col/deta … 4b242a083a) у видов, имеющих принятые внутривидовые таксоны (в данном случае – три подвида и одна разновидность), авторы не указаны. Мне нужен список таксонов (Excel), которые найдены как принятые названия в Catalogue of Life, сели на таксономическое дерево, но авторы у них отсутствуют, чтобы я их выудил из нашей гербарной БД.]
Ответ: По моему скромному мнению, а также по Техническому Заданию и Системному Соглашению, были предоставлены совершенно неполные данные. Мы их загрузили так, как удалось, и, по моему мнению, не должны готовить подобного рода отчеты.

Думаю, дал примерное представление, как у нас поставлен, к несчастью, этот процесс. Так что ошибки будут исправляться медленно.
Пока за двое суток нам поправили только обрезанные превьюшки образцов и добавили надпись [Ctrl + Enter] под кнопкой поиска. А написал я им о 24 разных ошибках.

Привет Плантариуму

Re: Цифровой Гербарий МГУ

Алексей Серегин пишет:
Анна Бойко пишет:

Окошко "Геоинформация" перекрывает "Таксономию". Не принципиально, но немного раздражает  smile

Не очень понял. Дайте скриншот, пожалуйста

http://forum.plantarium.ru/misc.php?action=pun_attachment&item=9044&download=0

Аттачменты сообщения

Иконка аттачмента 1.jpg 88.31 kb, 119 раз(а) скачан с 2016-04-18 

Re: Цифровой Гербарий МГУ

Анна, спасибо! Такой же баг я увидел вчера на смартфоне. Сообщил разработчикам.

На всех страницах нашего портала появилась стандартная ссылка с просьбой сообщать обо всех найденных ошибках напрямую. Пожалуйста, пишите, чтобы мы исправляли все неточности.

Re: Цифровой Гербарий МГУ

У меня тоже. Насколько я понимаю, это от браузера зависит. У меня Opera 36.0.
http://forum.plantarium.ru/misc.php?action=pun_attachment&item=9078&download=0
В Гугл-Хроме 49.0.2623.112 m выглядит так же, а в IE 8 нормально:
http://forum.plantarium.ru/misc.php?action=pun_attachment&item=9079&download=0
Хотя как знать, что в данном случае ожидалось быть в норме smile

Аттачменты сообщения

Иконка аттачмента глюк.jpg 195.43 kb, 77 раз(а) скачан с 2016-04-21 

Иконка аттачмента норма.jpg 201.94 kb, 116 раз(а) скачан с 2016-04-21 

Re: Цифровой Гербарий МГУ

Новый портал гербария МГУ доступен по адресу https://plant.mitotech.ru/.

Содержит 501,892 скана образцов из отделов Восточной Европы и Сибири-Дальнего Востока. Поиск по районам гербария пока недоработан. Сортировка на больших выборках виснет. Будем считать, что это альфа-версия.

Спасибо команде "Проекта Скулачева" за титаническую работу с нуля.

Финансирование идет по гранту РНФ 14-50-00029 (Ноев Ковчег)

Жду фидбэка.

Re: Цифровой Гербарий МГУ

А членистоногие в "Ноевом ковчеге" будут?

Re: Цифровой Гербарий МГУ

Спасибо большое за информацию. Попробовал - впечатления намного приятнее, чем от предыдущей версии. Понравилась возможность скачивания "Паспорта образца" в виде pdf файла. Вот некоторые замечания и пожелания:
1. Поначалу не совсем понятно, что обозначают сокращения  E1 - E13 и S1 - S7 в графе место сбора. Нельзя ли где-то расписать всю схему районирования, т.к. она не совсем очевидна. Я так понял, что весь Дальний Восток относится к Сибири - это так и было задумано?
2. Было бы полезно отфильтровывать типовые и автентичные образцы в результатах поиска - насколько я понял, пока-что такой возможности нет.
3. Есть ли возможность искать одновременно по названию и по месту сбора?
4. Планируется ли оцифровка данных этикеток?

Re: Цифровой Гербарий МГУ

/пока кратко; Алексей Петрович дополнит/
1. Да, расшифруют. Вообще E - Европейская часть (в пред. быв. СССР), S - Сибирь и ДВ (да, они в одной коллекции). Номера - соответственно, районы внутри этих больших регионов (по АТД)
2. там пока типов и нет (сейчас сканируются только) - вероятно, будут отдельным параметром.
Старинные коллекции в этом году ещё не сканируют вовсе...
3. under construction
4. не в самое ближайшее время, но в общем да.

Re: Цифровой Гербарий МГУ

Попытался понять, как можно скопировать и передать ссылку на образец другому человеку. Выяснил, что URL у образца по сути нет - по крайней мере для показа "Фото дня" и "Организм недели" используется POST, а не GET запрос sad Это недружелюбно.

Ну ладно, смотрю на страницу. Внизу - "Ссылка на эту карту. Получить". Не знаю, что в терминологии этого ресурса "карта", но вдруг это искомый URL образца? Жму, получаю панельку с URL вида

https://plant.mitotech.ru/dw-config/itempublic/itemstat?openparams=[c-id=1524305,open-id=8501483]

Однако при попытке перейти на этот адрес имею

HTTP Status 500 - Request processing failed; nested exception is java.lang.NullPointerException

sad

В общем, желательно иметь возможность получать URL страниц для просмотра конкретных образцов.

Re: Цифровой Гербарий МГУ

Ещё вопрос по карте в разделе "Место сбора" - во всех просмотренных образцах на ней нет никаких отметок, а центр карты расположен в Москве. Это ещё будет исправлено?

Re: Цифровой Гербарий МГУ

Место сбора пока просто не отображается..