Re: Цифровой Гербарий МГУ

Наталья Гамова пишет:

данные о размере такого формата, как в примере (6393×10262 px, 40.6 Mb), в системе просто не хранятся

Ну и зря. А следовало бы хранить (ведь показывать их надо, а добывать трудно; разумно делать это сразу после загрузки).

Наталья Гамова пишет:

600dpi и 300dpi даны как стандартные обозначения детальности сканирования объектов.

Это здорово, но ещё раз - для просмотра через браузер важны не настройки сканирования, а размеры изображения. Потому что именно "вес" влияет на скорость скачивания файла с картинкой, а её физические размеры позволят оценить потенциальную детальность изображения. Впрочем, настройки сканирования тоже можно показать, раз уж они есть.

Наталья Гамова пишет:

Но не название там, вроде, ещё и потому

Когда у человека в браузере открыто много вкладок, очень желательно, чтобы их можно было легко отличать друг от друга. Несколько вкладок с названием "scan.jpg" различить по заголовку невозможно. Различить между собой вкладки с номерами "132465857", "132462857" и "132465851" - крайне сложно.

Поставьте простой мысленный эксперимент: вы - учёный, и вы хотите найти пять отличий в 10 образцах, сканы которых открыли на 10 вкладках. А ещё на 5 вкладках у вас открыты протологи. Вам сейчас легко будет?

Re: Цифровой Гербарий МГУ

Новая функция: библиографические ссылки

На портале Цифрового гербария МГУ внедрена новая функция. В паспорте каждого образца в закладке "Библиография" помимо автоматических ссылок на ИСТИНУ, Плантариум, The Euro+Med PlantBase и The Plant List теперь отражаются и библиографические ссылки на публикации.

По нашей идеологии сюда попадают только статьи и книги, в которых был процитирован именно этот гербарный образец. Кроме того, мы будем делать все от нас зависящее, чтобы эти публикации обязательно были доступны в интернете. Справа от каждой записи есть ссылка на полный текст.

В качестве примера на скриншотах показан паспорт образца №1181, который процитирован А.П. Серёгиным в двух изданиях флоры НП "Мещёра" и во "Флоре Владимирской области". Вот как это выглядит на нашем портале.

Вчера вечером в качестве тестового массива мы загрузили 1355 ссылок на владимирские образцы из четырех источников. Дальнейшее пополнение этого блока для прочих образцов коллекции будет осуществляться отдельными исследовательскими группами при целевой работе над региональными флорами или монографическими обзорами.

https://pp.userapi.com/c639126/v639126908/52b00/ByfPFJzu5ek.jpg

https://pp.userapi.com/c639126/v639126908/52b0a/E8gmdqT8WZU.jpg

Re: Цифровой Гербарий МГУ

Гербарий Латвии: маленький образцовый отдел

В Гербарии МГУ хранится 2626 образцов из Латвии. Это один из самых маленьких районов нашей коллекции по числу образцов. Но почти все они (84%) теперь внесены в полнотекстовую базу этикеток. Благодаря усилиям Ирины Мельник Цифровой гербарий МГУ ( https://plant.depo.msu.ru/ ) теперь является точкой доступа к самому большому массиву информации о растениях Латвии на русском языке.

Большинство растений собрано Натальей Константиновной Шведчиковой, старейшим сотрудником Гербария МГУ. Она всегда питала нежные чувства к природе Прибалтики и принимала участие в традиционных конференциях-экспедициях ботаников Прибалтики (Литва, 1982; Эстония, 1984; Латвия, 1973, 1981, 1986), а также в течение ряда лет (с 1978 по 1993 гг.) в экспедициях кафедры ботаники Латвийского университета и Института биологии АН Латвийской ССР. В результате в нашем Гербарии представлена практически вся флора Латвии.

Re: Цифровой Гербарий МГУ

Новые материалы благодаря лучшей индексации

18.10 мы загрузили на портал Цифрового гербария МГУ ( https://plant.depo.msu.ru/ ) исправленные метаданные для неопределенных образцов Восточной Европы. Дело в том, что в Гербарии МГУ образцы растений, у которых неизвестна видовая принадлежность, хранятся в общих папках без географической индексации (Esp). Именно так они и были отсканированы.

За несколько дней мы целиком "разложили" наш неопределенный цифровой гербарий по районам. Вот какую прибавку это дало для отдельных регионов.

Нижняя Волга: +302 листа
Москва и Московская область: +295 листов
Средний и Южный Урал: +287 листов
Европейский Север: +260 листов
Черноземье: +246 листов
Южная Украина: +224 листа

Теперь весь гербарий из Восточной Европы без остатка доступен по ключевым географическим фильтрам. Это "Район гербария" и "Страна".

Re: Цифровой Гербарий МГУ

Три отметки в поле "Геопривязка"

На портале Цифрового гербария МГУ ( https://plant.depo.msu.ru/ ) появилась новая функция - специальное обозначение для образцов, которые в принципе не могут получить геопривязку.

Итак, в результатах табличной выдачи голубой глобус стоит у образцов, у которых имеется ручная привязка, сделанная оператором или скопированная из этикетки. Это индикатор надежности.

Серый глобус - результат работы алгоритма ИСТРА, который использует для привязки координаты образцов, собранных автором в этот же день, если хотя бы один из них привязан.

И, наконец, знак запрета стоит у образцов, у которых геопривязка в принципе не может быть установлена. Это, как правило, старые образцы без указания конкретного пункта сбора, а лишь с общими привязками. Например, "Кавказ", "Крым" или "ex Sibiria". Раньше такие образцы не получали какого-либо обозначения и были неотличимы от образцов, которые еще не привязаны к карте.

https://pp.userapi.com/c840629/v840629278/1b48d/MgzZuGFAA5U.jpg

Re: Цифровой Гербарий МГУ

Доступ к новым материалам Сибири и Дальнего Востока

Сегодня мы загрузили на портал Цифрового гербария МГУ ( https://plant.depo.msu.ru/ ) исправленные метаданные для неопределенных образцов Сибири и Дальнего Востока. Дело в том, что в Гербарии МГУ образцы растений, у которых неизвестна видовая принадлежность, хранятся в общих папках без географической индексации (Ssp). Именно так они и были отсканированы.

За пару прошедших недель мы целиком "разложили" наш неопределенный цифровой гербарий по районам. Вот какую прибавку это дало для отдельных регионов.

Прибайкалье и Забайкалье: +1330 листов
Алтай и Зап. Саян: +669 листов
Западная Сибирь: +530 листов
Чукотка и Камчатка: +415 листов
Юг Дальнего Востока: +335 листов
Якутия: +292 листа
Красноярский край (без горного юга): +234 листа

Отдельные листы переехали в Среднюю Азию и Китай.

Теперь весь гербарий из Азиатской России без остатка доступен по ключевым географическим фильтрам. Это "Район гербария" и "Страна".
https://pp.userapi.com/c824502/v824502455/6e26/GrDW58lggI0.jpg

Re: Цифровой Гербарий МГУ

Солидная прибавка! Трудитесь без перерывов и выходных?!!

Re: Цифровой Гербарий МГУ

Тут результат работы команды.
Физически гербарий работает 6 дней в неделю, а программисты - у тех свой график, по мере готовности к заливке очередной "порции" данных - как им удобнее)

Re: Цифровой Гербарий МГУ

МОЛОДЦЫ ВЫ Все, спасибо большое, очень помогает в определении незнакомых растений!!!

Re: Цифровой Гербарий МГУ

Про обработку от вредителей тут

Re: Цифровой Гербарий МГУ

Октябрь 2017 г. в Гербарии МГУ

1) Число образцов в Гербарии МГУ за месяц выросло на 3 400 штук. Скорее всего, показатель в 1 030 669 образцов (сосудистые и мхи) станет нашей отчетной годовой цифрой. Рост за 2017 год составил 19 416 образцов.

2) Почти все отделы гербария отштрихкодированы, кроме Австралии - Океании, ботанических садов и исторических коллекций. Именно в момент приклеивания штрихкода перед сканированием и происходит точный учет поступлений в Гербарий МГУ.

3) По результатам третьего этапа сканирования (оцифровки) фондов число изображений в Цифровом гербарии МГУ превысило 911 тыс. сканов. Пока размещено в интернете 786 тыс. штук, остальное будет доступно в течение января 2018 г.

4) В Цифровом гербарии МГУ видовая принадлежность установлена у 769,8 тыс. образцов, страна происхождения материала проиндексирована у 771,5 тыс. образцов, при этом 7 тыс. образцов были привязаны к стране за последний месяц (типы и неопределенный гербарий).

5) База данных этикеток содержит 67,5 тыс. записей - рост за месяц в 2,5 раза. Огромное спасибо волонтерам и помощникам!

6) База геопривязок почти 29 тыс. точек - рост за месяц в 4 раза. Большую помощь в этой работе оказал алгоритм автоматической геопривязки ИСТРА, а также неутомимые волонтёры. Огромное спасибо нашему программисту Олегу Платко!

https://pp.userapi.com/c834300/v834300437/98d0/XdbBrraIDtA.jpg

Re: Цифровой Гербарий МГУ

Цифровой гербарий МГУ: четыре точки входа

Немногие знают о том, что на самом деле Цифровой гербарий МГУ доступен по четырем разным адресам. Каждая из точек доступа имеет свой арсенал средств поиска и представления информации. Именно многообразие возможностей работы с нашими образцами является приоритетом в развитии нашей цифровой коллекции.

1) https://plant.depo.msu.ru/

Операционная версия, или "боевая база". Наш основной портал, в котором пользователи имеют возможность искать образцы с помощью расширенного поиска, поиска по этикеткам, таксономического дерева. Скоро внедрим и геопоиск. Здесь через личный кабинет есть возможность что-то исправлять, дополнять и редактировать (А.П. как куратору). Сюда программисты заливают большие табличные массивы новых данных (например, этикетки, геопривязки, новые сканы, русские названия и прочее).

2) https://plant.depo.msu.ru/open/

Открытая версия. Она нужна для индексации поисковыми системами и быстрого простого поиска по массиву. Выдача идет в виде иконок, можно сохранять адреса запросов. Создан также для снижения нагрузки на боевую базу при интернет-запросах. Вообще, штука удобная и многие, разобравшись, ищут сканы именно через нее. Это элементарно быстрее.

3) https://www.gbif.org/dataset/902c8fe7-8 … 24fed36303

Адрес нашего Цифрового гербария в GBIF – агрегаторе данных по биоразнообразию мира. Раз в неделю, начиная со 2 ноября 2017 г., мы заливаем в GBIF наш датасет целиком. Поскольку это большая навороченная система для оперирования гетерогенными пространственными и таксономическими данными о биоразнообразии мира, то здесь создан целый арсенал фильтров и картографических визуализаций для того, чтобы что-то у нас найти. Но главная задача нашей публикации через GBIF в другом: теперь, даже если мы храним всего два образца какого-нибудь африканского растения, исследователь неминуемо будет их видеть и учитывать в своих исследованиях. Что уж говорить о Северной Евразии – территории, с которой мы являемся крупнейшим поставщиком данных. Осталось лишь все образцы аккуратно привязать к карте. А так статистика налицо: из 874 млн. записей в GBIF – 809 тыс. наши smile

4) https://yandex.ru/images/

Яндекс.Картинки. Неожиданная, но очень важная точка доступа. Почему? Все дело в технологиях распознавания текста на картинках (OCR). Яндекс, проиндексировав 786 тыс. сканов Гербарий МГУ, прогнал наш массив через процедуру OCR. Все печатные символы, слова и предложения, которые программа распознала на этикетках, теперь используются для индексации изображений. Так стало возможным искать сканы образцов, текст которых еще не внесен в базу этикеток. Это огромный шаг вперед в деле бесконечного структурирования миллионного (без малого) массива Цифрового гербария МГУ. Скорее всего, вслед за Яндексом, мы также в будущем применим элементы OCR для первичной сортировки массива по коллекторам и географии.

Итак, четыре точки доступа, не считая обыкновенного текстового поиска в поисковиках, где мы целиком индексируемся. Не будем загадывать, но, скорее всего, Google.Images станет пятой

Re: Цифровой Гербарий МГУ

Здорово! Яндекс уже выдавал ваш гербарий несколько раз на запрашиваемые фото растения.

Re: Цифровой Гербарий МГУ

Вообще говоря, яндекс стал сюрпризом.
открыть их поиск по картинкам и набрать что-то совсем запростецкое, типа "гербарий мгу збс".
збс, ёлки-палки! Не Звенигородская биологическая станция, а вот так, на студенческий манер, - и выдаёт кучу этикеток!
Или по коллекторам, даже где рукописные этикетки, главное чтоб аккуратным почерком.
Наберите гербарий мгу Шведчикова  - и вот все этикетки Натальи Константиновны (она в гербарии работает с момента переезда его в здания на Воробьёвых горах) - сказка просто)
smile

Re: Цифровой Гербарий МГУ

А мне по запросу "гербарий мгу Гамова" выдал, среди всего прочего, вот такую картинку - https://scientificrussia.ru/data/auto/m … 36-001.jpg

Re: Цифровой Гербарий МГУ

Это не я. Это Алексей Петрович.
Его выдают по всем запросам "гербарий МГУ"  big_smile

Re: Цифровой Гербарий МГУ

Да, я его сразу узнал smile

Re: Цифровой Гербарий МГУ

Несколько новостей за ноябрь

10.11
Гербарий МГУ в зеркале GBIF

По данным годового отчета Index Herbariorum ( http://sweetgum.nybg.org/science/docs/T … 202017.pdf ) в фондах мировых гербариев насчитывается 381,308,064 образцов. Многие гербарии в той или иной мере ведут оцифровку своих фондов.

Недавно Цифровой гербарий МГУ предоставил свои данные для GBIF - единой глобальной базы биоразнообразия. В нее включены сведения о 57,626,485 образцах растений. Иными словами, уже 15% мирового гербарного фонда оцифровано и доступно на единой платформе. Неплохо, правда?

На текущий момент, Гербарий Московского университета является ведущим поставщиком данных не только по растениям России, но и некоторых других государств. Каких? Ответы даны вот на этих 10 скриншотах.

https://pp.userapi.com/c824502/v824502426/1dc69/e9ol7n37xr4.jpg

https://pp.userapi.com/c824502/v824502426/1dc73/YrgptejPWSQ.jpg

https://pp.userapi.com/c824502/v824502426/1dc81/sROfyPQoaNw.jpg

https://pp.userapi.com/c824502/v824502426/1dc8b/uIRIAaPrdy8.jpg

https://pp.userapi.com/c824502/v824502426/1dc95/2icef9EtmpM.jpg

https://pp.userapi.com/c824502/v824502426/1dc9f/2bH4mAKS4P4.jpg

https://pp.userapi.com/c824502/v824502426/1dcbb/u8SBA748VSU.jpg

https://pp.userapi.com/c824502/v824502426/1dcc5/2ppTPTk2P6Q.jpg

https://pp.userapi.com/c824502/v824502426/1dccf/CNheaZF4KZU.jpg

https://pp.userapi.com/c824502/v824502426/1dcec/mSpUgxyQlkQ.jpg

Re: Цифровой Гербарий МГУ

10.11.
Как GBIF помогает нам проверять качество данных?

Один из многочисленных примеров на скриншоте.

Во время практики на Утрише студенты-второкурсники всё перепутали и координаты ГГ ММ,МММ записали как ГГ,ГГГГГ. В итоге, точки сбора полутора десятков образцов уехали далеко в Черное море. По тексту этикеток места сбора были проверены, а координаты исправлены

https://pp.userapi.com/c639616/v639616256/60494/mtjK-bDqUqI.jpg

Re: Цифровой Гербарий МГУ

12.11

Гроссет

Гуго Эдгардович Гроссет 18 лет провел в ГУЛАГе в Магадане, где тайком собрал значительный гербарий, перевезенный затем в Москву. Образцы смонтированы на разрезанных вручную листах дешевых обоев и надежно этикетированы автором.

Спустя годы во введении к монографии о кедровом стланике он благодарит начальника Сантехконторы В.Ю. Радкевича за разрешение пользоваться во внеурочное время помещением «и оборудованием теплотехнической лаборатории» для своей работы. Именно в этой котельной Гроссет, скорее всего, сушил и хранил свой гербарий.

Гербарий Гроссета - великолепный памятник истинно научному мышлению, не сломленному тяжелейшими обстоятельствами.

https://plant.depo.msu.ru/public/scan.jpg?pcode=MW0079784

https://pp.userapi.com/c840531/v840531794/228bc/5_btVZjzH4I.jpg

Re: Цифровой Гербарий МГУ

18.11

Средний возраст нашего гербарного образца - 64 года

Гербарный фонд мира постепенно стареет. Д.Е. Виктор с соавторами (2016) показала, что, например, в богатейшей флоре ЮАР пик сбора гербарного материала пришелся на 1975-1980 гг. (см. диаграмму).
https://pp.userapi.com/c837130/v837130266/6c9a5/yY6pLp6Kifo.jpg

В дальнейшем интенсивность сборов снизилась вдвое. Похожие графики приводятя и для Лейденскго гербария - одного из крупнейших в мире.

Благодаря усилиям наших волонтеров и специальной случайной выборке мы подсчитали, что средний год сбора для датированных гербарных образцов в нашей коллекции - 1953 г. Это был год переезда Гербария МГУ в новое здание биофака на Ленинских горах. Т.е. ровно половина коллекций Гербария МГУ была собрана до этого момента, а вторая половина - после. Фонды выросли вдвое, а ёмкость хранилища осталась прежней - 360 квадратных метров.

Для того, чтобы средний возраст гербарных образцов хотя бы держался на уровне 64 года, нам необходимо ежегодно вкладывать в основные фонды не менее 8 тыс. образцов, собранных в течение последнего полевого сезона. Такая вот нехитрая математика.

Re: Цифровой Гербарий МГУ

20.11

Число геопривязок в Цифровом гербарии МГУ превысило 30 000

На портал Депозитария загружена очередная порция геопривязок растений Ростовской области. Благодаря усилиям Анатолия Кузьмина, общее число геопривязок, таким образом, перевалило рубеж в 30 тыс. штук

Re: Цифровой Гербарий МГУ

22.11

Цифровой гербарий МГУ: текущая статистика

Число этикеток в текстовой базе данных (10 ведущих районов)

https://pp.userapi.com/c824603/v824603833/2fde7/hjpBzIt_HJE.jpg

Re: Цифровой Гербарий МГУ

22.11

Цифровой гербарий МГУ: текущая статистика

Число геопривязок в ГИС-модуле (10 ведущих районов)

https://pp.userapi.com/c840321/v840321833/27743/mvmLAXANRhg.jpg

Re: Цифровой Гербарий МГУ

24.11

Облако точек Цифрового гербария МГУ, имеющих геопривязки (32 016 образцов), на 24.11.2017

Источник: GBIF

https://pp.userapi.com/c840434/v840434298/26f8e/v_21istK8-M.jpg