Re: Цифровой Гербарий МГУ

..я ради интереса проверила свои этикетки за 9 лет - 67 максимум, пару дней чуть более 60, ещё с пяток - более 50. Остальное куда меньше  roll
Это в одиночку.
на двоих можно, но тоже если только разово, а не 1 из многих подряд дней...

Re: Цифровой Гербарий МГУ

А можно сделать так, чтобы при просмотре галереи отображалось название в коллекции, а не таксономия по Catalogue of Life?

Re: Цифровой Гербарий МГУ

..в какой версии - краткой - https://plant.depo.msu.ru/open/public
или полной - https://plant.depo.msu.ru/
?

Re: Цифровой Гербарий МГУ

В полной. Я выбрал к примеру Orchidaceae Кавказ, потом включил галерею. В левом нижнем углу отображается название по Catalogue of Life, и, например, для Ophrys apifera и O. oestrifera оно одинаково (O. apifera, что есть ошибка Catalogue of Life и прочих модных баз данных). Таким образом, проверять определение по этим названиям не всегда возможно.

Re: Цифровой Гербарий МГУ

Ага.
Поняла вопрос, - уточню.
Но основным источником таксономии считается внешний; наша система хранения как бы "вторична" - указана, но не идёт основной

Re: Цифровой Гербарий МГУ

И еще, можно ли как-то переходить из просмотра галереи к описанию образца, чтобы сообщить об ошибке, или единственный способ - выписывать нужный номер и потом находить его в списке?

Re: Цифровой Гербарий МГУ

В полной версии - там основное-  таблица.

Наверное, проще переходить как раз в open-версии https://plant.depo.msu.ru/open/public
Там ведь в строке поиска можно вписать всё что угодно в одну строчку, например вот результат по запросу Orchidaceae Кавказ : https://plant.depo.msu.ru/open/public/s … 0%B0%D0%B7 - выдаётся как раз галереей

Там можно нажать на любой образец - откроется отдельно на странице, и справа будет ссылка "полная карточка" - там и ссылка для сообщения есть..
(как временный хотя бы вариант, мне самой так удобнее оказалось...).

Про полную версию сейчас подумаю, что лучше сделать ещё там...

Re: Цифровой Гербарий МГУ

Ага, понял, спасибо. Но тут картинки мельче - на тех было в половине случаев сразу видно, правильно определено или нет, а здесь нет такого эффекта. smile
Ладно, что-нибудь придумаю. Тут еще вопрос таксономии... Бывает что названий в коллекции - три разных таксона, а в каталог оф лайф - один, но я бы выделял два. Как быть в таких случаях? В общем, я наверное все просмотрю, а потом здесь выложу свои предложения, и тогда подумаем.

Re: Цифровой Гербарий МГУ

Ага! Алексей Петрович написал программистам про название в коллекции и ещё чтоб добавили ссылку на полный паспорт образца в том белом прямоугольничке, который виден при просмотре галереи выдачи в полной версии. И страну (из географии)
Наверное, подождать нужно будет сколько-то, - до рабочих дней.
roll

Про Catalogue of Life - ну, он как есть уж..
не знаю, в какой мере там что-то меняется (отдельные прецеденты были по отсутствовавшим там ранее названиям - их вносили, но чтоб именно менять. нужно к ним обращаться. у нас "автоматическая" стыковка, насколько я понимаю, в 99,9% случаев).

Re: Цифровой Гербарий МГУ

Наташа, большое спасибо!

Про Catalogue of Life я все понимаю. С растениями там еще куда ни шло... А вот с моими осами там вообще жуть, например, есть род Odynerus, в нем 45 видов, а там 306 - включены виды, давно перенесенные в другие рода (при том, что в других родах они так же отображаются). Это только один пример.
Вопрос в другом. Например, есть Ophrys mammosa subsp. mammosa = O. taurica = O. cyclocheila. И есть O. mammosa subsp. caucasica. Мы с Петром Ефимовым подали статью в Турчаниновию, где будет такая трактовка. А в Catalogue of Life это все O. sphegodes subsp. mammosa. Если я нахожу например O. mammosa subsp. caucasica подписанные (название в коллекции) как O. taurica, мне делать сообщение об ошибке?

Отредактировано Александр Фатерыга (2018-05-01 00:35:42)

Re: Цифровой Гербарий МГУ

О, по таким "тонкостям" и в случаях, когда нужно целиком переименовать всё, что хранится под/называется отдельным каким-то названием - это имеет смысл как раз написать А.П. - согласовать, предупредить и т.п.
Просто определение - это одно, а целиком переименование - немного другое действие - поэтому можно сообщить.

Re: Цифровой Гербарий МГУ

Хорошо, так и сделаю (чуть позже). Спасибо!

Re: Цифровой Гербарий МГУ

05.05.
Новые массивы за неделю

На портале Цифрового гербария МГУ ( https://plant.depo.msu.ru/ ) новые большие заливки разнообразных данных.

1) 3 232 образца с парой коллектор-дата из Центральной Сибири (в т.ч. 3 182 образца с ручными геопривязками). Все геопривязки сделаны неутомимым исследователем флоры Таймыра и Красноярского края И.Н. Поспеловым. Игорь Николаевич сделал геопривязку уже 12 275 образцов этого района (61,8%).

2) Координаты с 1 904 этикеток Монголии. И.А. Губанов, бывавший в Монголии почти ежегодно в 1970-80-х гг. в последние годы своих экспедиций старался указывать на образцах приблизительные координаты мест сбора. С точностью до минуты он писал координаты пункта дислокации (днёвки), от которого совершились недалекие маршруты. С помощью OCR такие образцы были найдены, а координаты внесены в базу.

3) 15 395 OCR-расшифровок этикеток сосудистых растений Африки и Зарубежной Азии. Долгожданный массив. Теперь мы сможем без проблем найти все образцы основных коллекторов (В.Н. Павлов, Д.А. Петелин, М.С. Нуралиев, Н.Г. Прилепский, М.В. Гордеева, А.Н. Демидова) и привязать существующие большие датасеты к конкретным образцам.

Статистика Цифрового гербария МГУ на 4 мая 2018 г.:

Образцов: 914 336
Изображений: 911 543
Видов: 35 629
Геопривязок: 112 580
Этикеток: 101 415
OCR: 85 747 (без учёта образцов с полными этикетками)

Re: Цифровой Гербарий МГУ

08.05.
Модуль статистических отчетов

Мы начали разработку модуля статистических отчетов Цифрового гербария МГУ ( https://plant.depo.msu.ru/ ) в виде xls-выдач простых sql-запросов. На основании данных выдач будут вручную сделаны небольшие красочные диаграммки со статистикой, которая будет обновляться примерно раз в году.

Предварительный список заказанных таблиц очень длинный и выглядит примерно так (n - число образцов, в скобках указано ожидаемое число строк). Если будут предложения с кратким обоснованием, то, возможно, добавим что-то еще.

Блок общей информации (число образцов)

отдел гербария – n [15 строк]
район гербария – n [60 строк]
страна – n [100 строк]
отдел гербария – район гербария – страна – n [150 строк]
отдел гербария – район гербария – Россия – административка1 – n [90 строк]
отдел гербария – район гербария – Россия – административка1 – административка2 – n [1000 строк]

Блок таксономического разнообразия коллекций

отдел гербария – семейство – n [1500 строк]
район гербария – семейство – n [5000 строк]
страна – семейство – n [7000 строк]
отдел гербария – район гербария – страна – семейство – n [7000 строк]
отдел гербария – район гербария – Россия – административка1 – семейство – n [9000 строк]
отдел гербария – семейство – род – n [7500 строк]
район гербария – семейство – род – n [20000 строк]
страна – семейство – род – n [25000 строк]
отдел гербария – район гербария – страна – семейство – род – n [25000 строк]
отдел гербария – район гербария – Россия – административка1 – род – n [30000 строк]
отдел гербария – вид (CoL) – n [45000 строк]
район гербария – вид (CoL) – n [55000 строк]
страна – вид (CoL) – n [60000 строк]
отдел гербария – район гербария – страна – вид (CoL) – n [60000 строк]
отдел гербария – район гербария – Россия – административка1 – вид (CoL) – n [90000 строк]
отдел гербария – вид (в коллекции) – n [50000 строк]
район гербария – вид (в коллекции) – n [60000 строк]
страна – вид (в коллекции) – n [70000 строк]
отдел гербария – район гербария – страна – вид (в коллекции) – n [70000 строк]
отдел гербария – район гербария – Россия – административка1 – вид – n [100000 строк]

Блок состояния БД этикеток

отдел гербария – класс оцифровки этикеток (0,1,2,3) – n [60 строк]
район гербария – класс оцифровки этикеток (0,1,2,3) – n [200 строк]
страна – класс оцифровки этикеток (0,1,2,3) – n [300 строк]
отдел гербария – район гербария – страна – класс оцифровки этикеток (0,1,2,3) – n [300 строк]
отдел гербария – район гербария – Россия – административка1 – класс оцифровки этикеток (0,1,2,3) – n [300 строк]

Блок состояния БД геопривязок

отдел гербария – есть/нет координаты – n [30 строк]
район гербария – есть/нет координаты – n [120 строк]
страна – есть/нет координаты – n [200 строк]
отдел гербария – район гербария – страна – есть/нет координаты – n [200 строк]
отдел гербария – район гербария – Россия – административка1 – есть/нет координаты – n [200 строк]
отдел гербария – класс геопривязки (0,1,2,3) – n [60 строк]
район гербария – класс геопривязки (0,1,2,3) – n [200 строк]
страна – класс геопривязки (0,1,2,3) – n [300 строк]
отдел гербария – район гербария – страна – класс геопривязки (0,1,2,3) – n [300 строк]
отдел гербария – район гербария – Россия – административка1 – класс геопривязки (0,1,2,3) – n [300 строк]

Блок хронологии (дат сборов)

отдел гербария – есть/нет год – n [30 строк]
район гербария – есть/нет год – n [120 строк]
страна – есть/нет год – n [200 строк]
отдел гербария – район гербария – страна – есть/нет год – n [200 строк]
отдел гербария – район гербария – Россия – административка1 – есть/нет год – n [200 строк]
отдел гербария – год – n [1500 строк]
район гербария – год – n [5000 строк]
страна – год – n [5000 строк]
отдел гербария – район гербария – страна – год – n [5000 строк]
отдел гербария – район гербария – Россия – административка1 – год – n [10000 строк]
отдел гербария – десятилетие (с 1800 г.) – n [300 строк]
район гербария – десятилетие (с 1800 г.) – n [1000 строк]
страна – десятилетие (с 1800 г.) – n [1000 строк]
отдел гербария – район гербария – страна – десятилетие (с 1800 г.) – n [1000 строк]
отдел гербария – район гербария – Россия – административка1 – десятилетие (с 1800 г.) – n [2000 строк]
отдел гербария – только месяц – n [60 строк]
район гербария – только месяц – n [300 строк]
страна – только месяц – n [500 строк]
отдел гербария – район гербария – страна – только месяц – n [500 строк]
отдел гербария – район гербария – Россия – административка1 – только месяц – n [500 строк]

отдел гербария – средний год сбора [15 строк]
район гербария – средний год сбора [60 строк]
страна – средний год сбора [100 строк]
Россия – административка1 – средний год сбора [100 строк]

Блок коллекторов

отдел гербария – есть/нет коллектор – n [30 строк]
район гербария – есть/нет коллектор – n [120 строк]
страна – есть/нет коллектор – n [200 строк]
отдел гербария – район гербария – страна – есть/нет коллектор – n [200 строк]
отдел гербария – район гербария – Россия – административка1 – есть/нет коллектор – n [200 строк]
фамилия первого коллектора – n [5000 строк]
отдел гербария – фамилия первого коллектора – n [10000 строк]
район гербария – фамилия первого коллектора – n [12000 строк]
страна – фамилия первого коллектора – n [15000 строк]
отдел гербария – район гербария – страна – фамилия первого коллектора – n [15000 строк]
отдел гербария – район гербария – Россия – административка1 – фамилия первого коллектора – n [5000 строк]
отдел гербария – фамилия первого коллектора – год – n [15000 строк]
район гербария – фамилия первого коллектора – год – n [17000 строк]
страна – фамилия первого коллектора – год – n [20000 строк]
отдел гербария – район гербария – страна – фамилия первого коллектора – год – n [20000 строк]
отдел гербария – район гербария – Россия – административка1 – фамилия первого коллектора – год – n [20000 строк]
отдел гербария – фамилия первого коллектора – дд мм гггг сбора – n [50000 строк]
район гербария – фамилия первого коллектора – дд мм гггг сбора – n [60000 строк]
страна – фамилия первого коллектора – дд мм гггг сбора – n [70000 строк]
отдел гербария – район гербария – страна – фамилия первого коллектора – дд мм гггг сбора – n [70000 строк]
отдел гербария – район гербария – Россия – административка1 – фамилия первого коллектора – дд мм гггг – n [50000 строк]

Блок операторов БД

Оператор геопривязки – n [20 строк]
Оператор ввода данных (этикетки) – n [30 строк]
Оператор ввода данных (этикетки) – класс оцифровки этикеток (0,1,2,3) – n [70 строк]
мм гггг ввода данных – n [40 строк]

Re: Цифровой Гербарий МГУ

10.05.
Новые массивы за неделю

За последнюю неделю мы загрузили несколько тысяч этикеток и геопривязок из разных областей земного шара. Вот их короткий обзор.

1) Флора Тульской области: 923 полные этикетки, коллектор И.С. Шереметьева. Документируют находки редких (и не очень) видов региона в 1980-90-е гг. Результаты были опубликованы авторами в "Конспекте флоры сосудистых растений Тульской области" (И. С. Шереметьева, Л. В. Хорун, А. В. Шербаков ; под ред. В. С. Новикова ; Московский гос. ун-т им. М. В. Ломоносова, Ботанический сад. - Тула : Гриф и К, 2008. - 274 с.; 20 см.; ISBN 978-5-8125-1082-4).

2) Флора Средней России: геопривязки 1714 сборов В.Н. Тихомирова, В.С. Новикова и Н.Б. Октябревой. В большинстве случаев - это сборы Мещёрской экспедиции 1960-90-х гг. Результаты были опубликованы в "Определителе растений Мещеры" ([в 2 ч. / Е. Б. Алексеев и др.] ; под ред. проф. В. Н. Тихомирова. - Москва : Изд-во Московского университета, 1986 - 1987.)

3) Флора Красноярского края: массив из 2055 пар коллектор - дата и 2028 ручных геопривязок. Автор массива - И.Н. Поспелов. Результаты будут доложены автором на конференции «Информационные технологии в исследовании биоразнообразия», которая состоится 11–14 сентября 2018 г. в Иркутске.

4) Флора Вьетнама: 96 этикеток образцов, собранных К.В. Котельниковой во Вьетнаме во время зимней практики несколько лет назад. Все образцы имеют геопривязки, этикетки предоставлены автором.

Статистика Цифрового гербария МГУ на 10 мая 2018 г.:

Образцов: 914 385
Изображений: 911 543
Видов: 35 629
Геопривязок: 116 432
Этикеток: 102 433
OCR: 85 652 (без учёта образцов с полными этикетками)

Re: Цифровой Гербарий МГУ

Коллеги-специалисты!
И любители - все, кто может и хочет поучаствовать в определении.

Во всех отделах Гербария есть растения, не определённые до вида. Какие-то - до уровня рода, но иногда - даже только до семейства.
Можно выбрать интересующий Вас район и сделать целиком выгрузку разной степени недоопределённых образцов в виде таблицы Excel.

Делается так:
Основная версия - https://plant.depo.msu.ru/
Расширенный поиск - https://plant.depo.msu.ru/module/itemsearchpublic
Там в табличке запросы выбрать:
1. "вид" - содержит "пусто"
2. Район гербария - нажимаем на "многоточие" справа - выбираем нужный
3. внизу под табличкой ставим "галочку" в пункте "названия, принятые в коллекции" (и снимаем галочку, выставленную в "выбрать всё" по умолчанию)
Нажимаем "ОК".

Немножко ждём, пока сформируется результат. Это может занять сколько-то времени (чем больше неопределённых в выбранном районе, тем больше).

Появится табличка - вверху справа нажимаем "все строки", во всплывающем окошке - "отобразить все строки" - ОК.

Далее нажимаем на пустой белый квадратик слева от ячейки "штрихкод" (в заголовке таблицы - это самая верхняя левая ячейка, она пустая) - выделятся все строки сразу.

Теперь нажимаем значок справа вверху - "сохранить данные из выделенных строк в файл формата Microsoft Excel (Open XML)
после обработки запросы появится окошко со ссылкой, откуда можно скачать полученный файл.

Уже на компьютере табличку можно сортировать, например, по алфавиту названий - так проще определять.
Или переставить столбцы (убрать что вам лишнее, ненужное) - так, например, последний столбец как раз содержит гиперссылку на сам скан образца - его можно куда-нибудь ближе к начале двинуть - ну, как удобнее.

Конечно, там изрядная часть образцов не определится без самого растения, но иногда хоть что-то сказать можно.

Re: Цифровой Гербарий МГУ

11.05.
Пол-России закрыто

Облако точек Цифрового гербария МГУ на начало мая (115 943 образцов с геопривязками). На сегодняшний день 13% образцов имеют в системе координаты. Работы по геопривязке коллекций продолжаются.

https://pp.userapi.com/c846019/v846019384/48445/j0xJH_X3SMY.jpg

Карта взята с нашей странички в GBIF https://www.gbif.org/dataset/902c8fe7-8 … 24fed36303

Re: Цифровой Гербарий МГУ

12.05.
Муниципальные районы: статистика

Наличие геопривязки (установленных географических координат) делает возможным агрегировать пространственную информацию по распространению растений по любым заданным выделам.

Некоторое время назад мы ввели автоматическую привязку таких образцов к административным выделам второго порядка. Получается, мы начали создавать на платформе https://plant.depo.msu.ru/ чеклист флоры России с точностью до районов (правда, координаты мы нашли пока только для 12% образцов).

Вот как сегодня выглядит наш топ-20 российских административных выделов второго уровня (по числу образцов):

городской округ Судак 7277
Хатангский (Таймырский) район 5058
городской округ Феодосия 4217
Спасский район 3961
городской округ Ялта 3381
Хатангский (Таймырский) район 3017
Диксонский (Таймырский) район 2844
Гусь-Хрустальный район 2682
Касимовский район 2632
городской округ Алушта 2157
Меленковский район 1923
Туруханский район 1859
т.п.г. Сочи 1664
Елизовский район 1447
Бахчисарайский район 1443
т.п.а. Дудинка 1346
Карачаевский район 1318
Судогодский район 1138
Вязниковский район 1022
Симферопольский район 947

В лидерах - районы Крыма, Красноярского края, Владимирской области. Именно по этим регионам у нас имеется максимальное число геопривязок.
------------
(Хатангский (Таймырский) район два раза прописан, потому что 5058 - сосудистые, а 3017 - мхи. А если вместе их считать, то Судак уедет на второе место, а первое будет за Севером  smile )

Re: Цифровой Гербарий МГУ

Крым rulez!  Слава MW!!

Re: Цифровой Гербарий МГУ

Определял сегодня астрагал из Кугитанга - вышел А.Кузнецова. Просмотрел образцы А.Кузнецова в MW - все 6 гербарных листов явно не с этим астрагалом, даже не из той секции, да и места сборов и близко к Кугитангу отношения не имеют.
Может, я ошибаюсь, но прочёл описания в 3-х "Флорах" и, думаю, в MW какая-то ошибка hmm

Re: Цифровой Гербарий МГУ

Нужно сообщить об ошибке: http://forum.plantarium.ru/viewtopic.ph … 34#p330634

Re: Цифровой Гербарий МГУ

Александр, очень может быть!
К сожалению, многие сборы из Средней Азии не были проверены.
Сдано было с какой-то этикеткой - храним до проверки как подписано.. neutral
(извините, не могла сразу ответить, была без компьютера).

Дмитрий, спасибо за проверку ответов в теме !

Re: Цифровой Гербарий МГУ

14.05.
Как мы растем и стареем: средний возраст образцов

Важным показателем текущей активности какого-либо гербария в отдельно взятом регионе является средний возраст образца. Постепенный ввод данных о дате сбора в Цифровой гербарий МГУ ( https://plant.depo.msu.ru/ ) позволил получить конкретные цифры по большинству регионов.

В этой таблице представлено 20 районов Гербария МГУ из 60, по которым у нас уже сейчас имеется достоверная информация (в виде полного множества или случайных выборок). В первом столбике указан средний возраст гербарного образца, в последнем - число образцов, по которым была установлена статистика.

На заметную молодость коллекций повлияли обширные современные сборы, переданные в МГУ в 1980-2000-е гг. По Черноморскому побережью Кавказа - это сборы А.С. Зернова и его коллег, по Центральной Сибири - В.Б. Куваева, Е.Б. и И.Н. Поспеловых, по Латвии - Н.К. Шведчиковой.

Напротив, сборы по Московскому региону, Африке и Закавказью стремительно, а подчас и безнадёжно стареют. На их средний возраст накладывают отпечаток обширные накопления 19-го и начала 20-го веков.

Флора любой территории - динамическая система. Приведённая статистика позволяет объективно оценить наши сильные и слабые стороны в представленности флористического разнообразия (в разное время и в различных местах).

https://pp.userapi.com/c844722/v844722051/4cb14/Ac7s3SYFDNQ.jpg

/некоторые регионы, например Африка - "старые". Отчасти это (пока) связано с тем, что в базу с датой сбора внесены не все образцы, а часть - и именно более ранних. Так, например, у нас полностью проиндексирован колоссальный гербарий Эклона и Цейгера из Южной Африки, датированный 1830 годом. Массовую Эфиопию в сборах В.Н. Павлова 1980-90-х гг. (в этом году будет около 1 тыс. листов) продолжаем включать, но всё равно это слабо влияет.

Re: Цифровой Гербарий МГУ

Вышла заметка "The Largest Digital Herbarium in Russia is Now Available Online!" в журнале "Taxon".
pdf на ResearchGate https://www.researchgate.net/publicatio … ble_Online

Re: Цифровой Гербарий МГУ

16.05.
Состояние БД этикеток Цифрового гербария МГУ: мини-отчет

На днях мы загрузили очередной большой массив этикеточных данных. За постоянными соообщениями о новых массивах как-то затерялась информация об общем состоянии нашей базы данных этикеток.

Итак, всего в Цифровом гербарии МГУ имеются переведенные в текстовый формат данные с этикеток со 103 474 образцов. Это примерно 10% наших гербарных фондов. Ещё для 59 362 образцов в систему введены данные о коллекторе и дате сбора, а для 83 691 образцов есть OCR-транскрипции этикеток без растаски по полям.

Распределение оцифрованных этикеток по районам гербария/странам дано в табличке. Она отсортирована по самому важному показателю - числу полных этикеток, внесённых в базу. Состояние на 14.05.2018 г.

https://pp.userapi.com/c834103/v834103044/13f7f5/w0v-spYZef4.jpg