Re: Цифровой Гербарий МГУ

8.11.

Позавчера Цифровой гербарий МГУ ( https://plant.depo.msu.ru/ ) поставил новый рекорд: 219 уникальных посетителей за сутки

По-видимому, это стало результатом большой информационной волны, которая поднялась вслед за официальным пресс-релизом на сайте университета ( https://www.msu.ru/science/main_themes/ … ztsov.html ).

В спокойном режиме, Цифровой гербарий МГУ посещает в среднем от 40 до 50 уникальных посетителей в сутки (в рабочие дни) и 20-30 в выходные. Кроме того, 55-60 выгрузок в день получают из Цифрового гербария МГУ пользователи GBIF.

Удивительнее всего то, что ни один счетчик не считает весь трафик - Яндекс не видит трафик из Google, LiveInternet не видит нашу открытую версию и т.п. Поэтому об истинном числе пользователей мы можем только догадываться!

https://pp.userapi.com/c851320/v851320481/3cb62/L4p2lYe4ZnQ.jpg

Re: Цифровой Гербарий МГУ

9.11.
Обновлён раздел "Коллекторы" в статье о Гербарии МГУ в Википедии ( https://ru.wikipedia.org/wiki/%D0%93%D0 … 1%80%D1%8B )

Теперь этот перечень содержит 80 персоналий, о которых, в свою очередь, есть статьи в Википедии:

Алексеев, Евгений Борисович [5]
Алёхин, Василий Васильевич [6]
Анненков, Николай Иванович [7]
Арнольди, Владимир Митрофанович [8]
Артари, Александр Петрович [9]
Баньковский, Лев Владимирович [10] (дублеты)
Берг, Лев Семёнович [11]
Варсанофьева, Вера Александровна [12]
Воронов, Анатолий Георгиевич [13]
Гептнер, Владимир Георгиевич [14]
Говорухин, Василий Сергеевич [15]
Голенкин, Михаил Ильич [16]
Горожанкин, Иван Николаевич [17]
Гроссет, Гуго Эдгарович [18]
Губанов, Иван Алексеевич [19]
Доктуровский, Владимир Семёнович [20]
Еленевский, Андрей Георгиевич [21] (сборы с Кубы)
Ена, Андрей Васильевич [22] (дублеты)
Житков, Борис Михайлович [23]
Зернов, Александр Сергеевич [24]
Иконников, Сергей Сергеевич [25] (дублеты)
Ильин, Модест Михайлович [26] (дублеты)
Казанский, Николай Александрович [27]
Камелин, Рудольф Владимирович [28] (дублеты)
Каминг, Хью [29] (дублеты)
Караваев, Михаил Николаевич [30]
Кауфман, Николай Николаевич [31]
Комаров, Владимир Леонтьевич [32] (дублеты)
Красноборов, Иван Моисеевич [33] (дублеты)
Кречетович, Лев Мельхиседекович [34]
Куваев, Владимир Борисович [35]
Кудряшов, Леонид Васильевич [36]
Липшиц, Сергей Юльевич [37]
Литвинов, Дмитрий Иванович [38]
Мазуренко, Мая Тимофеевна [39] (дублеты)
Максимович, Михаил Александрович [40]
Малышев, Леонид Иванович [41] (ранние сборы)
Муралевич, Вячеслав Степанович [42]
Мяздриков, Иван Петрович [43]
Назаров, Михаил Иванович [44]
Нейштадт, Марк Ильич [45]
Новиков, Владимир Сергеевич [46]
Новопокровский, Иван Васильевич [47]
Носков, Александр Куприянович [48]
Павлов, Вадим Николаевич [49]
Павлов, Николай Васильевич [50]
Петунников, Алексей Николаевич [51]
Пименов, Михаил Георгиевич [52]
Портениер, Николай Николаевич [53] (дублеты)
Работнов, Тихон Александрович [54]
Серебряков, Иван Григорьевич [55] (ранние сборы)
Серёгин, Алексей Петрович [56]
Скворцов, Алексей Константинович [57] (ранние сборы)
Смирнов, Павел Александрович [58]
Соколов, Дмитрий Дмитриевич [59]
Станков, Сергей Сергеевич [60]
Старобогатов, Ярослав Игоревич [61]
Сукачёв, Владимир Николаевич [62]
Сырейщиков, Дмитрий Петрович [63]
Сюзев, Павел Васильевич [64] (дублеты)
Тихомиров, Вадим Николаевич [65]
Трофимов, Тит Трофимович [66]
Турчанинов, Николай Степанович [67] (дублеты)
Тыртиков, Алексей Павлович [68]
Тюремнов, Сергей Николаевич [69]
Уранов, Алексей Александрович [70] (ранние сборы)
Флёров, Александр Фёдорович [71]
Формозов, Александр Николаевич [72]
Харкевич, Сигизмунд Семёнович [73] (дублеты)
Хохряков, Андрей Павлович [74] (дублеты)
Цвелёв, Николай Николаевич [75] (дублеты)
Цейгер, Карл Людвиг Филипп [76] (дублеты)
Цингер, Василий Яковлевич [77]
Чистяков, Иван Дорофеевич [78]
Шретер, Алексей Иванович [79]
Щукин, Иван Семёнович [80]
Эклон, Христиан Фредерик [81] (дублеты)
Юнатов, Александр Афанасьевич [82]
Юрцев, Борис Александрович [83] (ранние сборы)
Ярошенко, Павел Дионисьевич [84] (дублеты)

Re: Цифровой Гербарий МГУ

10.11
1 044 751 образец: финальная цифра 2018 года!

В последние дни оцифровки мы подвели итоги пополнения Гербария МГУ в истекающем году.

Год назад у нас насчитывалось 1 030 669 образцов. Это значит, что наша коллекция выросла всего-то на 14 082 образцов (для сравнения: в 2016 г. было 22 013, в 2017 г. - 19 416).

Это является результатом влияния двух наложившихся факторов - скромного роста бриологического гербария (на 907 образцов) и полной ликвидацией существовавших некогда "завалов" неразобранных коллекций сосудистых растений, которые кормили нас в прошлые 2-3 года.

Из внешних коллекций за это время в наши фонды целиком был включен Гербарий Бадхызского заповедника, о судьбе которого мы писали ранее ( https://vk.com/wall-134484155_652 ). К сожалению, из-за бюрократических сложностей не удалось нам заполучить важную коллекцию Хорошкова из фондов Ивановской сельскохозяйственной академии.

Из знаковых событий, связанных с ростом коллекций, отметим, что отдел Кавказа перешагнул через 100-тысячный рубеж, а отдел Зарубежной Европы через 40-тысячный. Как и раньше, самые большие включения сделаны в отдел Восточной Европы (в этот раз отдел вырос на 4900 образцов).

https://pp.userapi.com/c852228/v852228803/3c45d/zNu-xtRW7v8.jpg

Re: Цифровой Гербарий МГУ

13.11
2018 год: работа над ошибками

В этом году компания-партнер отсканировала в Гербарии МГУ 61 079 гербарных образцов в формате 300 dpi (контракт был на 61 000 образцов), а также 100 типовых образцов в формате 600 dpi. Это отдел Западной Европы, отдел Австралии и Океании, а также новые включения в разные отделы, которые оказались не столь обильными.

Новых изображений, которых еще нет в Цифровом гербарии МГУ (на https://plant.depo.msu.ru/ ) оказалось 56 244 штуки (92,1%). Остальные образцы нам, по разным причинам, пришлось пересканировать - таковых 4 835 единиц.

На ресканы были отправлены две группы образцов - (1) переопределения 2018 года (1 509 шт.), и (2) образцы с низким качеством сканов 2015 года (3 326 шт.). О них стоит написать подробнее.

В мае 2015 года, когда в Гербарий привезли первые три сканера, у нас не было достаточного опыта, чтобы грамотно формулировать наши требования к сканам и контролировать качество. Учились на своих ошибках. Это привело к тому, что спустя четыре года изображения, полученные в первые дни оцифровки, сейчас выглядят мало непригодными с точки зрения научной ценности и нашей академической репутации (формально придраться к ним сложно).

В связи с этим, мы отправили на ресканы 46 пачек растений Сибири и Дальнего Востока - сложноцветные (часть), вересковые и ивы. Чтобы не было стыдно.

Напоследок немного треша 2015 года, который пришлось целиком переделать. Такого вы вскоре уже никогда не увидите в Цифровом гербарии МГУ. Обещаем!

https://pp.userapi.com/c851320/v851320481/3cbc2/rV7a1REz8GM.jpg

https://pp.userapi.com/c851320/v851320481/3cbcc/e5RHgBdOkOE.jpg

https://pp.userapi.com/c851320/v851320481/3cbd6/T-SXN1M9pp8.jpg

Re: Цифровой Гербарий МГУ

19.11
Большая чистка

Сегодня число геопривязок в Цифровом гербарии МГУ сократится на 1300 штук.

Мы избавимся от не очень точных и откровенно ошибочных координат, массово взятых напрямую с этикеток. В небытие (с аккуратной пометкой "Координаты в этикетке даны ошибочно" в паспорте образца) будут отправлены неверные геометки, которые оказались в море, в соседнем регионе или даже в соседней стране.

На сегодняшний день в Цифровом гербарии МГУ содержится свыше 290 тыс. геометок. Это огромный массив пространственных данных, добытый нашей командой за последние 15 месяцев. По этому показателю мы занимаем 17-е место среди виртуальных гербариев мира (по числу сканов - на 8-м). И если раньше каждая пара координат была на счету и их приходилось беречь, то сейчас настала пора сделать наш массив надежным источником проверенной информации.

Последние два дня регион за регионом, а затем страна за страной мы отображали на электронной картооснове облака точек. Если точка вылетала за пределы заявленного географического объекта (например, точка из Саратовской области вдруг оказывалась в Пензенской или чукотский образец вдруг был в водах Берингова пролива), то проводилось небольшое расследование.

Причин ошибок было четыре: (1) неверная координата в авторской этикетке (ошибка или опечатка коллектора на бумажной этикетке); (2) опечатка, допущенная при вводе координат в систему; (3) ошибка при тэгировании (неверно указанный регион); (4) ошибка оператора геопривязки при поиске топонима. В первом случае координаты, как было сказано, сносились. Во втором случае найденные опечатки исправлялись. В третьем случае мы исправляли геотэг. В четвертом двигали точку в правильное место.

Большая чистка закончена. Следующая будет при отметке в 400 тыс. геопривязок. Надеемся, уже скоро!

https://pp.userapi.com/c844724/v844724764/1373f5/Q7MliGVfqEA.jpg

Re: Цифровой Гербарий МГУ

21.11.
Новые массивы за 50 дней: ретроспектива

Общее число геопривязок и этикеток в Цифровом гербарии МГУ за последние два месяца неуклонно росло, благодаря интеграции больших и малых массивов. Сейчас у нас на портале https://plant.depo.msu.ru/ и в GBIF-зеркале ( https://www.gbif.org/dataset/902c8fe7-8 … 24fed36303 ) содержится 290 708 геометок и 133 316 полнотекстовых расшифровок этикеток.

1. Тэгирование Средней Азии по странам: Памиро-Алай

18 ноября 2018 г. мы загрузили геотэги (названия стран) для 1986 образцов, собранных на Памиро-Алае. Растаска 96 тысяч среднеазиатских образцов до уровня стран почти завершена - осталось не более 3% "хвостов". Необходимость такой большой работы была вызвана тем, что для этого региона в Гербарии МГУ мы использовали физико-географическое деление, которое невозможно увязать с международными базами данных, основанных на государственных границах. Задача была нетривиальной из-за большого числа сходных топонимов (Карабулак, Аксай, Кумбель и т.п.). Отдельные образцы и вовсе оказались из Азербайджана и Китая. Автор массива Н.С. Гамова (Гербарий МГУ).

2. Геопривязки Крыма

18 ноября 2018 г. мы загрузили ручные геопривязки для 170 образцов, собранных в Крыму. Постепенно Горный Крым становится территорией с максимальной для России плотностью пространственных данных по флоре. Уже привязано к карте 25,224 образца из 33,796. Эта кропотливая работа продолжается. Автор последнего массива Е.С. Каширина (Филиал МГУ в г. Севастополе).

3. Фотографии дальневосточных растений в природе

18 ноября 2018 г. мы загрузили 100 фотографий живых растений, сделанные С.В. Дудовым во время гербарных сборов на Дальнем Востоке. Постепенно мы развиваем блок "Фото в природе", который пользуется популярностью при иллюстрировании "Википедии". Это связано с тем, что наши материалы доступны по свободной лицензии CC-BY 4.0 (можно использовать при наличии прямой и полной ссылки на первоисточник). На сегодняшний день уже 422 образца имеют активные вкладки "Фото в природе", в которых хранится от 1 до 10 фотографий тех же самых растений за пару минут до того, как они попали в гербарную папку. Автор этих фотографий С.В. Дудов (Гербарий МГУ), другие фотографии загружены Ю.О. Копыловым-Гуськовым, И.Н. Поспеловым, А.П. Серегиным.

https://plant.depo.msu.ru/getimg.jpg?p-acode=120165553-4724912594&p-icode=120165554-2231216212&pageCode=1542727543024_4231494033&p-type=MEDIUM

Re: Цифровой Гербарий МГУ

22.11
Новые массивы за 50 дней: ретроспектива

Общее число геопривязок и этикеток в Цифровом гербарии МГУ за последние два месяца неуклонно росло, благодаря интеграции больших и малых массивов. Сейчас у нас на портале https://plant.depo.msu.ru/ и в GBIF-зеркале ( https://www.gbif.org/dataset/902c8fe7-8 … 24fed36303  содержится 290 530 геометок и 133 316 полнотекстовых расшифровок этикеток.

4. Координаты с этикеток топ-коллекторов: Россия

Примерно через неделю мы зальем новый мега-массив - 144 тыс. полнотекстовых расшифровки этикеток, сделанных по контракту с НПО "Опыт" (корпорация ЭЛАР). В их число вошли сборы 100 топ-коллекторов Гербария МГУ, сделанные на территории России. Из их числа 3 331 этикетка имела ясные коллекторские координаты, которые и были залиты отдельно после цикла логических сверок. Залиты 16 ноября 2018 г., авторы массива - операторы екатеринбургского офиса ЭЛАРа. Координаты 60% образцов контролировались процедурой двойного слепого ввода (оператор А.С. Борцова).

5. Англоязычные этикетки канадского ботаника Кальдера

16 ноября 2018 г. мы залили один из немногих массивов, который целиком сделан на английском языке. Это 203 этикетки канадского ботаника Кальдера, которые были присланы по обмену из Department of Agriculture - Canada (крупнейший гербарий Канады). К сожалению, в этом огромном гербарии идет реконструкция, а его электронная версия так и не создана. В связи с этим, мы не можем скачать массив данных для наших дублетов с их портала. Пришлось делать ручной ввод. На этом массиве магистрантка кафедры геоботаники МГУ Е.В. Кудр (автор массива) оттачивала свои профессиональные навыки в геоботаническом английском по первоисточникам.

6. Выгрузка сборов Е.А. и М.С. Игнатовых из БД "Флора мхов России"

Массив загружен 13 ноября 2018 г. Его история довольно длинная. Массовые сборы наших известных бриологов составляют примерно восьмую часть бриологического гербария МГУ. Их сборы в виде дублетов хранятся в Гербарии Главного ботанического сада, где активно индексируются в базе данных "Флора мхов России". Мы состыковали наши образцы, подставив даты и коллекторские номера к каждому образцу и, при полном соответствии исходников, сделали стыковку с присланной выгрузкой. В общей сложности, автоматически встала половина игнатовских этикеток - 4 039 образцов. Теперь для них в Цифровом гербарии МГУ есть полнотекстовые расшифровки. Авторы массива: операторы ЭЛАРа (коллектор и дата для Цифрового гербария МГУ), А.С. Борцова (коллекторские номера), операторы БД "Флора мхов России" (текст этикеток из Гербария ГБС), А.П. Серегин (скрипт для стыковки, логические сверки, чистка, форматирование). Настоящая командная работа.

https://pp.userapi.com/c844321/v844321796/131264/v4ge-57LHU4.jpg

Re: Цифровой Гербарий МГУ

23.11.
Новые массивы за 50 дней: ретроспектива

Общее число геопривязок и этикеток в Цифровом гербарии МГУ за последние два месяца неуклонно росло, благодаря интеграции больших и малых массивов. Сейчас у нас на портале https://plant.depo.msu.ru/ и в GBIF-зеркале ( https://www.gbif.org/dataset/902c8fe7-8 … 24fed36303 ) содержится 290 530 геометок и 133 316 полнотекстовых расшифровок этикеток.

7. Библиография по Крыму и Владимирской области

У каждого образца Цифрового гербария МГУ имеется вкладка "Библиография", в которую можно вставлять ссылки на конкретные публикации, которые цитируют тот или иной сбор. К каждой публикации можно также цеплять гиперссылку на полный текст, доступный в сети. Эти цитаты отображаются также в open-версии в нижней части паспорта образца и индексируются поисковыми роботами. 12-13 ноября 2018 г. мы добавили 795 библиографических ссылок в паспорта отдельных образцов, собранных во Владимирской области и в Крыму в 1999-2016 гг. Автор массива: А.П. Серегин (Гербарий МГУ).

8. Геопривязки образцов из Ростовской области

Загружен 12 ноября 2018 г. Включает 1 598 ручных геопривязок образцов из Ростовской области. Благодаря нашему сотрудничеству с большим любителем ростовской природы А.Г. Кузьминым, почти все образцы из Ростовской области получили геопривязки. Таковых сейчас 5 799 штук. Это одна из самых удачных историй волонтёрства, которая вывела Ростовскую область в число регионов с высокой плотностью электронных данных о разнообразии сосудистых растений. Отдельно отметим, что ежегодно с Нижнего Дона к нам поступают новые интересные сборы. Правда, они все уже имеют координаты в этикетках. Автор массива: А.Г. Кузьмин (г. Таганрог).

9. База данных "Флора Вьетанама" (2010 г.)

Перед экспедицией во Вьетнам 2010 года сотрудники кафедры геоботаники МГУ А.Н. Демидова и Н.Г. Прилепский составили исчерпывающую базу данных о вьетнамских образцах нашего гербария. До начала работ по созданию Цифрового гербария МГУ еще было пять лет. В 2018 году мы состыковали этот массив с нашими сканами и залили 12 ноября 2018 г. полнотекстовые расшифровки 1 206 этикеток Вьетнама. Автор массива: А.Н. Демидова ("Аптекарский огород"), И.В. Мельник (стыковка).

https://pp.userapi.com/c845522/v845522460/1349e7/Qw9XT7IXz4w.jpg

Re: Цифровой Гербарий МГУ

25.11
Новые массивы за 50 дней: ретроспектива

Общее число геопривязок и этикеток в Цифровом гербарии МГУ за последние два месяца неуклонно росло, благодаря интеграции больших и малых массивов. Сейчас у нас на портале https://plant.depo.msu.ru/ и в GBIF-зеркале ( https://www.gbif.org/dataset/902c8fe7-8 … 24fed36303 ) содержится 290 530 геометок и 133 316 полнотекстовых расшифровок этикеток.

10. Владимирская область: сборы А.П. Серегина за 2000 год

/тут авторский текст от АП Серёгина/

История этого массива поучительна. В 1999 г. я поступил в МГУ и окончательно перешел на работу за компьютером. Это было так здорово набирать этикетки собственных сборов в одной из первых версий Word! Сейчас это тяжелая рутина, а тогда я был счастлив общаться с компьютером. К сожалению, машины и дискеты в те времена были ненадежны. Все этикетки, набранные до сентября 2000 г. у меня пропали. Это был самый лучший урок: с тех пор я делал резервное копирование документов и аккуратно следил за версиями файлов. Благодаря этому, все мои сборы 2001-2017 гг. удалось оперативно снабдить полнотекстовыми расшифровками как только они были отсканированы и повешены в Цифровой гербарий МГУ. Ни один массив этикеток (около 20 тысяч образцов) за 17 лет не потерялся! Что ж, настала пора повторно набрать этикетки моих давних сборов из Владимирской области, в т.ч. из первой поездки в национальный парк "Мещера".

На портал залили 141 этикетку 12 ноября 2018 г. Автор массива: И.В. Мельник.

11. Caragana jubata: 51 ручная геопривязка

12 ноября 2018 г. мы залили небольшой массив Алины Чурюлиной (кафедра биогеографии МГУ) по Caragana jubata. Это 51 образец из Средней Азии, Монголии и азиатской части России. К сожалению, около 10 образцов в дальнейшем не прошли логических сверок, т.е. 20% откровенный брак. Основные проблемы: разные координаты у дублетов и грубая привязка "до хребта" при наличии точных топонимов. И такое бывает.

12. Этикетки С.В. Дудова

Опять же 12 ноября 2018 г. состоялась крупная заливка авторских этикеток от С.В. Дудова. В общей сложности, автор состыковал со своими исходниками штрихкоды 3615 образцов, собранных на Дальнем Востоке и в Забайкалье, степных районах европейской части и на Кавказе. Большинство образцов имеют координаты. Сергей Валерьевич входит в число топ-40 наиболее плодотворных коллекторов Гербария МГУ за всю его историю. Впрочем, некоторые таблицы у автора не сохранились и около 300 образцов придется в будущем перенабирать вручную. Авторы массива: С.В. Дудов (текст этикеток, xls-файл), А.С. Борцова (стыковка штрихкодов и коллекторских номеров).

13. Этикетки М.И. Назарова из Владимирской губернии: полный текст

Залит 9 ноября 2018 г. В этом массиве 1306 этикеток М.И. Назарова первой половины 1910-х гг. Михаил Иванович по политическим мотивам вынужден был жить в г. Меленки Владимирской губернии. Благодаря этому, регион оказался в числе наиболее флористически изученных частей Российской империи - Назаров азартно собирал многотысячный гербарий с массой дублетов. Постепенно мы вносим полнотекстовые расшифровки в систему, уточняя его маршруты. Назаров однозначно входит в топ-7 наиболее продуктивных сотрудников Московского университета, собиравших гербарий. Автор массива: Д.В. Бородина.

https://pp.userapi.com/c844723/v844723460/13afb1/Ou5sfFg0H5E.jpg

Re: Цифровой Гербарий МГУ

28.11
28 ноября проходит конференция «Проект МГУ «Ноев ковчег»: вчера, сегодня, завтра»

28 ноября 2018 года (в среду) в актовом зале Шуваловского корпуса МГУ проходит конференция, посвященная окончанию гранта Российского научного фонда «Научные основы создания Национального банка-депозитария живых систем».

Этим грантом в течение 4 лет финансировался проект «Ноев ковчег» - крупнейший российский проект последних лет в области наук о жизни, посвященный исследованию, сохранению и полезному использованию биологического разнообразия нашей планеты. В проект вовлечено около 350 сотрудников, аспирантов и студентов МГУ с 14 факультетов.

За это время было получено множество интересных научных результатов: открыты новые для науки виды живых существ, описаны их особенности, изучены различные свойства уже известных видов… Обо всем этом на конференции будут рассказывать участники проекта.

Но главная цель конференции – это показать, что даже если грант РНФ заканчивается, то проект «Ноев ковчег» продолжается! Полученные в ходе выполнения проекта результаты убедительно говорят в пользу практического использования имеющихся наработок. Также опыт проекта «Ноев ковчег» однозначно показывает эффективность использования «больших данных» в работе с биологическими коллекциями и вообще в науках о жизни. Об этом и о многих других возможных направлениях развития проекта также будет говориться на конференции.

Презентация доклада "Цифровой гербарий МГУ – крупнейшая российская база данных о биоразнообразии" лежит на ResearchGate https://www.researchgate.net/publicatio … znoobrazii

Re: Цифровой Гербарий МГУ

30.11
В Цифровом гербарии МГУ представлены образцы из 157 стран

Самые уникальные сборы - те, которые представляют флору какой-нибудь страны всего одним образцом. Так, у нас хранится по одному листу из таких стран, как: Багамские Острова, Барбадос, Бермудские Острова, Венесуэла, Гондурас, Замбия, Зимбабве, Мартиника, Мьянма, Оман, Сомали, Тринидад и Тобаго, Уганда, Федеративные Штаты Микронезии, Французские Южные и Антарктические Территории.