Re: Цифровой Гербарий МГУ

02.07.2019.

Цифровой гербарий МГУ: есть 400 000 геопривязок!!!

Прекрасная летняя новость. Благодаря продолжающимся заливкам пространственных и текстовых данных, Цифровой гербарий МГУ ( https://plant.depo.msu.ru/ ) теперь содержит 400 000 геопривязок!

Это значит две вещи.

1. Уже 40% образцов имеют точки на карте. Это самая большая коллекция пространственных данных о биоразнообразии в России. Правда, рано или поздно нас съест наш собственный проект на iNaturalist )) На iNat сейчас 130 000 GBIF-точек.

2. Среди гербариев мира мы занимаем 11-е место в мире по объему оцифрованных и привязанных к координатам образцов. ОДИННАДЦАТОЕ!

Вот, кто впереди нас по геоданным (данные GBIF):

MEL AVH data (консорциум, Австралия) 4,667,925
Tropicos Specimen Data (Сент-Луис, США) 3,116,537
Naturalis Biodiversity Center (NL) - Botany (Лейден, Нидерланды) 1,488,255
The New York Botanical Garden Herbarium (NY) (Нью-Йорк, США) 1,016,430
PRECIS (консорциум, ЮАР) 903,698
Lund Botanical Museum (LD) (Лунд, Швеция) 866,816
Vascular Plant Herbarium, Oslo (O) (Осло, Норвегия) 597,743
Field Museum of Natural History (Botany) (Чикаго, США) 554,080
BRI AVH data (Брисбен, Австралия) 500,208
NMNH Extant Specimen Records (Вашингтон, США) 498,926

Осталось привязать к карте 600 тыс. образцов (и загрузить этикетки 690 тыс.).

https://sun9-51.userapi.com/c858124/v858124179/661e/PbjT7TTxyUw.jpg

Re: Цифровой Гербарий МГУ

03.07.2019.

Облако точек Цифрового гербария МГУ

Источник: https://www.gbif.org/dataset/902c8fe7-8 … 24fed36303

402 606 геопривязок

Статистика привязанных к карте образцов по странам:

Russian Federation 322,297
Ukraine 30,155
Mongolia 8,773
Georgia 5,564
Azerbaijan 4,763
Armenia 3,748
Viet Nam 3,123
Kyrgyzstan 2,836
Latvia 2,176
Ethiopia 1,950
Tajikistan 1,189
Canada 1,188
Kazakhstan 1,151
Turkmenistan 1,078
Paraguay 996
Cyprus 984
Belarus 932
South Africa 911
China 883
United States of America 815
Turkey 763
Iran, Islamic Republic Of 703
Mali 593
Greenland 578
Uzbekistan 525
Afghanistan 480
Israel 433
India 399
Spain 247
Portugal 243
Lithuania 175
Nepal 149
Japan 147
Bulgaria 146
Moldova, Republic of 133
Norway 125
Guinea 118
United Kingdom 111
Syrian Arab Republic 111

https://pp.userapi.com/c855232/v855232601/84936/sv_ixoU04Rk.jpg

Re: Цифровой Гербарий МГУ

03.07.2019.

Кафедры геоботаники МГУ больше нет

Приказом Ректора МГУ от 12.06.2019 кафедра геоботаники биологического факультета МГУ переименована. Наше новое название "Кафедра экологии и географии растений".

Именно так называется теперь то структурное подразделение, в состав которого входит Гербарий МГУ. В общем, наверное, всё логично.

Re: Цифровой Гербарий МГУ

04.07.2019.

Цифровой гербарий МГУ: новые массивы этого лета

01 Новый массив: 478 ручных геопривязок (E10)

Автор массива: Владимир Петрович Травкин с iNaturalist. Район E10 охватывает Средний и Южный Урал в пределах Башкирии, Пермского края, Челябинской, Оренбургской и Свердловской областей.

В.П. двигается ретроспективно - от новейших образцов к наиболее старым. Предварительно сборы агрегированы по коллекторам и датам для оптимизации процесса. В этот раз залит в систему период 1956-1968 гг. Текущая карта точек Среднего и Южного Урала дана на скриншоте.

К 478 ручным привязкам добавилось 133 геопривязок по тексту, 11 штук по хэшу (чистый текст), 1802 - по паре "коллектор-дата". Итого почти 2,5 тыс. точек.

Уже 9 498 образцов из 22 495 из района E10 имеют геопривязки. Работа постоянно продолжается.

https://sun9-9.userapi.com/c854016/v854016457/83be0/XNsuOeEb8Gc.jpg

Re: Цифровой Гербарий МГУ

05.07.2019.

Цифровой гербарий МГУ: новые массивы этого лета

02 Новый массив: 229 ручных геопривязок Европейской России

Автор массива: наш оператор Ирина Мельник. Фокусной группой были относительно свежие сборы - с 1991 по 2018 гг., у которых в этикетках отсутствовали координаты. Это, преимущественно, Центральное Нечерноземье, Центральное Черноземье, немного Северо-Запада и Нижней Волги.

Как правило, геопривязка таких сборов не вызывает трудностей, поскольку указанные деревни еще не исчезли. Текущая карта точек центра Европейской России дана на скриншоте.

К 229 ручным привязкам добавилось по алгоритму ИСТРА 30 геопривязок по тексту и 1536 штук по паре "коллектор-дата". Итого почти 1,9 тыс. точек.

Уже 150 361 образцов Европейской России имеют геопривязки (из 349 454, т.е. 43%). Это чуть выше средней цифры по Гербарию МГУ. Работа постоянно продолжается.

https://sun9-42.userapi.com/c852220/v852220494/161ef9/tGed_gnd1JY.jpg

Re: Цифровой Гербарий МГУ

06.07.2019.

Цифровой гербарий МГУ: новые массивы этого лета

03 Новый массив: 394 координат с этикеток (Московский регион, ГБС)

Автор массива: наш оператор Анастасия Борцова.

Когда к нам поступают в Цифровой гербарий МГУ новые сканы, мы вводим для них ключевые метаданные - название вида, регион, дату сбора, первого коллектора. Такая информация есть почти на всех образцах. Кроме того, иногда на этикетках (особенно на свежих сборах) ясно указаны координаты.

Такие геоданные мы аккуратно вводим в систему сразу, чтобы освободить операторов геопривязки от ненужной двойной работы. Последняя заливка 4300 образцов московского отдела Гербария ГБС РАН (MHA) по гранту РФФИ "Информационная система "Флора Москвы" на платформе Цифрового гербария МГУ" (19-34-70018 мол_а_мос) не стала исключением. Примерно 10% образцов уже содержали координаты, которые и были введены.

Уже 4 931 образцов (из 16 032, или 30,8%), которые представляют московский отдел Гербария ГБС, имеют геопривязки. Работа постоянно продолжается. Первый отчет по проекту № 19-34-70018 мол_а_мос будет подготовлен к 15 октября 2019 г. Фокусная территория проекта - Москва и 10-километровая полоса ближнего Подмосковья. Вы можете принять участие в наблюдениях по флоре Москвы, загружая свои фотографии на портал "Флора Москвы", развернутый на платформе iNaturalist ( https://www.inaturalist.org/projects/flora-of-moscow ).

https://sun9-10.userapi.com/c852220/v852220599/167ab9/EEoQmG60L9E.jpg

Re: Цифровой Гербарий МГУ

07.07.2019.

Цифровой гербарий МГУ: новые массивы этого лета

04 Новый массив: 4299 пар коллектор-дата (Московский регион, ГБС, часть 3)

Третья заливка сканов московского отдела Гербария ГБС РАН (MHA) по гранту РФФИ "Информационная система "Флора Москвы" на платформе Цифрового гербария МГУ" (19-34-70018 мол_а_мос) содержала 4299 образцов. Мы осуществили ее еще в конце мая. В течение июня мы ввели информацию об авторе и дате сбора каждого образца и внесли эти данные в систему.

Автор массива: наш оператор Анастасия Борцова.

Моментальная прибавка геоданных относительно небольшая: +59 точек, однако информация о коллекторе и дате помогает агрегировать образцы для дальнейшего поиска мест сбора. Эту работу делают уже операторы геопривязок.

https://pp.userapi.com/c856120/v856120029/87569/C9eO79CWZbo.jpg

Re: Цифровой Гербарий МГУ

07.07.2019.

Есть миллион образцов!

Finally

В Цифровом гербарии МГУ уже 1 002 026 образцов!

Четыре коллекции Гербария МГУ:

Гербарий МГУ (890 256 образцов)
Гербарий мохообразных МГУ (78 059 образцов)
Типовой гербарий МГУ (4 821 образец)
Herbarium Alchemillarum (3 960 образцов)

Московский раздел Гербария ГБС:

Гербарий ГБС РАН (23 902 образца)

Две вспомогательные коллекции:

ДНК растений (1 012 образцов)
Digital Pictures of Living Plants (16 образцов)

https://sun9-52.userapi.com/c848520/v848520966/1d700d/Lfcl6VxaibI.jpg

Re: Цифровой Гербарий МГУ

08.07.2019.

Цифровой гербарий МГУ: новые массивы этого лета

05 Новый массив: 2555 этикеток старинного гербария Цингера ["Цингер-04"]

Наш оператор Дарья Бородина, профессиональный историк, провела титаническую работу по аннотации и составлению исчерпывающей базы данных коллекции Василия Яковлевича Цингера.

Еще 6 марта 2019 г. мы залили 8112 записей - полных транскрипций рукописных этикеток с образцов из исторической коллекции. Даше пришлось работать с этикетками на русском, латыни и немецком, написанных десятками сложнейших почерков.

Вторая часть была залита 26 апреля 2019 г. - добавилось еще 3748 записей.

Третья часть включена в систему 29 мая 2019 г. - еще 1178 образцов.

И, наконец, четвертая "порция" Цингера от 2 июля 2019 г. добавила нам еще 2555 образцов.

Разобранные по полям базы данных этикетки включаются в алгоритм автоматической геопривязки ИСТРА. Эта система после заливки массива нашла в цингеровских этикетках совпадение с уже привязанными к карте образцами и смогла дополнительно дать координаты для 79 образцов по совпадению текста этикетки и 66 образцов по совпадению пары "коллектор/дата".

== О Цингере ==

Василий Я́ковлевич Цингер (1836-1907) - российский математик, заслуженный профессор Императорского Московского университета; основатель геометрической школы Московского университета; один из основателей Московского математического общества, позже его президент. Декан физико-математического факультета и проректор Московского университета. Но нам В.Я. Цингер известен, прежде всего, как ботаник, автор "Сборника сведений о флоре Средней России" (1885).

"Корреспонденты Цингера" из гимназий Московского учебного округа прислали ему в 1880-е гг. колоссальный гербарий по флоре Средней России. Именно его труд лёг в основу "Определителя" П.Ф. Маевского, которым мы пользуемся до сих пор.

К сожалению, на рубеже 19 и 20 вв. за гербарием В.Я. Цингера не уследили (опубликованное свидетельство М.И. Назарова). Фантастическим образом он, судя по всему, был перемешан, а многие сборы утрачены. Когда чуть позже гербарий был смонтирован и вложен в фонды, на один лист пришлось наклеить все сборы какого-либо вида из одной губернии вперемешку.

https://pp.userapi.com/c851232/v851232306/159c05/0ObY4vlXUns.jpg https://sun9-6.userapi.com/c855236/v855236024/8611a/2fsQDNB4xeE.jpg

Re: Цифровой Гербарий МГУ

09.07.2019.

Цифровой гербарий МГУ: новые массивы этого лета

06 Новый массив: 424 ручные геопривязки Гербария ГБС РАН

Автор массива: наш оператор Иван Кривокорин.

Иван занимался геопривязкой образцов Гербария Главного ботанического сада РАН (MHA), точнее его московского отдела. Эти фонды цифруются по гранту РФФИ "Информационная система "Флора Москвы" на платформе Цифрового гербария МГУ" (19-34-70018 мол_а_мос). Коллеги из ГБС передали в Цифровой гербарий МГУ (https://plant.depo.msu.ru/) 7087 набранных этикеток, которые мы ввели в систему. Обработка данных алгоритмом ИСТРА позволила сгруппировать образцы по местам сбора до начала работы по геопривязке.

Имея табличную выгрузку с текстом этикеток, оператор, не заглядывая в скан, искал указанные места в электронных картографических системах и вводил их координаты.

К 424 ручным привязкам добавилось по алгоритму ИСТРА 117 геопривязок по тексту, 4 по хэшу (чистый текст) и 586 штук по паре "коллектор-дата". Итого 1,1 тыс. точек.

На сегодняшний день 6127 образцов Гербария ГБС (из 23902 залитых) имеют метки на карте. Как только для загруженной на днях четвертой порции Гербария ГБС (около 8 тыс. сканов) мы введем ключевые метаданные, на место встанет еще несколько тысяч пар координат. Сколько - расскажем чуть позже.

Re: Цифровой Гербарий МГУ

11.07.2019.

/текст от первого лица от А.П./

Цифровой гербарий МГУ: новые массивы этого лета

07 Новый массив: 2440 этикеток (полный текст) А.П. Серегина из Западной Европы

Автор массива: А.П. Серегин и А.С. Борцова.

"Я много путешествовал и собирал гербарий в Западной Европе. В 2003 г. еще студентом я провел два месяца на Международных курсах гербарного дела в Кью (один из крупнейших гербариев мира). За это время по выходным на ночных автобусах с другом-фиджийцем мы исколесили Корнуолл, Шотландию, Северную Ирландию. Много собирал в Сюррее и на берегу Па-де-Кале. Итог 600 образцов, которые с трудом были выбиты у британцев спустя полгода.

В 2005 г. я с Максом Бочарниковым (геофак МГУ) принял участие в практике студентов кафедры физ. географии мира МГУ в Болгарии. Мы делали ландшафтную карту на природный парк «Белоградчикские Скалы» на северо-западе страны, проведя там две недели. Еще неделю были на море. Итог - 562 образца.

В 2010 г. мы неожиданно пошли в недельное морское путешествие по Греции благодаря моему геофаковскому товарищу А. Чернокульскому. В сентябре не так много цветущих трав в Средиземноморье, да и собирал я гербарий, в основном, так - за плавки сзади затыкались шлепки и большой мусорный мешок и вплавь с яхты я отправлялся на дикий пляж. Потом обратно, а уже в каюте укладывал растения в сетку. Итог - 138 образцов.

В 2013-2015 гг. я ежегодно на два осенних месяца отправлялся в Германию, где работал в Оснабрюке в молекулярной лаборатории Н.В.Фризена. Но по выходным я азартно собирал гербарий в Северном Рейне-Вестфалии и Нижней Саксонии. Итогом стала очень полная коллекция объемом 726 образцов (в т.ч. немного из соседней Голландии).

В октябре 2015 г. на недельку мы махнули в Каталонию. Впрочем, гербарная папка и сетки были со мной )) 143 образца добрались до Москвы.

Спустя год в октябре 2016 г. мы устроили себе двухнедельный кольцевой автомаршрут по Сицилии - Липарские острова, Этна, Мадонийские горы, пляжи у Палермо. Это было фантастически! К тому же почти половина видов (из 219 собранных образцов) у нас в гербарии не были представлены. В Палермо удалось повидать известных местных ботаников - Д. Домину и В. Грёйтера.

Были и короткие поездки в Польшу и Португалию.

Только в прошлом году мы оцифровали этот отдел. Настя Борцова ввела затем коллекторов всех западноевропейских сборов, в т.ч. мои, а с помощью OCR мы нашли случайные потеряшки. Итогом стала огромная заливка 2440 полнотекстовых расшифровок моих этикеток из Западной Европы.

На карте Западной Европы зажглись точки многих сотен новых сборов, напоминая мне о замечательных днях, проведенных в горах Германии и Каталонии, на берегах полноводного Рейна и сухой Тордеры, и даже на безжизненных склонах Этны и Вулькано."

https://sun9-9.userapi.com/c854328/v854328966/8f9b6/CcVeYqfRCUU.jpg

Re: Цифровой Гербарий МГУ

12.07.2019.

Цифровой гербарий МГУ: новые массивы этого лета

08 Новый массив: MHA-04 (7890 новых сканов из Московского раздела Гербария ГБС РАН)

Авторы массива: группа операторов сканирования Гербария ГБС РАН под руководством Н.Ю. Степановой.

Оцифровка образцов Гербария Главного ботанического сада РАН (MHA), точнее его московского отдела, идет по гранту РФФИ "Информационная система "Флора Москвы" на платформе Цифрового гербария МГУ" (19-34-70018 мол_а_мос). Четвертая заливка охватывала семейства от Polygonaceae до Brassicaceae.

Работы велись на сканере Microtek ObjectScan 1600 (пр-во Тайвань). Формат изображений - 600 dpi. Уже оцифровано и опубликовано на нашем портале 23 902 образца Гербария ГБС РАН.

Образцы отображены на портале в качестве отдельной коллекции. Реализация совместного проекта позволит оцифровать в Гербарии ГБС РАН около 40 тыс. образцов, что позволит второму по величине гербарию Москвы войти в тройку крупнейших цифровых гербариев России. В свою очередь, Цифровой гербарий МГУ уже стал точкой доступа к 1 миллиону изображений.

Мы открыты для сотрудничества и готовы публиковать цифровые коллекции других гербариев!

== О Гербарии ГБС РАН ==

Гербарные коллекции в ГБС начали накапливаться сразу же после образования сада, документируя флористические и интродукционные исследования, проводимые сотрудниками разных отделов. Однако первые годы он не имел ни помещения, ни какого-либо структурного оформления. Поэтому датой основания гербария ГБС принято считать 1958 г., когда после ввода в строй Лабораторного корпуса, для Гербария был выделен большой зал площадью 280 кв. м. Одновременно была собрана гербарная рабочая группа в составе 5 научных и 2 технических сотрудников отдела природной флоры, которую возглавил В.Н. Ворошилов.

Начало быстрому росту гербария, включавшему тогда б.ч. сборы В.Н. Ворошилова, Б.М. Кулькова и В.А. Штамма из Воронежской и Московской областей, было положено получением почти полного комплекта эксикат Санкт-Петербургского ботанического института (“Гербарий флоры СССР”), дублетов сборов Д.П. Сырейщикова из Московской области.

Дальнейшие поступления были в основном связаны с экспедиционными поездками сотрудников сада за живым материалом для создаваемых экспозиций природной флоры СССР. С самого начала фонды гербария были разделены по географическому принципу на 8 разделов, аналогично коллекционным участкам отдела природной флоры, коллекции которых Гербарий был призван документировать. Это разделы: 1. Российского Дальнего Востока (без Колымы и Чукотки, которые отнесены к Сибири); 2. Сибири (включая Чукотку и Колыму, а также северный и центральный Казахстан, но исключая собственно Урал); 3. Средней Азии (включая южный Казахстан от Тарбагатая до нижней Эмбы); 4. Европейской части бывшего СССР (кроме Крыма, но включая горный Урал); 5. Московской области; 6. Крыма; 7. Кавказа (включая равнинный Дагестан, Ставропольский и Краснодарский края); 8. Дальнего зарубежья (т.е. вне СССР).

Подробности: Скворцов А.К., Белянина Н.Б. Гербарий Главного ботанического сада Российской академии наук. Москва, 2005. 46 с.

Re: Цифровой Гербарий МГУ

13.07.2019.

Цифровой гербарий МГУ: новые массивы этого лета

09 Новый массив: 96 ручных геопривязок Гербария ГБС РАН

Автор массива: наш оператор Наталья Копылова.

Наталья занималась геопривязкой образцов Гербария Главного ботанического сада РАН (MHA), точнее его московского раздела. Эти фонды цифруются по гранту РФФИ "Информационная система "Флора Москвы" на платформе Цифрового гербария МГУ" (19-34-70018 мол_а_мос).

К 96 ручным привязкам добавилось по алгоритму ИСТРА 220 штук по паре "коллектор-дата".

На сегодняшний день 6127 образцов Гербария ГБС (из 23902 залитых) имеют метки на карте. Как только для загруженной на днях четвертой порции Гербария ГБС (около 8 тыс. сканов) мы введем ключевые метаданные, на место встанет еще несколько тысяч пар координат. Сколько - расскажем чуть позже.

А пока облако точек Гербария ГБС РАН на карте выглядит вот так.

Фокусная территория проекта - Москва и 10-километровая полоса ближнего Подмосковья. Вы можете принять участие в наблюдениях по флоре Москвы, загружая свои фотографии на портал "Флора Москвы", развернутый на платформе iNaturalist ( https://www.inaturalist.org/projects/flora-of-moscow ).

https://sun9-50.userapi.com/c850332/v850332999/18f671/RhpyjmK89Dg.jpg

Re: Цифровой Гербарий МГУ

14.07.2019.

Цифровой гербарий МГУ: новые массивы этого лета

10 Новый массив: 367 пар коллектор-дата Австралии и Океании

Автор массива: наш оператор Анастасия Дубровская.

Дошла очередь до самого дальнего уголка нашей планеты - Австралии и Океании. В Гербарии МГУ хранится 3406 образцов из этого региона. Что-то собрано сотрудниками МГУ в последнее время, что-то - советскими исследовательскими миссиями. Но основой источник поступления гербария - международный обмен с австралийскими и европейскими гербариями.

Анастасия образец за образцом вводит ключевые метаданные для каждого образца - прежде всего, дату сбора и коллектора. Такая информация есть почти на всех образцах. Кроме того, иногда на этикетках (особенно на свежих сборах) ясно указаны координаты.

Такие геоданные мы аккуратно вводим в систему сразу, чтобы освободить операторов геопривязки от ненужной двойной работы. Примерно 36% образцов уже содержали координаты, которые и были введены. Они происходят, в основном из окрестностей Перта.

Работа продолжается - наши волонтёры приступили к ручной привязке более старых сборов из Австралии. Ждём первых результатов!

https://pp.userapi.com/c849128/v849128999/1d4c15/GS5YJuYuq1g.jpg

Re: Цифровой Гербарий МГУ

15.07.2019.

Цифровой гербарий МГУ: новые массивы этого лета

11 Новый массив: 194 ручные геопривязки Нижней Волги

Автор массива: наш оператор Андрей Салмин.

Андрей один из самых опытных и плодотворных операторов геопривязки Цифрового гербария МГУ. В этот раз он занимался геопривязкой образцов Нижней Волги.

К 194 ручным привязкам добавилось по алгоритму ИСТРА 48 геопривязок по тексту, 2 по хэшу (чистый текст) и 2987 штук по паре "коллектор-дата". Итого
3,2 тыс. точек.

На сегодняшний день 8389 образцов с Нижней Волги (из 22933, т.е. 37%) имеют метки на карте. Это один из небольших шагов к "Атласу флоры России". Работа постоянно продолжается.

Хотите принять участие в создании "Атласа флоры России"? Загружайте свои фотографии растений в природе и точку съемки на iNaturalist, где они станут частью нашего проекта "Флора России | Flora of Russia" ( https://www.inaturalist.org/projects/flora-of-russia ). Точки находок ваших растений автоматически попадут из iNaturalist в GBIF, а оттуда в "Атлас флоры России".

https://sun9-40.userapi.com/c854328/v854328966/8f9c7/ncLZAlaJNQQ.jpg

Re: Цифровой Гербарий МГУ

18.07.2019.

Коллекции Гербария МГУ: коротко

Гербарий Московского университета (MW) занимает 63-е место в мире по объему фондов. Статистика, приведенная ниже, дана на конец 2018 г. – время, когда мы ежегодно подводим итоги работ в Гербарии.

В общей сложности, Гербарий Московского университета насчитывает 1 047 009 образцов – сосудистых растений и мохообразных. Это точное число известно благодаря оцифровке гербарных фондов, которая была осуществлена в 2015–2018 гг. по проекту "Ноев Ковчег" (грант РНФ № 14-50-00029). Ближайшими "конкурентами" в мировом рейтинге по числу образцов являются гербарии Висконсинского университета, США (WIS), в котором насчитывается 1 078 000 образцов, и Национального политехнического института, Мексика (ENCB), где хранится 1 080 000 образцов. Впрочем, все эти цифры подвижны и довольно быстро устаревают.

Ежегодный прирост фондов в Гербарии Московского университета уже несколько лет держится на отметке около 20 тыс. образцов. В 2016 г. в коллекции было включено 22 013 листов гербария и образцов мхов, в 2017 г. – 19 416, в 2018 г. – 16 340. Такой заметный рост был связан не только с активностью ботаников Московского университета (которые обеспечивают не более половины роста коллекций), сколько с активным поступлением гербарных сборов от сторонних ботаников и организаций. Особенно важно отметить полную передачу в наши фонды небольших, но важных гербариев: лаборатории устойчивости лесных экосистем Костромского университета (2016 г.), Бадхызского заповедника (2017 г.), Института физико-химических и биологических проблем почвоведения РАН в г. Пущино (2018 г.), Музея природы в г. Владимире (2019 г.). Передача малых гербариев в более крупные – мировая тенденция, и, слава богу, что оставшиеся без попечения коллекции не отправляются на свалку.

Крупнейшим отделом Гербария МГУ является Восточная Европа, которая включает Европейскую Россию (без Крыма и Кавказа), Украину, Белоруссию, Молдавию и страны Прибалтики. Сейчас здесь насчитывается 368 617 образцов. Традиционно самым представительным районом гербария является Московский регион (город и область) – 73 160 образцов, Центральный район – 51 075, Центральный лесостепной район – 47 465, Северный район – 36 993, Нижневолжский район – 22 850. Столь обширные московские коллекции специально исследуются сейчас по гранту РФФИ "Информационная система "Флора Москвы" на платформе Цифрового гербария МГУ" (19-34-70018 мол_а_мос).

Вторым по размерам является отдел Сибири и Дальнего Востока, в который включено 165 476 гербарных образцов. Тенденции последних лет показывают, что ежегодный прирост фондов из Азиатской России почти сравнялся с новыми включениями из Восточной Европы. Больше всего сборов хранится здесь с юга Дальнего Востока – 31 844, Алтая и Саян – 30 575, Чукотки и Камчатки – 25 031, Прибайкалья и Забайкалья – 24 836, Центральной Сибири – 20 047. Обширное включение 2019 г., состоящее из дублетов, поступивших из объединенного Гербария Центрального сибирского ботанического сада РАН (NS+NSK), как ожидается, выведет в лидеры Алтае-Саянский регион.

Третьим по числу образцов Гербария является отдел Кавказа. Здесь насчитывается 100 668 образцов сосудистых растений. Естественно, большинство коллекций представлено с территории России. Традиционный район гербария "Северный Кавказ" из-за этого пришлось поделить на три части для более эффективного доступа к коллекциям. Сейчас больше всего сборов представлено из района К1б (Ставропольский край, Карачаево-Черкесия, Кабардино-Балкария) – 18 930 листов, K6 (Азербайджан) – 14 876, К1а (Краснодарский край и Адыгея) – 14 682, К5 (Армения) – 10 668, К4 (Грузия) – 9 016. Большие и, при том, стремительно растущие коллекции Западного Кавказа специально изучаются сейчас по гранту РФФИ "Самая богатая региональная флора России: информатика биоразнообразия сосудистых растений Краснодарского края" (19-44-233012 р_мол_а).

Очень важным и интересным отделом Гербария МГУ является отдел Средней Азии, в котором хранится 97 141 образец. Сейчас больше всего сборов хранится у нас из Западного Тянь-Шаня (и Каратау) – 22 420 образцов, Памира и Памиро-Алай – 17 069, Северного и Центрального Тянь-Шаня – 12 980. Границы районов в этом отделе не совпадают с государственными границами. По странам Средней Азии объемы наших фондов таковы: Казахстан – 50 309 образцов, Киргизия – 17 503, Узбекистан – 10 622, Туркменистан – 10 317, Таджикистан – 9 551. Продолжается ежегодное пополнение фондов этого отдела за счет передачи многочисленных материалов группы М.Г. Пименова из Ботанического сада МГУ. Не будет исключением и 2019 г.

Отдел Западной Европы насчитывает на сегодняшний день 40 481 образец. Этот отдел не районирован. В основном, он сформировался за счет обмена между отдельными коллекционерами 19 века и крупными учреждениями в 20 веке. Впрочем, оригинальные коллекции сотрудников Московского университета могут составить при окончательном учете 20% отдела.

Отдельно в Гербарии МГУ хранится гербарий Крыма, который находится в идеальном состоянии, благодаря усилиям Н.К. Шведчиковой. Сейчас здесь насчитывается 32 748 образец, в т.ч. около 2 100 образцов, включенных в коллекцию за последние шесть лет.

Отдел Монголии со времени полевых работ И.А. Губанова находится, де-факто, в законсервированном состоянии и лишь случайно пополняется за счет дублетов. Сейчас здесь хранится 27 341 образец.

Напротив, отдел Зарубежной Азии (без Средней Азии и Монголии), который насчитывает 24 681 образец, продолжает стремительно расти, прежде всего, за счет исследовательских миссий во Вьетнаме. Здесь рост фондов за шесть лет составил 4 100 образцов.

Небольшая коллекция растений Америки (как Северной, так и Южной) хранится в учебной аудитории 502. Здесь имеется 12 236 образец, полученных, преимущественно, по линии международного обмена.

В последнее время значительно пополнился гербарий Африки за счет разбора многочисленных коллекций В.Н. Павлова и Д.А. Петелина из Эфиопии. Сейчас африканский отдел состоит из 9 057 образцов, что на 2 300 больше, чем в конце 2012 г.

Гербарий мохообразных состоит из мхов (77 410 образцов) и печеночников (3 959 образцов). Самыми представительными являются при этом сборы из Средней Сибири (Красноярский край, Тыва и Хакасия) – 8 457 образцов, Северного Кавказа и Предкавказья – 7 691, Центрального Нечерноземья (без Москвы и Подмосковья) – 7 580, юга Дальнего Востока – 7 279, Западной Европы – 7 025.

https://sun9-21.userapi.com/c850528/v850528258/16c285/F-FMYP0JJuY.jpg https://sun9-28.userapi.com/c850528/v850528258/16c299/mv-gGBpX3Cw.jpg https://sun9-54.userapi.com/c850528/v850528258/16c2b7/TbKvkZ9yJ0c.jpg

https://sun9-47.userapi.com/c850528/v850528258/16c28f/y-vB1SJrMpE.jpg https://sun9-20.userapi.com/c850528/v850528258/16c2a3/t5k7QljljOo.jpg https://sun9-39.userapi.com/c850528/v850528258/16c2ad/sYg_YCMgj70.jpg https://sun1-15.userapi.com/c850528/v850528258/16c2c1/Iwx-TL0luEw.jpg

Re: Цифровой Гербарий МГУ

25.07.

Цифровой гербарий МГУ: таймлайн проекта
/АП от первого лица/

В данном сообщении кратко охарактеризован ход работ по созданию Цифрового гербария МГУ – крупнейшей российской базы данных о биоразнообразии, онлайн-зеркала наших коллекций, одного из крупнейших цифровых гербариев мира.

Одновременно и очень радостно, и очень трудно кратко рассказать об огромной работе, которая ведется под моим руководством над Цифровым гербарием МГУ. Тот, кто следит за нашим проектом, знает его основные вехи и имеет общее представление о базе данных. Для тех, кто впервые об это слышит, сжатое изложение вряд ли даст представление о сложности и масштабе работ. Поэтому я выберу жанр таймлайна, опираясь на хронологию сообщений в нашем блоге ( https://vk.com/mw_herbarium ).

20.08.2014 – П.А. Каменский (в будущем – заместитель Проректора МГУ) сообщает мне о предложении декана биофака МГУ М.П. Кирпичникова возглавить ботаническую часть заявки на грант РНФ "Научные основы создания Национального банка-депозитария живых систем" (по конкурсу комплексных научных программ организаций). В течение следующих десяти дней из 10 заявок, поступивших от ботанических кафедр и ботанического сада МГУ, формируется единая программа работ на четыре года. Из девяти научных групп одна ("Гербарий") имеет перед собой задачу оцифровки фондов Гербария МГУ.

2.09.2014 – Гербарий МГУ становится одним из первых российских учреждений, зарегистрированных в качестве поставщика данных в Global Biodiversity Information Facility (GBIF). Спустя 16 дней в GBIF появился первый опубликованный набор данных "A grid-based database on vascular plant distribution in the Meshchera National Park, Vladimir Oblast, Russia" (Seregin, 2014).

18.11.2014 – стало известно, что заявка МГУ, которую лично возглавил Ректор В.А. Садовничий, прошла конкурсный отбор. Окончательно формируется коллектив, между пятью направлениями ("Растения", "Животные", "Микроорганизмы и грибы", "Биологическая информация", "Биоматериал человека") распределяется финансирование. Проект получает название "Ноев ковчег".

2.12.2014 – первые контакты с корпорацией ЭЛАР, которая станет в дальнейшем нашим многолетним партнером по оцифровке коллекций Гербария МГУ.

23.12.2014 – GBIF-совещание на биологическом факультете МГУ, организованное Д. Щигелем. Сотрудничество Гербария и GBIF становится постоянным. Спустя три года Гербарий Московского университета станет крупнейшим владельцем GBIF-данных о биоразнообразии России и крупнейшим поставщиком сведений для GBIF из числа российских организаций.

31.12.2014 – подписано соглашение между МГУ и РНФ о начале финансирования проекта. Общий объем финансирования со стороны Фонда – 750 млн рублей до конца 2018 года. Одна девятая от одной пятой этих средств пойдет в Гербарий.

18.04.2015 (суббота) – я пришел в Гербарий МГУ один, чтобы в спокойной обстановке приклеить первую катушку штрихкодов. К концу дня стало ясно, что живой человек с учетом мелкой дополнительной работы по приведению коллекций в порядок вряд ли сможет приклеивать больше 1 тыс. штрихкодов в день. Уже на конец мая было запланировано начало работ по сканированию. А, значит, нам предстояло спешить. В итоге, за год "на штрихкодах" у нас проработало 63 человека, но 30% работы всё же выполнили пятеро штатных сотрудников Гербария.

18.05.2015 – ЭЛАР завёз в Гербарий МГУ оборудование. Спустя несколько дней в аудитории 401 (нижний зал Гербария) за тремя сканерами по 10–11 часов в день стояли операторы ЭЛАРа, прошедшие инструктаж. Каждый день по 2,5–3 тыс. файлов добавлялись в библиотеку цифровых изображений. Эта работа длилась почти полгода – до декабря. За 2015 г. было оцифровано 502 тыс. образцов из отделов Сибири и Восточной Европы – чуть больше половины гербария. Почти всё время вместе с сотрудниками ЭЛАРа бок о бок клеили штрихкоды сотрудники и студенты МГУ.

3.03.2016 – стала доступной первая версия портала Цифрового гербария МГУ (http://bio.labinform.ru/). Его сделала команда направления "Биологическая информация" гранта РНФ. В него был залит отдел Сибири и Дальнего Востока общим объемом около 155 тыс. образцов. Спустя пару месяцев общения с разработчиками и обсуждения дальнейших действий стало ясно, что IT-команда не готова работать в качестве девелоперов, а лишь следуют техническому заданию. Проект bio.labinform.ru был признан непригодным для наших целей и мы начали сотрудничество с командой "Проекта Скулачева".

7.06.2016 – в фонды Гербария Московского университета вложен миллионный образец!

15.08.2016 – начат второй этап оцифровки Гербария МГУ. Корпорации ЭЛАР предстояло оцифровать в тот год 284 000 образцов из отделов Кавказа, Крыма, Монголии, Зарубежной Азии, Herbarium Alchemillarum и типовые образцы (215 тыс. образцов), а также этикетки с конвертов гербария мхов (73 тыс. образцов).

17.10.2016 – открыт доступ к новому порталу Гербария МГУ (https://plant.mitotech.ru/), который, развиваясь, и является сейчас платформой Цифрового гербария МГУ. В тот день он содержал 501 892 скана образцов из отделов Восточной Европы и Сибири, оцифрованных в 2015 г. Поиск и сортировка на больших выборках висли, но альфа-версия удалась. Разработку выполнила команда "Проекта Скулачева", осуществив титаническую работу с нуля.

26.11.2016 – переезд портала Цифрового гербария МГУ на современный адрес в доменной зоне Московского университета (https://plant.depo.msu.ru/).

23.01.2017 – сообщение о работе портала Цифрового гербария МГУ прошло по лентам ведущих информационных агентств (например, https://tass.ru/nauka/3963062).

9.02.2017 – Цифровому гербарию МГУ предоставлены мощности Центра обработки данных МГУ.

4.03.2017 – Кавказский гербарий опубликован на портале https://plant.depo.msu.ru/. Таким образом, целиком завершена онлайн-публикация гербарных коллекций с территории России. На тот момент Цифровой гербарий МГУ обеспечивал доступ к 688 568 сканам.

11.07.2017 – Цифровой гербарий МГУ теперь "говорит" по-русски! В тот день мы загрузили базу данных русских названий растений.

29.07.2017 – первые 1 207 этикеток стали доступны в Цифровом гербарии МГУ в виде полнотекстовой базы данных. Был сделан первый шаг по очень длинной дороге по полной оцифровке текстовых данных с этикеток Гербария Московского университета. За несколько дней до этого в системе появились и первые геопривязки – 2 910 штук из Средней России.

1.09.2017 – начат третий этап сканирования Гербария МГУ, который продлится два месяца. В планах была оцифровка 120 000 образцов – 94 000 образцов из отдела Средней Азии, 12 000 образцов из отдела Америки и 14 000 образцов новых включений (Восточная Европа, Сибирь и ДВ, Зарубежная Азия, Африка, Крым, Кавказ). Кроме того, предстояло отсканировать этикетки с конвертов печеночников. Кроме того, была составлена полнотекстовая база данных 45 000 образцов из отделов Крыма и Кавказа.

12.09.2017 – преодолен пятитысячный рубеж по числу загруженных в систему этикеток и геопривязок. Статистика на тот день была такой: привязано к карте – 5 707 штук, загружено этикеток – 5 217 штук.

21.10.2017 – в Цифровой гербарий МГУ внедрена система автоматической геопривязки ИСТРА (Интеллектуальная Система Топонимического Распознавания и Атрибутирования), которая группирует образцы по совпадающему тексту этикеток или по совпадению пары "дата сбора"/"коллектор". Таким образом, резко увеличилась эффективность геопривязки отдельных образцов.

2.11.2017 – в GBIF опубликован набор данных "Moscow University Herbarium (MW)" общим объемом 786 145 образцов. Россия стала крупнейшим поставщиком электронных данных о биоразнообразии со своей территории. Сейчас этот массив включает 1 002 455 образцов, для которых учтено 58 цитирований.

14.03.2018 – мы опубликовали в Цифровом гербарии МГУ OCR 55 467 образцов мхов. За несколько месяцев до этого Яндекс, проиндексировав 786 тыс. сканов Гербария МГУ для сервиса Яндекс.Картинки, прогнал наш массив через эту процедуру. Все печатные символы, слова и предложения, которые программа распознала на этикетках, стали использоваться для индексации изображений. Мхи, этикетки которых были отсканированы без открывания конвертов, проиндексировались почти идеально. У нас появилась уверенность в том, что в будущем мы самостоятельно осуществим OCR и опубликуем результаты на портале. В течение пяти суток на мощностях Центра обработки данных МГУ с помощью программного продукта Tesseract проходила обработка и распознавание этикеток 77 тыс. сканов образцов мхов. Результаты чистились с помощью наших собственных скриптов, которые находили и убирали строки нераспознанной абракадабры рукописного текста.

13.04.2018 – запущен OCR гербария сосудистых растений.

9.07.2018 – в Цифровой гербарий МГУ залиты данные о дате сбора и коллекторе для 80% образцов. По сути, эти данные введены для всех образцов, в которых единственная дата сбора и фамилия коллектора были указаны ясно и полно. Эта работа осуществлялась операторами корпорации ЭЛАР в мае–июне 2018 г. На следующий день система ИСТРА автоматически привязала к карте 63 тыс. образцов и общее число геопривязок перевалило за 200 тыс., составив 217 971 штук – каждый четвертый оцифрованный образец Гербария МГУ получил метку на карте.

18.09.2018 – начат четвертый этап сканирования Гербария МГУ, который продлится два месяца. В планах была оцифровка отделов Западной Европы (40 000 образцов), Австралии и Океании (3 300 образцов), а также новых включений.

23.09.2018 – на 12-й ежегодной Вики-конференции в Санкт-Петербурге Цифровой гербарий МГУ стал лауреатом Вики-премии 2018 в категории «Свободные знания» с формулировкой "за важный вклад в глобальную коллекцию знаний о биоразнообразии". Цифровой гербарий МГУ незадолго до этого целиком перешел на лицензию CC-BY 4.0.

30.10.2018 – корпорацией ЭЛАР была отсканирована последняя пачка фондовой коллекции Гербария МГУ – сложноцветные Австралии и Океании. Работы по оцифровке коллекции (точнее, созданию библиотеки графических образов) полностью завершены.

7.12.2018 – Цифровой гербарий МГУ стал обладателем Премии Русского географического общества в номинации «Лучший научный проект». В торжественной церемонии награждения, проходившей в Кремле, принял участие Президент РФ В.В. Путин.

31.12.2018 – окончание гранта РНФ "Научные основы создания Национального банка-депозитария живых систем" (проект МГУ "Ноев ковчег").

30.03.2019 – заливка гигантского массива из 144 тыс. этикеток, ввод которых был осуществлен корпорацией ЭЛАР в 2018 г. Цифровой гербарий МГУ включает 974 289 образцов, 968 033 изображений, 37 782 видов, 373 163 геопривязки, 297 497 этикеток. Все данные, полученные по проекту "Ноев ковчег" опубликованы онлайн.

9.07.2019 – Цифровой гербарий МГУ включает 1 002 032 образцов, 993 585 изображений, 37 857 видов, 409 916 геопривязок, 314 257 этикеток. Работы продолжаются по трем грантам (два от РФФИ, один от GBIF).

https://sun9-52.userapi.com/c857524/v857524179/11098/1GS_EzVDLzI.jpg