Тема: Новый, уникальный определитель растений

Добрый день, уважаемые биологи, ботаники и все прочие люди, интересующиеся растениями!
Наверное, каждый из вас видел сервис, игру акинатор, в которой вам задаются вопросы и отгадывается загаданный вами персонаж.
Полтора года назад мне пришла в голову идея создать такой же сервис, только для определения растений, а не персонажей. Дело в том, что я (и, я думаю, многие из вас) не был удовлетворён работой электронных определителей, имеющихся в интернете. Им присущи некоторые, всем известные недостатки, но "акинатор для растений" может их быть лишён.
О своей идее я в июне 2016 написал администратору этого сайта, Дмитрию Орешкину и предложил совместными усилиями создать такой "акинатор для растений". Дмитрий идею одобрил, но, в связи с нехваткой времени (и по другим очевидным причинам) предложил обратиться сюда, на форум, если мне удастся такой определитель сделать и если мне потребуется помощь в тестировании.
Затем я несколько раз начинал этим проектом заниматься и забрасывал на долгое время, но теперь всё-таки довёл проект до рабочего состояния и рад представить его вашему вниманию.
Ключевые отличия "акинатора для растений" от обычных электронных определителей:
- порядок вопросов (признаков растения) нефиксированный; следующий вопрос выбирается таким образом, чтобы ответ на него принёс как можно больше определённости
- "неправильный" ответ на вопрос не лишает пользователя возможности правильно определить растение; просто для этого потребуется больше правильных ответов (к примеру, не 20, а 22)
- если растение определить удалось, ответы запоминаются и таким образом происходит постепенное "обучение" определителя.
Теперь ложка дёгтя. Многие вопросы (признаки растений) представлены в непривычной форме, например так: "Внешний вид@Листья@Край@Зубчатый". Дело в том, что признаки растений я собирал автоматическим способом, а не вручную, с этого сайта плантариум.ру и эти признаки были взяты из раздела "ключевые признаки" в описании таксона. Если вас не устраивает такое описание признака, вы можете его исправить (пока что право на редактирование разрешено всем пользователям определителя).
Всего в базе нового определителя около 1.5 тыс видов растений. Все они взяты с этого сайта. Добавление новых видов пока не планируется, по техническим причинам, но в будущем обязательно будет разрешено, если определитель докажет свою жизнеспособность.
Пока что новый определитель работает НЕ ОЧЕНЬ ХОРОШО. Я предупреждаю заранее, чтобы не вызвать шквал критики. Дело в том, что информации о признаках растений пока в определителе не очень много. Чтобы определить растение, вам, возможно, придётся ответить на сотню вопросов определителя и отклонить пару десятков неправильных предположений о растении (определитель время от времени выдаёт предположение о растении, а пользователь может отклонить, если понимает, что предположение неправильное). Но, в конце концов, правильный вариант будет "акинатором" предложен (если он вообще есть в базе) и, самое главное, с каждым правильно определённым растением, информация накапливается и определитель будет работать всё лучше и быстрее.
Итак, всех желающих прошу протестировать новый определитель: http://plantarium.tk/

Re: Новый, уникальный определитель растений

Как-то не удается выйти на простые растения: сирень обыкновенную и пастушью сумку. Потратила кучу времени безрезультатно  sad

Re: Новый, уникальный определитель растений

Да, к сожалению пока и самые часто встречающиеся и редкие растения, имеющиеся в базе - одинаково сложно находятся. Постепенно, качество поиска будет улучшаться. Правда, только после уже правильно определенных растений. Если сервис не сможет определить ни одного растения правильно, он так и останется на этом начальном уровне...
Поправка: я сейчас проверил и оказалось, что в имеющейся базе из 1.5 тысяч растений отсутствуют, к сожалению, и пастушья сумка и сирень обыкновенная. Из сиреней есть только сирень амурская...
Пояснение: в базу были выбраны только растения, имеющие много ключевых признаков (больше определенного порога), и, видимо, оказалось, что у пастушьей сумки и сирени ключевых признаков на плантариум.ру указано меньше этого порога

Отредактировано Михаил Пелёвин (2018-01-21 13:02:34)

Re: Новый, уникальный определитель растений

Если Плантариум(-ный, -ский?) определитель работает максимум в 50% случаев, то какой смысл на его базе городить эрзац?

Re: Новый, уникальный определитель растений

Юрий, видите ли, иного пути я не вижу. Нужно было взять что-то за основу.
Со временем работа определителя улучшится (или не улучшится, если им никто не будет пользоваться).

Re: Новый, уникальный определитель растений

Мне вот что в голову пришло: а если Вам, Михаил, взять за основу ботаника? Вы, наверное, им не являетесь? Я бы на Вашем месте сама попыталась "натаскать" систему  smile
Тут ещё проблема в том, что многие признаки человек без опыта определения видит неправильно, и мы такие неправильные варианты старались учитывать. Но не будут ли они мешать работе определителя?

Re: Новый, уникальный определитель растений

Я далёк от биологии и ботаники, я работаю программистом.
Насчёт того, чтобы самому "натаскать" - мысль, конечно, понятная и я буду этим заниматься, но большое количество человек сделают это быстрее, чем я один. Поэтому я вот и написал здесь сегодня, несмотря на то, что в определителе пока не очень много данных.
То, что люди без опыта отдельные признаки растения указывают неправильно (то есть, иначе, чем люди с опытом) - это, конечно, имеет значение. Но только для текущего, слабо обученного определителя. В далёкой перспективе это значения иметь не будет, так как определитель выбирает, о каком признаке задать вопрос. Он выбирает таким образом, чтобы ответ внёс как можно больше ясности. А если ответы сильно разнятся, то ясности они вносят мало и такой вопрос не будет задан (по крайней мере, не в первую очередь).
В первую очередь будут использоваться понятные всем признаки.

Re: Новый, уникальный определитель растений

Ещё у нас в определителе не учитываются очень многие важные признаки. Например, определитель никогда не научится определять злаки или осоки. Или различать виды, отличие между которыми в характере опушения.

Я имела в виду, что ботаник и признаки сразу взял бы другие, не только те, что у нас прописаны. Необходимость многих признаков стала видна через некоторое время, когда многое уже было сделано и заполнено, один раз что-то сообща добавляли в ключевые признаки, но сейчас на такую работу нет не сил, ни времени...

Re: Новый, уникальный определитель растений

Угу, понятно, спасибо за информацию.
В "акинаторе для растений" предусмотрена возможность добавлять вопросы (признаки), но пока, по техническим причинам она отключена.
Вы, наверно, спросите: кто будет заполнять наличие признака для сотен растений в базе, если новый вопрос (признак) будет добавлен? Ответ заключается в том, что первоначально человек, добавлящий признак, указывает его наличие или отсутствие для небольшого количества (5 .. 10) растений.
В процессе определения такие признаки иногда будут использоваться, даже если о их наличии или отсутствии у искомого растения пока ещё неизвестно (чтобы исключить растения, у которых о наличии или отсутствии признака уже известно) и, после правильного определения растения, этот признак у него отметится, как присутствующий или отсутствующий (как ответил человек).

Re: Новый, уникальный определитель растений

Михаил, Лена, почему-то в определителе "Плантариума" отсутствует возможность указывать известный таксон более высокого ранга. Например, если я точно знаю, что растение из Астровых, почему бы это сразу не задать в поиске?
Возможно, я неправа, но мне кажется, алгоритм поиска должен предусмотреть последовательную смену уровней таксонов. Как это и делают специалисты на "Плантариуме". Если по каким-то причинам невозможно определить вид, то хотя бы устанавливается род или семейство.

Re: Новый, уникальный определитель растений

Да, так было бы лучше.
Но времени на переделку всего сразу у Дмитрия нет. И как-то определитель как таковой оказался не самой востребованной частью Плантариума smile

Re: Новый, уникальный определитель растений

Елена Баяндина пишет:

очему-то в определителе "Плантариума" отсутствует возможность указывать известный таксон более высокого ранга.

Хм, может я не о том подумал...
Но на странице любого таксона выше вида, слева есть пункт "определение вида", с пиктограммой-биноклем. Работает как и определитель, только выборка уже идёт в рамках конкретного таксона.
То есть если вы уверены в таксоне, находите его через поиск таксона и потом уже определяете)

*пересмотрел страницу "определение растений"*
Хм, там же в рекомендациях написано:
"Если Вы хотите определить вид в пределах известного Вам таксона высокого ранга:
найдите известный таксон (род, семейство и т.п.) через поиск по названию;
перейдите на страницу "Описание таксона" или "Таксономия" найденного таксона;
воспользуйтесь ссылкой "Определить субтаксон" на левой панели страницы."

Отредактировано Станислав Бакей (2018-01-21 17:29:38)

Re: Новый, уникальный определитель растений

Елена Баяндина пишет:

Михаил, Лена, почему-то в определителе "Плантариума" отсутствует возможность указывать известный таксон более высокого ранга.

Она есть. Просто надо внимательно читать меню. Например, здесь (на левой панели).

Re: Новый, уникальный определитель растений

Лена Глазунова пишет:

И как-то определитель как таковой оказался не самой востребованной частью Плантариума smile

Тем не менее, среди индивидуальных страниц эта (http://plantarium.ru/page/find.html) находится на 3-4 месте по посещаемости.

Re: Новый, уникальный определитель растений

Михаил Пелёвин пишет:

Пояснение: в базу были выбраны только растения, имеющие много ключевых признаков (больше определенного порога), и, видимо, оказалось, что у пастушьей сумки и сирени ключевых признаков на плантариум.ру указано меньше этого порога

Выбирать нужно было виды, включенные в определитель. У многих видов признаки не были проверены модераторами, а у многих - унаследованы от таксонов надвидового уровня.

Re: Новый, уникальный определитель растений

Станислав, Дмитрий, спасибо! Сама не нашла.
В своё время узнала о "Плантариуме" именно благодаря определителю и часто им пользовалась, но к сожалению, большинство моих попыток оказались неудачными, поэтому забросила. Может быть, и ещё для кого-то было так же.

Re: Новый, уникальный определитель растений

Дмитрий, я могу поменять список определяемых растений, это не очень сложно.
Подскажите, как выбрать виды включенные в определитель?

Re: Новый, уникальный определитель растений

Для авторизованных пользователей сайта на левой панели страниц видов, включенных в определитель, внизу есть строчка "Включено в определитель". Но, наверное, будет удобнее, если я просто список идентификаторов таких видов пришлю.

Re: Новый, уникальный определитель растений

Здорово, если пришлёте - я буду благодарен!

Re: Новый, уникальный определитель растений

Отправил.

Re: Новый, уникальный определитель растений

Дмитрий, большое спасибо!
Подскажите ещё, пожалуйста... Вот, если посмотреть ботанические описания на разных сайтах, окажется, что часто используются слегка отличающиеся признаки. К примеру, в каких-то используется 8 различных форм листа (https://ds02.infourok.ru/uploads/ex/065 … 82f709.jpg), в каких-то - десяток (https://ds03.infourok.ru/uploads/ex/07b … /img13.jpg), в каких-то - четыре десятка (http://klass.photolandiya.ru/img-q5y5x5 … _01_cc.jpg).
Так как для определителя желательно, чтобы пользователи одинаково выбирали ответ, они должны одинаково представлять себе признак.
Отсюда вопрос: из какого источника были взяты описания признаков, использованные в определителе плантариума (find.html)? У некоторых признаков, я видел, можно перейти по ссылке "Объяснить признак". У некоторых признаков объяснения нет. Можно ли где-то найти описание всех использованных признаков? В частности, описание типов опушений?

Re: Новый, уникальный определитель растений

При выборе набора признаков для определителя придумали упрощённую схему, которая (как предполагается) должна быть понятна большинству. То же касается типов опушения - мне кажется, там вопросов быть не должно. Что конкретно непонятно?

Михаил Пелёвин пишет:

чтобы пользователи одинаково выбирали ответ, они должны одинаково представлять себе признак

Боюсь, до такого состояния пользователей не доживём big_smile

Re: Новый, уникальный определитель растений

Ну вот я, как человек далёкий от ботаники, могу предположить следующий смысл типов опушений:
рассеяное - в среднем, растояние между соседними волосками больше 1 мм;
густое - в среднем, растояние между соседними волосками меньше 1 мм;
войлочное - настолько "густое", что даже поверхности под опушением не видно;
жёсткое - невозможно сжать пальцами (больно);
мягкое или шелковистое - можно сжать пальцами (не больно);
оттопыренное - волоски перпендикулярны поверхности;
прижатое - кончики волосков параллельны поверхности;
курчавое - волоски завиваются кольцами;
железистое - нет предположений.
Всё так или не совсем?

Re: Новый, уникальный определитель растений

Михаил, всё гораздо хуже. Хотя некоторые определения мне лично нравятся smile

Re: Новый, уникальный определитель растений

Михаил Пелёвин пишет:

железистое - нет предположений

Железистое - это когда на вершине волоска "капелька" есть) Но тут редко без лупы обойтись можно.