Тема: полнота данных

На сегодня для Тверской области на Плантариуме имеется 1718 фотографий
http://www.plantarium.ru/page/dwellers/ … /1-65.html

Таксоны с фото (552), включая виды, гибриды и роды;
семейств, как будто , нет
http://www.plantarium.ru/page/illustrat … /1-65.html
на этой странице, кстати, указано количество фото для каждого таксона)

А вот данные литературы:
"В пределах Тверской области, зарегистрировано 894 аборигенных вида сосудистых растений (1116 с учетом микровидов и гибридов), 682 адвентивных вида сосудистых растений , 282 вида мхов, 98 видов печеночников и 527 видов лишайников." (Нотов, Зуева, Нотов, 2014)
т.е. 1576 сосудистых растений;

итак,  из примерно полутора тысяч видов произрастающих в Тверской области на Плантариуме представлена примерно треть;
наверное, некая подобная, сравнимая статистика будет и для других регионов;

вот бы получить список этих "отсутствующих видов"!

т.е. "загрузить" списки региональных флор, и получить "разницы" в виде "отчета";

фотоохота заиграет новыми красками smile !

а ведь может оказаться и  так, что на Плантариуме для региона окажется растение, отсутствующее во "Флоре"!

Re: полнота данных

Не первый раз этот вопрос поднимаем)

Re: полнота данных

Вроде того smile

Re: полнота данных

А при создании региональных списков идёт поиск только по географическим точкам или по тексту местоположения тоже?

Re: полнота данных

Если снимок не привязан к точке и не имеет координат, то вряд ли учитывается текст подписи...

Re: полнота данных

Юлия Шнер пишет:

А при создании региональных списков идёт поиск только по географическим точкам

Только по географическим точкам.

Re: полнота данных

Юрий Постников пишет:

вот бы получить список этих "отсутствующих видов"!

Для большинства регионов список окажется слишком большим для того, чтобы сервер смог сформировать его в приемлемое время, а пользователи - получить.

Re: полнота данных

Анастасия Карелина пишет:

Вроде того smile

Я свой вручную клепал, сидя с определителем...

Re: полнота данных

Станислав, Вы проделали огромную работу. Круто. Причем проделали "вручную". 860 видов.
Со временем, при увеличении количества фотографий, ряд видов из списка "придется" исключать.
Нужна ли эта работа? В чем смысл?
Ключевая вещь - желание. Желание внутри исследователя, внутри меня. Хочу - значит все, отвалите, буду заниматься. Не хочу - тоже отвалите, сами занимайтесь.
Вот эта ситуация с некоторой сложностью получения нужных списков (отчетов) из базы данных(!) - это элементы каменного века в цифровую эпоху.
Уверен, наше обозримое будущее стремительно покончит с подобными древностями.
Все, что может быть оцифровано - будет оцифровано(тм).
Некое голосовое общение с базой данных, голосовое управление базой данных. " а сделай мне, красавица(умник), вот такой отчет".
Для начала, может быть и не голосовое управление.
Мысль в том, что обычный пользователь, без программиста, сможет сам, и легко!, получать любые отчеты, какие только ему взбредут в голову, вдоль, поперек и наискосок, из имеющихся в базе данных.
Сейчас же идет процесс "накопления" данных.

Re: полнота данных

Ещё нескоро ИИ научится понимать, что от него хотят... Особенно когда сами люди ещё не всегда в состоянии озвучить, какой результат они хотят получить. Ну а на уровне доИИ всё ещё сложнее.

Re: полнота данных

Дмитрий Орешкин пишет:

Для большинства регионов список окажется слишком большим для того, чтобы сервер смог сформировать его в приемлемое время, а пользователи - получить.

сравнить два списка, 1500 строк и 500 строк, это не то что не большие, это микроскопические списки; работы для сервера на доли секунды;
я говорю не "вообще", а конкретно для Тверской области;

результат сравнения - "нулевой список";
"флора региона" - "список таксонов региона на Плантариуме" = "нулевой список";

и этот отчет может иметь формат .txt, если уж .xls настолько напрягает;  не .html;

Re: полнота данных

А главное, список будет неполным - ведь для каждого региона есть сотни фотографий не привязанных к географическим точкам. Вот если бы осуществлялся поиск по тексту, список был бы полнее. Региональные же флоры (если они существуют, далеко не для всех областей России есть достаточно свежий актуальный флористический список) все равно пришлось бы предварительно вводить вручную, поскольку даже если они и оцифрованы, то в большинстве случаев не в текстовом формате.

Re: полнота данных

Да, на "Плантариуме" в общем случае нет полных списков видов (чеклистов) по регионам.

Re: полнота данных

Совсем полных списков в принципе быть не может, потому, что всё течет и изменяется.

Re: полнота данных

Юрий Постников пишет:

Уверен, наше обозримое будущее стремительно покончит с подобными древностями

Зачем? Современные люди и так мало думают.
Нажми на кнопку - получишь результат
Чему же ты не рад?

Re: полнота данных

Анастасия Карелина пишет:

Совсем полных списков

Ну так, совсем полных и не надо, хотя бы процентов на 90 отражающих действительность)