Как (не)работает нейронная сеть, узнающая растения?

Если вы владеете английским, то многие важные детали можете прочитать здесь:
https://www.inaturalist.org/pages/help#computer-vision

Я бы хотел отдельно остановиться на том, почему среди предложений нет каких-то самых обычных видов.

Итак, формально нужно 100 фотографий (не наблюдений) вида, половина из которых подтверждена и имеет исследовательский уровень. Это "входной билетик" для того, чтобы вид стал участвовать в визуальном определении.

Однако модели пересчитываются нечасто, поскольку на это нужны многомесячные усилия суперкомпьютеров. Насколько я понял, последний раз модели были выпущены в самом начале лета. Это не очень хорошая новость, поскольку именно летом 2019 года количество загружаемых на iNat фотографий стало расти по экспоненте. Это означает, что следующий пересчет моделей (который, по-видимому, уже начат), с одной стороны не будет использовать всё, что загружено нами летом, а, с другой стороны, займет неопределенно долгое время.

В любом случае, многие виды флоры Крыма, Кавказа, юга Сибири, Якутии, Арктики и Дальнего Востока пока просто не накопили 100 фотографий. Для этого нужны, прежде всего, наши коллективные усилия как в качестве наблюдателей, так и в качестве "послов" iNaturalist, которые рассказывают о нем друзьям, коллегам и знакомым.

В европейской части и на равнинах Западной Сибири дела обстоят лучше, поскольку эти же виды регулярно фотографируют в Великобритании, Германии, Франции и других активных странах Европы. А значит и машина предлагает правильные растения чаще.

Не забывайте, что функция "Встречен поблизости", которая иногда добавляется к предложенным видам, срабатывает только, если ближайшая находка сделана не более, чем в 100 км, а значит для многих обширных регионов нашей страны зачастую недоступна. Так что и здесь нам еще работать и работать.

Но: прогресс неизбежен. Очень рекомендую вот это интервью идеолога компьютерного распознавания всего на свете, в т.ч. живых организмов на iNaturalist итальянца Пьетро Пероны (https://vk.com/wall-134484155_2241 ).

Posted on August 19, 2019 09:41 AM by apseregin apseregin

Comments

по сравнению с прошлым годом прогресс очень заметен

Posted by katerina_kashirina over 4 years ago

В начале весны iNat определял грушанки на моих старых снимках как любку; летом проблем с этим уже не было.
В течение лета подбрасывал Myrrhis odorata, Juglans mandshurica (по 41 наблюдению) и Helianthus subcanescens (19 наблюдений); до сих пор нейронной сетью эти виды не определяются, видимо, придётся ждать очередного "переосмысления" данных суперкомпьютерами.
Некоторые виды (в первую очередь это касается грибов) определяются при несопоставимо меньшем числе наблюдений, чем даже половина от 100; видимо, раньше входной порог был гораздо ниже.
Если имеет значение количество фотоснимков, то везде в верхней полосе со статистическими данными к линейке "Наблюдения"/"Вид"/"Эксперты"/"Наблюдатели" необходимо добавить "Фотоснимки" (т.е. кол-во снимков для данной выборки).
Как быть с такими видами, как нередко встречающийся Rhytidiadelphus subpinnatus (7 наблюдений) или растущий чуть не на каждом стволе Stereodon pallescens (2 наблюдения) - они многие годы так и будут игнорироваться сетью?
Когда будет очередной пересчёт данных?

Posted by eduard_garin over 4 years ago

Add a Comment

Sign In or Sign Up to add comments