Предлагаю не чистить от трудно распознаваемых изображений, а имея уже статистику в каких изображениях сколько ошибок допускают в среднем все сети, натренировать сетку по предсказанию трудности распознавания изображения и выводить в дальнейшим этот показатель при анализе сеток. Будет хорошо видно отклонение в ошибках сетей, т.е. некую грубость ошибки.
Спасибо за ваше мнение. Я немного проясню что планирую сделать. Бывают изображения, которые по разным причинам невозможно правильно распознать. Подавляющее большинство ошибок вызывает одна и та же техника, но с разным модулем вооружения. Например Ifrit hmg и Ifrit gmg, или Hunter hmg и Hunter gmg. У них есть 2 проблемы: 1. либо угол съёмки либо чем-то перекрыта пушка. Т.е. человек сам не может отличить 2 класса. 2. Из-за удаления транспорта от места съёмки, да ещё и последующее сжатие до 224 пикселей много таких изображений теряют информацию о пушке. Её просто не видно, На изображении выглядит, что как будто нет вообще пушки. И я планирую дополнить датасет информацией о том, можно ли распознать тип оружия. Но скорее всего объединю классы, где очень сложно распознать тип оружия. И получатся классы "вооружённый" либо не "вооружённый". А вот дальше, когда я буду уверен в датасете, то обучу все модели и посмотрю на каких изображениях буду получать ошибки, для каждой модели. Может окажется, что одни модели лучше справляются с одним типом изображений, а другие с другими. Ко всему прочему датасет будет расширен. У меня уже есть ещё более 10 размеченных классов. Но я их не ввожу, так как придётся повторно обучать все модели, чтобы получить статистику. Пока этого делать не хочется, а потом сделаю. Осталось рассмотреть всего 7 моделей, которые остались в PyTorch для задачи классификации.
Спасибо за лайки. И спасибо за идеи. Датасет почищу, вот только есть ещё одна проблема. Дело в том, что разные сети нужно обучать с разными параметрами, чтобы добиться наилучших результатов. И чтобы найти эти параметры придётся повозиться. Ну это буду потом решать.
Предлагаю не чистить от трудно распознаваемых изображений, а имея уже статистику в каких изображениях сколько ошибок допускают в среднем все сети, натренировать сетку по предсказанию трудности распознавания изображения и выводить в дальнейшим этот показатель при анализе сеток. Будет хорошо видно отклонение в ошибках сетей, т.е. некую грубость ошибки.
Спасибо за ваше мнение. Я немного проясню что планирую сделать. Бывают изображения, которые по разным причинам невозможно правильно распознать. Подавляющее большинство ошибок вызывает одна и та же техника, но с разным модулем вооружения. Например Ifrit hmg и Ifrit gmg, или Hunter hmg и Hunter gmg. У них есть 2 проблемы:
1. либо угол съёмки либо чем-то перекрыта пушка. Т.е. человек сам не может отличить 2 класса.
2. Из-за удаления транспорта от места съёмки, да ещё и последующее сжатие до 224 пикселей много таких изображений теряют информацию о пушке. Её просто не видно, На изображении выглядит, что как будто нет вообще пушки.
И я планирую дополнить датасет информацией о том, можно ли распознать тип оружия. Но скорее всего объединю классы, где очень сложно распознать тип оружия. И получатся классы "вооружённый" либо не "вооружённый".
А вот дальше, когда я буду уверен в датасете, то обучу все модели и посмотрю на каких изображениях буду получать ошибки, для каждой модели. Может окажется, что одни модели лучше справляются с одним типом изображений, а другие с другими.
Ко всему прочему датасет будет расширен. У меня уже есть ещё более 10 размеченных классов. Но я их не ввожу, так как придётся повторно обучать все модели, чтобы получить статистику. Пока этого делать не хочется, а потом сделаю. Осталось рассмотреть всего 7 моделей, которые остались в PyTorch для задачи классификации.
Хм, странно, поставил лайк, а счетчик лайков все ровно 0.
Хорошая идея очистить датасет трудных картинок и обучить сетки заново.
Спасибо за лайки. И спасибо за идеи.
Датасет почищу, вот только есть ещё одна проблема. Дело в том, что разные сети нужно обучать с разными параметрами, чтобы добиться наилучших результатов. И чтобы найти эти параметры придётся повозиться. Ну это буду потом решать.