Сеть Кохонена. Кластеризация

แชร์
ฝัง
  • เผยแพร่เมื่อ 28 ต.ค. 2024

ความคิดเห็น • 16

  • @ГузельШарипжановнаШкаберина

    Как я рада, что нашла вас!!! Очень доступно доносите информацию!!! Благодарю за ваш бесценный труд.

    • @ГузельШарипжановнаШкаберина
      @ГузельШарипжановнаШкаберина 4 ปีที่แล้ว

      Могу ли я меру близости использовать, например квадрат евклид. Расстояния?

    • @Kirsanov2011
      @Kirsanov2011  4 ปีที่แล้ว +2

      В математике много мер (еще Жордана, Лебега, Хаусдорфа...). Главное не перепутать близость и удаленность для алгоритма. Я рад, что Вы рады! Экспериментируйте. В этой науке, что ни сделаешь - все открытие. Главное - делать.

  • @serhii_chechelnytskyi
    @serhii_chechelnytskyi 4 ปีที่แล้ว +4

    Вы очень хороший учитель!

  • @zx3215
    @zx3215 3 ปีที่แล้ว +3

    Спасибо! Однозначно подписываюсь.
    Вот только мысль покоя не дает - ведь если кластеры "эволюционируют", то получается, что на выходе будем иметь совершенно новые, и их смысл может быть не совсем понятен. Например, если координаты наших векторов-кластеров выбирались по системе [скорость, масса, цена] (например, для сортировки автомобилей), и были:
    [1, 0, 0] для скоростных,
    [0, 1, 0] для тяжелых (не знаю, карьерный самосвал, к примеру) и
    [0, 0, 1] для дорогих,
    то в конце кластеры превратятся во что-то типа [0.3, 0.36, 0.6], т.е., "слегка быстрый, не очень тяжелый, но дороговатый". Т.е., получается, что новые группы (кластеры), по которым мы рассортируем машины, окажутся довольно непрактичными. Я понимаю, что это происходит по большей части из-за набора наших автомобилей, на которых мы тренируем карту Кохонена. Выбрали бы только дорогие легкие суперкары и применили те же кластеры - получили бы совершенно другой результат. Но все равно, как-то... досадно. Вот было бы здорово, если бы скормил аглоритму все свои "автомобили", а на выходе - "кластер гоночных", "кластер тяжелой техники", "кластер антикварных".....
    Хотя... может, как раз [0.2, 0.15, 0.9] и окажутся "антикварными" автомобилями. Медленные, легкие, очень дорогие.
    А еще получается, что есть вероятность того, что кластеризация будет не уникальна. Выберем другие начальные значения кластеров - можем получить какую-то иную выходную совокупность кластеров.
    Очень интересная тема. Еще раз спасибо!

  • @Tatianna-25jan
    @Tatianna-25jan 4 ปีที่แล้ว

    Замечательно! Очень подходит к кластеризации земель. На сегодняшний день готовится всесторонняя оценка стоимости земель в странах СНГ, где до сих пор не было рынка земли. Надо оценить сколько стоит земля (на продажу, для налогообложения) . Оценивается количество жителей, доходность рабочих мест, наличие коммуникаций, чистота воды, воздуха, наличие подъездных путей и пр.

  • @user-jg9ci7be5x
    @user-jg9ci7be5x 3 ปีที่แล้ว

    Огромное спасибо за Ваши видео!

  • @loctority
    @loctority 4 ปีที่แล้ว

    Вот уж нейросетевых алгоритмов здесь не ожидал увидеть. Спасибо.

    • @Kirsanov2011
      @Kirsanov2011  4 ปีที่แล้ว +3

      Посему же? Уже есть несколько в прошлые годы
      th-cam.com/video/sg8fezJYJ5E/w-d-xo.html&feature=player_detailpage
      th-cam.com/video/W7ux1RfOQeM/w-d-xo.html&feature=player_detailpage
      и др.

  • @barabaka_juchka
    @barabaka_juchka 4 ปีที่แล้ว

    Спасибо Вам! Очень интересный канал.

  • @toxanbi
    @toxanbi 4 ปีที่แล้ว +4

    Размышляя о примере с телевизорами (или вообще любыми товарами), которые классифицируются по сортам (высший, средний, худший), совсем не понятно, откуда возникает отношение порядка на множестве получившихся кластеров и почему вообще мы ожидаем, что на этом множестве какой-то порядок должен быть (а в случае сортов мы точно знаем, какой из пары сортов лучше/хуже). Интуитивно кажется, что этот алгоритм для множества телевизоров может просто найти некоторое нужное число категорий и разбить телевизоры по категориям. Но алгоритм не дает никакого однозначного способа для произвольной пары категорий (кластеров) выявить, какой лучше, а какой хуже (т.е. сравнить), а равно как и не гарантирует, что если мы и найдем способ сравнивать между собой категории, то это сравнение будет обладать транзитивностью (что необходимо для упорядочивания/ранжирования). Т.е. мы получим 3 или сколько угодно категорий, но это будут какие-то абстрактные категории, и мы не сможем сказать, какая из них лучшая, какая худшая. Алгоритм решает задачу разбиения объектов по семействам (собирая в каждом семействе элементы с максимально возможной похожестью), но совершенно не решает задачу ранжирования семейств.
    Тогда, если я правильно понял, примеры с сортами продукции или ранжированию людей по характеристикам -- неудачны. Зато разбиение людей на психоморфотипы или формирование групп с обеспечением того, чтобы в каждой группе собрались как можно более схожие друг с другом представители (что может быть полезным для минимизации конфликтов к коллективах/командах), он, по всей видимости решает хорошо. При этом мы не сможем сказать, что из полученных категорий какая-то лучше другой.
    Другой практический пример, который кажется удачным, это постеризация изображений. У нас есть изображение состоящее из пикселей, цвет каждого пикселя кодируется одним (для монохромных) или несколькими (тремя для RGB-модели, четырьмя для CMYK) скалярными значениями. Нужно передать изображение, используя палитру из ограниченного количества цветов/красок, например палитру из 8 цветов. Какие именно цвета оптиальнее выбрать?

    • @Kirsanov2011
      @Kirsanov2011  4 ปีที่แล้ว +1

      Благодарю за интересные мысли. Приму на вооружение. А людей я тоже имел в виду ранжировать не по качеству - лучше хуже (это аморально) , а именно по типам. Как расы или группы крови. Или психоморфотипы (новое для меня слово).

  • @BolotinEd
    @BolotinEd 4 ปีที่แล้ว

    круто!

  • @alexeygrom1834
    @alexeygrom1834 4 ปีที่แล้ว

    алгоритмы везде есть а вот такие простые "на пальцах" объяснения как оно работает как раз ютюбу не хватает

  • @user-yarik7778
    @user-yarik7778 4 ปีที่แล้ว

    А входов разве не 4 должно быть? Характеристики то у нас 4 а обзцов 5.

  • @Alex315101
    @Alex315101 4 ปีที่แล้ว

    Жаль что учился не в вашем вузе :-)