Первый Алгоритм Для Изучения в 2024
ฝัง
- เผยแพร่เมื่อ 29 พ.ค. 2024
- Разбираем алгоритм, который поможет решать задачи на собеседованиях в крупные айти компании.
Подписывайтесь на мой Телеграм канал: t.me/saschalukin
Эта задача на Leetcode: leetcode.com/problems/longest...
00:00 Вступление
00:23 Условие
01:20 Решение перебором
03:59 Быстрое решение
06:37 Код
Создал Telegram канал, в котором рассказываю о работе в Google, подготовке к собеседованиям и жизни в Лондоне. Подписывайтесь: t.me/saschalukin
Саша, сделай уже, плз, плейлисты на канале☝🏼☝🏼 С задачами, пр. и тд. Скомпонуй видосы.
Оаоаао что это?! Метод двух указателей!
Если правильно понимаю, в некоторых случаях операции с хешем могут стремиться к O(logN)=> общее время будет приближаться к O(N*logN). Где N- длинна строки т.к. операции выполняются дважды, а размер сета в худшем случае будет N/2 (Среднее членов арифметической прогрессии(An+A1)/2). 1/2*2=1
П.с. Часа полтора потратил что бы понять что что-бы решит проблему коллизий при хешировании нам надо выделять примерно "очень много" памяти на каждый сет, установить жесткое ограничение в размере строки и используемом наборе символов а так же тратиться на сжать/разжать данные в этой строке
один из редких каналов, где разбирают и объясняют по-человечески без лишнего пафоса. жду с нетерпением каждого разбора.
Как же я долго ждал нового видео, спасибо тебе огромное! Вот бы они выходили чаще)
spasibo, Sasha za detalniy razbor. Видосы становятся все лучше и лучше по качеству, харош
Саша, привет!
Спасибо за интересное видео. Единственное, ты слегка меня запутал когда сказал, что "удаляем, пока в сете есть повторяющиеся символы" - по факту, в сете они не повторяются. Наверное, лучше было бы сказать что удаляем, пока не удалим ПОВТОРИВШИЙСЯ символ)
Саша, спасибо за разборы.
Косательно этого решения догадался про указатель `right`, что нет смысла увеличивать его, но не догадался про перемещение left.
Ура ура! С возвращением, Сань :)
Круто что ты стал записывать видео чаще))
Спасибо ОГРОМНОЕ за такой подробное объяснение, всё понятно теперь) Было бы круто увидеть подобное объяснение но про деревья))
На пробнике ЕГЭ подобная задача попадалась (24-е задание).
Решил очень похожим способом
Видео, как всегда, интересное. Благодарю за контент!
тоже сдаю егэ, как раз захотел выучить алгоритм чтобы если что использовать) да и в целом полезная вещь
но там тебе на сложность наплевать в егэ
@@romanpritkov1107 не, n^3 такие задачи не делает, либо сотню условий надо проставлять, чтобы там скипало
простой перебор можно сократить и до n^2, если просто обновлять сет после первого цикла а is_acceptable = True оставить на своём месте. ну и третий цикл можно будет убрать. На лит коде даже заработало.
Для скользящего окна вот ещё альтернатива, с помощью словаря на python:
def longest_substr(s):
answer = 0
left = 0
hash_set = {}
for right in range(len(s)):
char = s[right]
if char in hash_set and hash_set[char] >= left:
left = hash_set[char] + 1
else:
answer = max(answer, right - left + 1)
hash_set[char] = right
return answer
Спасибо за видео
Очень хорошо объясняешь, респект. Алгоритм полного перебора можно немного оптимизировать, если не перебирать тупо все подстроки, а начинать с самой большой и двигаться к уменьшению, или, если уже нашли подстроку длиной 3, рассматривать только большие, это чуть-чуть сократит затраты, но, конечно, не будет лучше, чем скользящий алгоритм.
Привет, хотел выразить тебе огромное спасибо. Посмле просмотра видео про гугл и инжерена. Мне вернулся дух программиста. Начал вести фриланс и параллельно изучаю собесы
Привет, пожалуста продолжай, очень полезно и информативно, сейчас активно пытаюсь прокачать алгоритмы и твои видосы прям то-что нужно!!!
Было интересно изучить. Главное с апреля начать
spasibo, Sasha za detalniy razbor.
Я только что решал задачу: Longest Substring Without Repeating Characters, и вуаля, тут видео на sliding window подъехало 🔥 Спасибо!
Кстати на днях сидел решал эту задачу на leetcode , и она у меня не прошла последний тест из-за Time Limit Exceeded (986 / 987 testcases passed).
Мой подход был такой - я собирал все уникальные подстроки (в отдельном методе я проверял что подстрока состоит из уникальных символов) в лист и затем с помощью компаратора сортировал по длине и возвращал длину последнего элемента
Да просто алгосы везде одинаковые +-
@@ghostlynomad7788 не мудрено, что по времени не прошел. Мало того, что собирал лист со сложностью n в квадрате, а то и n в кубе, так потом еще и добавил n*log(n) (я про сортировку). Ничего медленнее мне кажется тут уже не придумать))
@@user-ut8bs1ku5e больше ни до чего не додумался ) и да, сложность сборки листа n в кубе🙈
@@user-ut8bs1ku5e n в кубе на самом деле)
но больше ни до чего не додумался за пару дней
Спасибо, отличная подача. Без воды и смс. Успехов.
Спасибо! Эффективность ваших видео O(n)!
Отличное видео! Спасибо!
3:30 можно обойтись без флага используя такой синтаксис:
for bla bla bla:
print('Стоп')
break
else:
print('Цикл завершен без остановки')
Крутецки всё объяснил! Спасибо!
Приятно осознавать, что я бы решил подобным образом.
За Иннополис за заднем фоне превью лайк)
Очень крутое объяснение, спасибо!
Очень крутое видео, спасибо!
Избыточность в расчете answer. Его стоит пересчитывать в случае повторения буквы и последний раз когда заканчиваем всю функцию.
На асимптотику это не влияет, + можно написать контртест для которого пересчёт все равно будет происходить на каждом шаге
Да и ещё можно оптимизировать удаление из множества. Там не нужен поиск в множестве, достаточно простого сравнения символов.
@@crimfi на асимптотику не влияет, а на константу влияет
@@TurboGamasek228 можно написать тест, для которого константа не изменится, при оценке рассматриваем худший случай
Спасибо за видео! Сам около года назад сидел плотно в литкоде, задачи на скользящее окно были одними из любимых) Увидел условие, решил проверить сам себя, решу ли ее сейчас. Минут за 5 решил, не с первого раза, сначала подзабыл немного последовательность действий, пошел по неправильному пути. Оставлю тут свое решение (на js правда), оно немного отличается от решения в видео (вместо двух while у меня for и внутри него while, ну и без if/else, более линейно)
function maxLen(str) {
let maxLen = 0
let left = 0
const uniques = new Set()
for (let right = 0; right < str.length; right++) {
const current = str[right]
while(uniques.has(current)) {
uniques.delete(str[left])
left++
}
uniques.add(current)
maxLen = Math.max(maxLen, right - left + 1)
}
return maxLen
}
console.log(maxLen('axbxcxd')) // 3
какая асимптотика?
@@rof3leo O(n) по времени и памяти
Когда это два указателя стали чем-то удивительным(учусь в школе, смотрел пару записей собесов, почти в каждом были два указателя, так что думал, что это база)
Спасибо за классное объяснение, а то я когда на литкоде пыхтел над этими задачами с окном, чуть мозг не сломал, разбирая этот алгоритм
Спасибо за видео! Какие еще задачи можно решать методом скользящего окна?
Я на практике редко пользуюсь конструкцией while. В 1 проценте случаев)
Можно еще решить вот так. Решение без скользящего окна.
Хотя суть очень похожа.
fun getMaxUniqueWithSet(input: String): Int {
var maxSequence = 0
val set = mutableSetOf()
input.forEach { c ->
if (set.contains(c)) {
if (set.size > maxSequence) {
maxSequence = set.size
}
set.clear()
}
set.add(c)
}
return max(maxSequence, set.size)
}
Спасибо за видео, всё понятно
Отличное видео! Спасибо! Делай, пожалуйста, побольше такого контента на виды алгоритмов. И да, мы скучаем по Java)
Спасибо за видео! Можете пожалуйста посоветовать с чего начать изучение алгоритмов, если только только изучил основы python?
спасибо, больше разборов задач. Не подскажете, что за второй монитор у вас?
Хотелось бы больше примеров на Java ) спасибо 😊
Я конечно дико извиняюсь, но это круто и изящно! Придумал на лету тоже вариант O(n), но он немного сложнее и кушает больше памяти - на каждый индекс массива создавать отдельный сет и добавлять в него пока "дубль" символа не встретится. Метод скользящего окна намного красивее!
Это отличное объяснение, я серьёзно
Спасибо за видео.
Какой инструмент используется для демонстрации ? Очень удобно отображать скрытый код при нажатии. Сам часто делаю тех презентации и такой инструмент очень бы сильно помог, а то ливкодинг глючит )))
Было бы интересно послушать про работу различных структур данных
Отличное видео, спасибо
Подумав, решил методом похожим на скользящее окно, правда вместо указателей я бы воспользовался List(C#, System.Collections.Generic), но не уверен, что List подойдёт по оптимизации лучше и сопоставимо, чем указатели.
Спасибо за видео.
Крутое видео! А если не секрет - то чем занимаешься в гугле? Что за стек?
реализация "простого" решения убила... я даже и не подумал что так можно XD
Без лишних слов, Превосходный контент и знания! СПАСИБО!!!! Вопрос: Английский вариант названия алгоритма "метод скользящего окна" ? The Sliding window ?
Да
по моему алгоритм можно улучшить используя bitset для хранения мапы элементов и то сколько раз они встретились
Буду благодарен, если сделаете ролик с roadmap по алгоритмам и то какие задачи решать
Спасибо за видео! А что это за софт со спойлерами и где можно рисовать?
Первый раз за 10 лет в айти нашел нормально объясняющего на русском человека. Мне это конечно не пригодится, но было интересно 👍
элементарный алгоритм и первое что приходит в голову. Ну а первый вариант очевидно отвергается сразу. Я удивлён простотой.
Круто! Давно искал подобный канал с разборами задач, спасибо!
Это решение более эффективно, чем предложенное автором.
class Solution:
def lengthOfLongestSubstring(self, s: str) -> int:
d = {}
i, j = 0, 0
ans = 0
while j
Эффективно только, если рассматривать с позиции лаконичности записи. У меня словарь тоже был первой идеей из-за возможности хранить индекс по ключу символа, но что-то меня смутило и в итоге быстро переделал через сет, почти 1 в 1 как у Саши с небольшой незначительной поправкой. Реализация со словарём конечно красива, и строчек кода на две меньше, ввиду отсутствия цикла удаления ненужных ключей, но перфоманс у неё хромает. Для лучшего случая по скорости на 20% хуже сета, в среднем в 2 раза медленнее, а для худшего случая решение со словарём медленнее почти в 4 раза. Это конечно все равно и тут, и там O(N), но такая разница немного удивила. Но не привыкать, в питоне не все то, что красивее выглядит, быстрее работает, зачастую как раз наоборот.
спасибо интересный алгоритм!
Клевый способ. А можно подгонкой размеров окна подобным способом находить всякие локальные максимумы, точки перегиба и прочее на каком ть временном ряде? По скольку они там формируются в вообще произвольной периодичностью.. ))) Было бы как раз...
что-то я не понял, на 5:13 мы проверяем и удаляем символы, на которые указывает left, но в алгоритме на java на 7:53 мы проверяем в while символ, на который указывает right, а не left. почему так? объясните, пожалуйста
Кайф! Спасибо!
Я бы построчным вводом добавлял , сортировал массив и сравнивал первую и вторую позиции и как только они равны записал бы размер массива-1, а потом начинал бы со второго символа.
Изначально пришёл 2 вариант на ум, до первого даже догадаться не смог.
По времени заняло минуты 2-3.
А проверка того что буква уже в сете за проверку не считается и проходит мгновенно?
На JS:
function getLongestUniqueLength (string) {
let length = 0;
let arr = [...string.split('')];
let intermArr = [];
for (let item of arr) {
if (intermArr.includes(item)) intermArr.splice(0, intermArr.indexOf(item) + 1);
intermArr.push(item);
if (intermArr.length > length) length = intermArr.length;
}
return length;
}
спасибо за видео
Этот алгоритм напомнил мне метод указателей можно ли в данном случае его использовать?
Нормально, 24 задание ЕГЭ, поехали
Прикольно. Лайк.
Я только погружаюсь в программирование.
Будет ли полезно в первом цикле (где увеличиваем подстроку) не прогонять её по минимальным значениям а сразу увеличить на Макс. Длинну, уже записанную в сет? Так мы пропустим (в данном примере) проверку сетов cb и db.
@furtherance6042 если я тебя правильно понял, то, если ты будешь пропускать символы, тогда сет не будет хранить все символы подстроки => ты можешь не понять, что случился повтор
не понял на 5:16 говорится "удаляем пока в подстроке нету повторяющихся символов", хотя указатель на left - С и в подстроке остается С, тоесть они указывают на одинаковый символ , почему его он не удаляется как все предыдущие?
это повторяющийся символ из предыдущей подстроки, с него будет начинаться новая подстрока
О а не подскажите через что вы делаете скрытие контента а потом его появление, по клику ?
можно просто 1 раз идти по масиву и добавлять колличество уникальних елементов до первого повоторения в новий масив, потом повторять подсчет с последнего уникального елемента, а потом просто взять наибольшое число нового масива.
Интересно, конечно :)
Спасибо за видео! У меня появился вопрос касательно быстрого решения. В видео говорится, что скорость O(n), но ведь по сути мы используем два цикла, один из которых вложен. представим, что в функцию отдается строка из одинаковых символов и тогда во все итерации кроме первой будет падать во вложенный цикл. а на сколько я помню скорость считается исходя из худшего случая. Почему в этом случае скорость O(n)? буду очень благодарен за ответ!
Если исходить из худшего случая, то и set можно выкинуть, т.к. он там по добавлению будет равен O(n), а не O(1).
Возник тот же вопрос, задал его chatGPT и он ответил, что "каждый символ строки рассматривается и обрабатывается один раз либо указателем right, либо указателем left.
Вы могли записать видео про метод двух указателей?
Классное видео! А какой шрифт используется для кода?
Похож на courier new
Как насчёт хэш-сета + рекурсия или это тоже будет давать O(n^2) или O(n^3)?
О да, это очень классный алгоритм. Его еще называют методом двух указателей. Все, кто к ЕГЭ по информатике готовится, учат его, довольно эффективный и гибкий алгоритм
Приветствую, во втором случае можно немного оптимизировать решение: предположим, что есть текущая уникальная подстрока и мы нашли следующий неуникальный символ, если размер "хвоста" меньше чем размер найденной подстроки, то можно прекратить поиск и вернуть результат. Очевидно, что выигрыш невелик, но все же.
А при помощи чего ты делаешь такие презентации? Ну когда кликаешь мышкой на квадрат и там открываются значения.
Привет! Было бы круто, если бы разобрал задачу Medium from two sorted arrays. Нигде не могу найти хорошого объяснения
Первое, что пришло в голову, это то, что Вы назвали "метод скользящего окна". Я бы, наверное, это писал на компилируемом языке, если бы такое было позволено.
Я думал что stack использовать нужно. 👍
Спасибо за видео!
Немного запутанное объяснение либо такое ощущение, что какие-то кадры ошибочно вырезаны с видео. Либо плохо разобрался)
А поиск символа в сете не учитывается в асимптотике?
красавчик
А если в начале строки будет самая длинная строка, а потом она измениться, то что тогда?
Лайк👍
Цифры Пифагора. Если у треугольника длины сторон 3, 4 и 5 метров, то он -- прямоугольный. Или 6, 8 и 10 метров. И т. д. Эти волшебные цифры позволяют на местности рисовать прямые углы. Размечать местность под фундамент, например.
Для первого варянта есть гораздо проще решение:
def longest_substring(string: str
) -> int:
lenght = 0
for i in range(len(string)):
save = ''
for j in string[i:]:
if j not in save: save += j
else: break
if len(save) >= lenght: save = len(save)
return lenght
Можно улучшить данный алгоритм до О(1) по памяти, а не О(н) как в видео, использовав массив буллов, где индекс - это номер в юникоде
Неплохое объяснение, но не оценивается вставка и поиск в Set, интервьювер разве не укажет на этот момент?
Уже несколько подобных комментов тут. Что вы так ополчились на сэты, что плохого они вам сделали?
@@emptyspaces4067 "мы" это разные люди, я за себя говорю, мне стало интересно, потому что это вопрос на засыпку.
@@user-hg4ni3kr6f принято считать что работа с сетом это константа. адепты лога будут негодовать, но на деле, чтобы сет постоянно уходил в лог - это надо нехило так постараться. плюс надо точно знать, а что под капотом у данной конкретной реализации сета, вдруг там реально обычное дерево, а не хэшмап. обычно совмещают оба два сразу. ну а в данной задачке, если символы ограничены - то можно реализовать свой собственный сет, который будет абсолютной константой, к которой уже невозможно будет придраться.
@@SayXaNow ну вообще джавовский hashset это как раз О(1), насчет пайтона я не знаю. Просто это может быть вопрос на засыпку от интервьювера, стоит об этом помнить.
@@user-hg4ni3kr6f у пайтона как я знаю тоже
Cпасибо большое, но в медленном алгоритме благодаря break внутренний цикл выполняется не более 26 раз, поэтому решение всё-таки за квадрат.
В чём ты создаёшь свои анимации?
Мне кажется что первый алгоритм выполняет не n в кубе операций , а (n+n*n) /2 так как right пробегает от i до n символа, где i - положение left; у второго алгоритма максимальная скорость O(n) , а минимальная O(n*n) потому что right точно пробежит один раз строку, а left может остаться в начале (если все символы разные) или пробежать все символы (если все символы одинаковы) P. S. Укажите если не прав
Операции над set'ом же за ln(n) выполняются. Поэтому сложность с sliding window O(n*ln(n)), а без O(n^3 * ln(n))
он использовал unordered_set, где клюли хешируются за O(1)
🔥
остановил на 2:07 и мне показалось что первое очевидное решение на самом деле сложное и неочевдиным, очевидным решением для меня пробежаться по всем символам с хэшсетом накапливая его и фиксируя максимальный результат при наличии символа уже в нём, при этом сбрасывая его и возвращаясь назад на величину r-1, сча посмотри какое решение предложит автор
Неплохое решение, но вот другое - за один проход, запоминая последний индекс символа. Swift:
func lengthOfLongestSubstring(_ s: String) -> Int {
var map: [Character: Int] = [:]
var result = 0
var left = 0
for (i, c) in s.enumerated() {
if let j = map[c] {
left = max(left, j + 1)
}
result = max(result, i - left + 1)
map[c] = i
}
return result
}
Попросил ИИ переписать на АХК скрипт +вернуть саму строку:
lengthOfLongestSubstring(s, ByRef longestSubstring = ""){
map := {}
result := 0
left := 0
longestSubstring := ""
Loop, Parse, s
{
c := A_LoopField
if (map.HasKey(c)) {
left := Max(left, map[c] + 1)
}
result := Max(result, A_Index - left)
map[c] := A_Index - 1
if result
longestSubstring := SubStr(s, left, result)
}
}
return result
}
на java
public class LongestSubstringLength {
public static int lengthOfLongestSubstring(String s) {
HashMap map = new HashMap();
int result = 0;
int left = 0;
for (int i = 0; i < s.length(); i++) {
char c = s.charAt(i);
if (map.containsKey(c)) {
left = Math.max(left, map.get(c) + 1);
}
result = Math.max(result, i - left + 1);
map.put(c, i);
}
return result;
}
С мапой очень плохое решение. Используется доп память. И не забывайте о том как растет мапа - это тоже далеко не бесплатно.
на питоне бы...
Элегантное решение на Python,
max_length = 0
left = 0
seen = {}
for right, char in enumerate(s):
if char in seen:
left = max(left, seen[char] + 1)
seen[char] = right
max_length = max(max_length, right - left + 1)
return max_length
не сработает вот на этом примере "abcbad"
я когда сам решал, тоже на этом моменте спотыкался
Если хотите получить быстрее решение, юзайте биты, 256 штук достаточно. Просто ставьте в 1 разряд номер символа в таблице асик. Хеш тут не нужен. К сожалению, не знаю как на джаве. Но на си это явно быстрые, чем хеш таблица
ты описал элементарный 32байтный хэш, в котором идеальная хэш-функция занимается вычислением нужного бита.
Хочу поделиться своим решением, на момент ответа видео не досмотрел.
Сравниваем элементы с помощью бинарного дерева.
В цикле начинаем сравнивать , если элемент меньше идём в лево, если равно continue. Если след узел null то тогда записываем в дерево элемент и увеличиваем count ++.
После цикла выводим count.
У нас получится уникальное бинарное дерево, с счётчиком count.
Очень интересно, но ничего не понятно. Можно код, желательно на жабе или питоне?
Как считаешь, нужны ли алгоритмы фронтендеру на js?
нахрена?
Мне еще в голову пришло решение за O(nlogn) с помощью метода фиксированного скользящего окна и бинарного поиска)
Насколько я понимаю, удаление с начала масива очень долгое, потому что нужно создать другой масив и перекопировать все значения в него. Поэтому, когда у нас будет очень длинная подстрока, придётся много раз пересоздавать масив внутри сета.
Лучше уж после каждой итерации поставить проверку (result < right - left + 1).
Но может сет в Java работает не так как я думаю, надеюсь на отзыв.
Не пересоздается сет после удаления слева. Если не удалять - то не будет работать contains().
@@oleksandr2234 Спасибо за ответ!