주인장 대답이 좀.... 잘못 되어서 수정 해드립니다... UTF-8 도 NFC Normalization 쓰면 해당되지 않음 (완성형). NFD Normalization (조합형) 으로 바꿔야 합니다... UTF-8 의 2-byte character representation 이 3바이트를 사용하기 때문에 누가 생각 안 하고 적은 댓글 기반으로 잘못 적은거 같은데.... 아니예요..... 저러면 ASCII Extended Range 에 있는 hex들만 나옵니다. (UTF-8 의 인코딩 특성상 맨 앞 비트를 1로 지정해서 1바이트보다 큰 바이트를 연속해서 표기한다고 명시함) 정확하게 하면 Array.from("김".normalize('NFD')) 정도 되겠네요. 이것도 결론적으로는 누군가 NFC -> NFD 컨버터를 만들어야 하는 상황을 만들었기 때문에.... 손쉽게 바꿀수 있다! 이건 절대 아님. 그리고 Unicode normalization 이게 꽤 부하가 심한 작업이라서.... 그냥 한글은 뭐같은 언어가 맞다!
0:06 조사 아니고 어미 조사 아니고 어미 조사 아니고 어미 조사 아니고 어미 조사 아니고 어미 조사 아니고 어미 조사 아니고 어미 조사 아니고 어미 조사 아니고 어미 조사 아니고 어미 조사 아니고 어미 조사조사 아니고 어미 조사 아니고 어미 조사 아니고 어미 조사 아니고 어미 아니고 어미
이건사실 유니코드라는 문자체계 자체가 아스키의 확장형에 지나지않기 때문에 발생하는일임.. 사실 초/중/종성을 RGB 색상 체계처럼 3차원 데이터로 만들면 이렇게 복잡하게 처리할필요없이 연산이가능한데(물론 그것도 로마자기반 알파벳에비해 불리하긴 하지만).. 코쟁이들이 컴퓨터를 발명했고 코쟁이들한테 굳이 필요가 없었을 뿐임..
유니티 엔진에서는 폰트 아틀라스 최적화를 위해 게임에서 쓰인 글자(정확히는 글리프, glyph)만 따로 트래킹해서 저장합니다. 개발자가 텍스트 그래픽 등에 텍스트를 입력하면 실시간으로 테이블에 저장하는 등 꽤나 스마트하게 이루어집니다. 문제는 도깨비불 현상으로 인해 작성중에만 쓰이고 실제 완성된 게임에는 포함되지 않는 글자 (예: "니다" 입력 중 "닏") 가 자동으로 게임에서 사용되는 글자로 인식되는 경우가 허다하다는 점입니다. 일본어 중국어 모두 입력 과정에서는 완성된 게임에서도 보통은 쓰이는 히라가나나 영문(한어병음 입력기)를 쓰지만, 입력 과정에서 "닏" "핮" 과 같은 안 쓰이는 요상한 글자를 거치는 언어는 한글이 유일합니다. 일일히 기록에서 드랍시켜야 하고요.
난 한글 자동완성 할때 자동["ㅅ"].push("사과"); 자동["사"].push("사과"); 자동["삭"].push("사과"); 자동["사고"].push("사과"); 이런식으로 했음. 당연히 초중종성 분리기만든 뒤에 조합기(심지어 모음끼리의 조합+시프트 조합+등)만들어서 가능한 모든걸 다 키값쌍으로 만들어버림 ㅋㅋㅋㅋ. 성능 개좋아
한국인이 컴퓨터 만들었으면 괜찮다 조합형이면 괜찮다 세벌식이나 한글 전용 키보드면 괜찮다 한국어는 압축되는 언어기 때문에 좋은거라더라 초중종성 개념은 디지털과 몸에 좋다더라 등등 무책임하게 떠드는 인간들은 필수과정으로 한/영/기호 입력/삭제/수정/선택/복잘붙 되는 오토마타를 강제로 만들어보게 해야한다 그래야 그런 쌉소리를 입에 못올림
리눅스에서 한글 쓰려면 뒤저나갑니다..ㅋㅋㅋ nabi 부터 ibus에 fcitx뭐에 뭐에 일일히 테스트 해보고 안되면 아 안되는구나 한글은 포기 하고 쓰기라도 하는데, 어디서는 또 되다가 크롬에서는 안되다가 하면 삽질에 삽질에.... xwindow환경에서는 잘 출력되던게 콘솔로 나오면 ㅁㅁㅁㅁㅁ????? 이러고 있고.. 그러니 한글 지원 잘되는 윈도우를 쓰세용.
외국인이 배우기 가장 어려운 언어가 한국어. 이유가 말이 쓸데없이 다양해서 막상 배우고 한국 오면 늘 한국어 어렵다는 사람 많음. 한국어 7년이나 배운 외국인도 아직까지 한국어 맞춤법이나 문법 어렵다고 이야기할정도. 근데 우리도 늘 맞춤법이나 문법 어려워하는거 보면 수십년해도 제대로 못 익히는게 한국어가 아닌가 싶다. 참고로 한국어 다음으로 일본어가 어렵다는데 생각보다 외국인들 일본어 잘 배우더라. 한국어보다는 발음구조가 단순하고 문장구조도 한국어에 비해 그렇게 다양하지 않고 딱딱 형식대로 맞춰떨어지는게 있다보니 쉽다고함. 반대로 한국어는 형식이 없을정도로 다양해서 사실상 고립어에 가까움. 특히 유행에 따라 새로운 문장들이 창조되는데 사실상 외국인 입장에선 암호수준
맞습니다. 보통 외국인을 대상으로 한글을 가르칠 때 조사는 particle이라고 많이 합니다. 다만 (자모분해 시)"자모"는 해당하는 단어가 없어 jamo라고 많이 하고요. 자모는 consonant(자음) vowel(모음)이 아니냐 하시는 분들도 있을텐데 "아잉"을 자모분해하면 ㅇㅏㅇㅣㅇ이지만 1번 2번 ㅇ은 consonant이 아닙니다. 음가가 없거든요. 아잉의 first consonant는 놀랍게도 마지막 받침 ㅇ입니다.
분해할때 초성 과 종성도 짜증나구요 '긱' 의 초성 'ㄱ' 과 종성 'ㄱ' 은 다른 코드라서 그냥 대충 썻다간 'ㄱㅣㄱ' 이 되어버리구요 중성도 빠질수 없죠. '의' 단어를 분해하면 'ㅇㅢ' 가 남는데, 이걸 그대로 쓰실분은 상관이 없지만, 'ㅇㅡㅣ' 로 사용해야 한다면 예외처리를 해주셔야 하구요. ㅢ 뿐만이 아니라 ㅘ ㅙ ㅚ ㅝ ㅞ ㅟ 도 같이 해주셔야 하구요.
0:11 저건 조사가 아니에요 용언의 어미이지 절대 조사 아닙니다 아니 자세히 보니 어미도 아니네. 달리다를 형태소 단위로 분해하면 "달리-" + "-다" 가 됩니다. "달리-" 까지가 어긴이고 나머지 부분이 어미인데 어미에 모음 ㅣ 까지 포함하고 있네요 아이고 뒷목잡는다 문과살려~~~~~~~
서두의 한국어와 한글이 우수하다고 보는 관점은 조금 이상합니다. 자바스크립트 문법과 자바라는 언어를 두고서 둘중 무엇이 더 열등해? 우수해? 묻는 것은 조금 이상한 질문같이 들릴것입니다. 언어는 인간의 생각을 표현하며, 전달하고 기록하는 도구이고 그것이 얼마나 효율적이고 적확하게 기능할 수 있는지에 대해 이야기하는 것이 더 중요할 것입니다.
0:21 울라리는 없어 울라리는 없어 울라리는 없어 울라리는 없어 울라리는 없어 울라리는 없어 울라리는 없어 울라리는 없어 울라리는 없어 울라리는 없어 울라리는 없어 울라리는 없어 울라리는 없어 울라리는 없어 울라리는 없어 울라리는 없어 울라리는 없어 울라리는 없어 울라리는 없어 울라리는 없어 울라리는 없어 울라리는 없어 울라리는 없어 울라리는 없어 울라리는 없어 울라리는 없어 울라리는 없어 울라리는 없어 울라리는 없어 울라리는 없어 울라리는 없어 울라리는 없어
consonant 쪽이 오히려 부정확한 표현입니다. "이웃"의 first/initial consonants는 ㅇㅇ이 아닌 nullㅅ입니다. 초성 ㅇ은 음가가 없어 엄밀히 따지면 consonant이 아니기 때문에 initial consonant도 잘못된 표현이 되는 것입니다.
추가 : new TextEncoder().encode("김") 등 사용해서 utf-8 바이트로 인코딩하면 각 자음모음 쉽게 분리가능합니다
뭐야 왜 갑자기 댓글이 생겼죠?
항상 영상 잘 보고 있습니다! 감사합니다 :)
제 댓글은 좋아요 누르지 말아주세요
영상을 무력화 시키는 댓글 1줄
귀찮게 구현할필요없이 utf8로 바꾸면 된다
주인장 대답이 좀.... 잘못 되어서 수정 해드립니다...
UTF-8 도 NFC Normalization 쓰면 해당되지 않음 (완성형). NFD Normalization (조합형) 으로 바꿔야 합니다...
UTF-8 의 2-byte character representation 이 3바이트를 사용하기 때문에 누가 생각 안 하고 적은 댓글 기반으로 잘못 적은거 같은데.... 아니예요.....
저러면 ASCII Extended Range 에 있는 hex들만 나옵니다. (UTF-8 의 인코딩 특성상 맨 앞 비트를 1로 지정해서 1바이트보다 큰 바이트를 연속해서 표기한다고 명시함)
정확하게 하면 Array.from("김".normalize('NFD')) 정도 되겠네요.
이것도 결론적으로는 누군가 NFC -> NFD 컨버터를 만들어야 하는 상황을 만들었기 때문에.... 손쉽게 바꿀수 있다! 이건 절대 아님.
그리고 Unicode normalization 이게 꽤 부하가 심한 작업이라서.... 그냥 한글은 뭐같은 언어가 맞다!
0:06 조사 아니고 어미 조사 아니고 어미 조사 아니고 어미 조사 아니고 어미 조사 아니고 어미 조사 아니고 어미 조사 아니고 어미 조사 아니고 어미 조사 아니고 어미 조사 아니고 어미 조사 아니고 어미 조사조사 아니고 어미 조사 아니고 어미 조사 아니고 어미 조사 아니고 어미 아니고 어미
개추 ㅋㅋㅋ
어미가 있네
종결어미
아 ㅋㅋㅋ 뒤에 붙는거면 다 조사라고
html로 프로그래밍하느라 힘드셨나보네요~
"한글은 디지털에 최적화된 문자"
이 말 만든 사람한테 보여줘야할 영상
최적화되긴 했네 욕먹기
진짜 한글 디지털 최적화설은 어디서 나온건지 모르겠음 ㄹㅇ
뭘 최적화야 물리적으로 용량도 더먹고(알파벳 대비 개수부터가 많으니까) 조합형이니 완성형이니 하며 구현하기도 힘들었는데
그나마 한자보단 낫다고 해도, 결코 최적화된 문자가 아닌데
이건사실 유니코드라는 문자체계 자체가 아스키의 확장형에 지나지않기 때문에 발생하는일임..
사실 초/중/종성을 RGB 색상 체계처럼 3차원 데이터로 만들면 이렇게 복잡하게 처리할필요없이 연산이가능한데(물론 그것도 로마자기반 알파벳에비해 불리하긴 하지만).. 코쟁이들이 컴퓨터를 발명했고 코쟁이들한테 굳이 필요가 없었을 뿐임..
키보드에서 입력하기 편하다는말 아녔나 아님말구
디지털 최적화 된 언어 = 영어
아거 말고 없음
국립국어원 웹프로젝트 몇 개 담당하고 있는데 썸네일 보자마자 눈물이 왈칵 쏟아졌습니다...
괜찮읎싮늭꽔?
@@songbird345 읽힌다 ㄷㄷㄷㄷ
ㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋ
@@songbird345악마야..
0:22 선넘네
설마설마 했는데!!
ㄹㅇㅋㅋ 당연히 울트라 아님?
ㅋㅋ 일부러 울트라만 가려놨네
히라리 뮤라리 히히
sudo kill @@민인-o2x
한글 폰트 디자인할 때 11,172자를 몽땅 디자인하지 않고요, 샘플 문장을 디자인해 입력하면 그걸 분해해서 나머지 글자를 자동으로 생성하는 프로그램이 있습니다. 한자는 얄짤없고요 ㅎㅎ
그나마 다행이네요...ㅋㅋㅋ
그래서 가끔 특정폰트에서 특정 글자가 잘못 나오군요...
ㅋㅋㅋㅋㅋ아니 이분 글에서 주인장말투가 느껴져서 뜬금없이 웃김
손글씨 폰트라면 샘플 문장 스캔해서 만들어도, 벡터로 디자인 할때는 1만개 전부는 아니더라도 초•중•종성 모양에 맞는 낱자를 직접 제작하진 않나요?
한자도 조합이 많아서 어느 정도는 할 수 있을 거 같은데 인쁘라가 부족한가보네
코딩애플 대머리
뻘하게 웃기네 ㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋ
사실적시 명예훼손으로 고소당할 댓글입니다
개추ㅋㅋ
ㅋㄷㅇㅍ ㄷㅁㄹ
코딩코딩자라나라
울라리까지는 이해 하겠는데 고글링은 진짜 ㅆ ㅋㅋㅋㅋㅋㅋㅋㅋㅋ
할배들 피꺼솟
울라리를 이해한다고?
걍 울트라 라고 하지 뭘 울라리여 울랄라도 아니고
@@mbc-official 히드라리스크 -> 히드라 / 뮤탈리스크 ->뮤탈 / 울트라리스크 -> 울트라 이렇게 쓰지 않나요?? 나만 이렇게 썼나
@@mbc-official 엥 ㅋㅋㅋ 히라리 뮤라리 ㅋㅋㅋㅋㅋ
자연어 처리 공부하다가 왜 이쪽 분야 사람들이 다 미국 가는지 알게됨
시장은 코딱지만한데 난이도만 너무 높음...
VR 한글키보드 만들다 한글 ㅅㅂ를 부르짖었습니다
세종대왕님 죄송합니다 ㅠㅠ
한글을 만든다는게 졸라 빡세구나를 간접적으로 경험해봤습니다
비슷한 경험을 했군요 ㅋㅋㅋㅋㅋ
게임용 한글 키보드 구현하면서 알파벳 및 알파벳 변형체계인 나라가 부러워 졌습니다
0:15 달룟은 뭐야 ㅋㅋㅋㅋㅋ
아ㅋㅋ 말이 안되도 조합만 된다면 문제 없는거라고 ㅋㅋㅋㅋ
옵빠달룟
달룟 !!!!
달룟!!!!
es한글을 보니 예전에 tossi라는 라이브러리를 본 기억이 나네요. 그것도 조사 자동으로 맞춰주는 라이브러리였는데...
개발할 때 한글/한국어의 특성은 정말 까다롭고 번거롭네요
개발자래서 실컷 비웃어주러 왔다가 글꼴디자인 이야기를 보고 울고감
2024년에도 보는사람?
2034년에서 왔습니다
ㅋㅋㅋㅋㅋㅋㅋㅋ
??
??
오랜만에 보러 왔는데 추억이네요
개발할 때마다 영어(을)를 모국어로 쓰는 사람(가)이 부러울 때가 많다.
진짜 미친건가 ㅋㅋㅋㅋㅋㅋㅋ
다시봐도 한글 디지털 최적화설은 진짜 어떤놈 대가리에서 나온건지
뭐 자판 입력에 한해서는 맞는 말이긴 하죠. 옆나라들처럼 한자랑 오십음도 꾸겨넣으려고 영어-변환 작업을 계속 우겨넣는 것보다는 그냥 초중종성 피아노치듯이 나열하는게 편한건 사실이니. 물론 그걸 데이터상으로 모아쓰기하는 것은 프로그래머가 알아서 하시라는게....
사용자의 입장에서 최적화 맞습니다. 초성검색도 영어라면 꿈도 못 꿀 능력이죠.가능성을 검색하는데 글 다 안치고 ㄱㄴㅅ 세번타이핑으로 검색할 수 있는 문자가 어디있습니까? 개발자야 대가리 깨지는 일인데 사용자 입장에선 너무나도 편리한 기능입니다.
ㄹㅇ 한글이 예전에는 효율적인 문자였지만 정보화 시대에서 효율적이라고 하기엔 힘든 듯..
물론 최악의 JOAT는 한자고..
3:17 사람이름이냐고ㅋㅋㅋㅋㅋㅋㅋㅋㅋ
규식이가 왜 기기서 나와?
자매품으로 이동식씨도 있습니다
이거 산업용 장비 만들 때 내가 키보드 기능 구현해서 직접 고생하며 해결하고 겪었던 문제인데 진짜 성가셨음 ㅋㅋㅋ 초성검색부터 해서 다 내가 한것들이네. 저거 모르면 고생하는데 이거 미리 이렇게 보고 배운 사람들은 진짜 무료 지식 편하게 배운거임
울라리는 처음듣네 ㅋㅋㅋㅋ 나무위키 검색된건 자동으로 울트라리스크로 해석된게 아닌 문서내에 울라리가 있어서가 아닌가?
수컷 울트라리스크가 뭔지 아세요?
사나이 울리는
농심 신라면~
😂😂😂😂😂😂
ㄹㅇ 당연히 울리인데 ㅋㅋ
@@WangJaeLee 뭣
우린 그냥 울트라 라고 부럸는데
울리
울라리 저거 한창 스타하던 사람들 열받으라고 울라리라고 일부로 쓰는 밈이 있었어요
울리가 맞죠 😂
울트라 아님?
울라리도 몇달동안 보니까 이제 익숙해졌어
@@acorn-repository 뮤리 히리
울라리
뭐? 울라리?
미사카 미코토 공부법으로 시험 100점 맞자?
울크스
2024수능 사회탐구 영역도 올려줘요
영상 만들어와!
코딩 이제 안하는데도 이 채널은 계속 봄 ㅋㅋ
경제적 자유를 얻으신건가요 아니면 경제적 체무를 얻으신 건가요?
@@zyxwvutsrqpon_lk_ihgfedcba 저도 ㅋㅋㅋㅋ
치킨집 차리셨나요?
@@Osmanthus_Nostalgia 둘다 아닐수도 있을듯 걍 단순한 직업변경
유니티 엔진에서는 폰트 아틀라스 최적화를 위해 게임에서 쓰인 글자(정확히는 글리프, glyph)만 따로 트래킹해서 저장합니다. 개발자가 텍스트 그래픽 등에 텍스트를 입력하면 실시간으로 테이블에 저장하는 등 꽤나 스마트하게 이루어집니다. 문제는 도깨비불 현상으로 인해 작성중에만 쓰이고 실제 완성된 게임에는 포함되지 않는 글자 (예: "니다" 입력 중 "닏") 가 자동으로 게임에서 사용되는 글자로 인식되는 경우가 허다하다는 점입니다. 일본어 중국어 모두 입력 과정에서는 완성된 게임에서도 보통은 쓰이는 히라가나나 영문(한어병음 입력기)를 쓰지만, 입력 과정에서 "닏" "핮" 과 같은 안 쓰이는 요상한 글자를 거치는 언어는 한글이 유일합니다. 일일히 기록에서 드랍시켜야 하고요.
한글이 누가 정보화시대에 유리하다고한지모르겠음.. 폰트만해도 메모리 2~30메가씩 먹어서 알파벳몇개에숫자정도만쓰면되는 영어에 비해 압도적으로 불리해요
난 한글 자동완성 할때
자동["ㅅ"].push("사과");
자동["사"].push("사과");
자동["삭"].push("사과");
자동["사고"].push("사과");
이런식으로 했음. 당연히 초중종성 분리기만든 뒤에 조합기(심지어 모음끼리의 조합+시프트 조합+등)만들어서 가능한 모든걸 다 키값쌍으로 만들어버림 ㅋㅋㅋㅋ. 성능 개좋아
그냥 때려박는게 제일 간단하긴 함 ㅋㅋㅋ
아니 성능은 좋겠지 ㅋㅋㅋ 메모리가 장난 아닐듯
@@hardingstudy ㄹㅇㅋㅋ 검색할거 많을때는 다른 방법이 좋을듯 함
트라이라는게 있습니다
5:04 죠사 핔컬 개웃기네 ㅅㅂ ㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋ
조사삐까 ㅋㅋㅋㅋㅋ
ㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋ
유니코드로 뽑은 다음 자음 모음수로 나눠서 나머지값으로 계산하는법이 있었던거 같우데
네 맞아요 초성 비교라면 앞에 비트 몇 개만 비교해주면 됩니다. 영상에 나오겠지 했는데 안나오네요.
나두 유니코드로 해서 해결했는데..
1:28 개웃기네 ㅋㅋㅋㅋ
토스... 고맙다 잘쓸게...
챗지피티한테 질문할 때 한,영 바꾸기 귀찮아서.. 영어로 치면 한글 키보드 기준에 맞게 변환해서 읽으라했는데
완전 학대였구나.. 미안해 지피티야
한국인이 컴퓨터 만들었으면 괜찮다
조합형이면 괜찮다
세벌식이나 한글 전용 키보드면 괜찮다
한국어는 압축되는 언어기 때문에 좋은거라더라
초중종성 개념은 디지털과 몸에 좋다더라
등등 무책임하게 떠드는 인간들은
필수과정으로 한/영/기호 입력/삭제/수정/선택/복잘붙 되는 오토마타를 강제로 만들어보게 해야한다
그래야 그런 쌉소리를 입에 못올림
진짜 잘한다 ~ . 옛날에 노가다 했는데 와 ~ .. 이런건 몰랐네 , 역시 치킨집이 내 적성이야 ㅋㅋ
세종대왕도 별표 누른다는 생각은 도대체 어떻게 나오는거냐ㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋ
5:11 뜬금없이 세종대왕 필승코리아 튀어나와서 개터졌네 ㅋㅋㅋㅋㅋㅋ
임베디드에서 한글 쓰려면 대가리가 터짐..... 폰트 어떻게 우겨넣을건데, IME는 왜 내가 만들어야 하는건데
와중에 고글링투표한거보소 ㅋㅋㅋㅋㅋㅋㅋㅋ
최근에 엉어를 한글로 입력한 경우 영어로 바꿔주는거 만들려는데 간단해보이는데 생각보다 어렵더라고요... 한글을 실수로 영어로 입력한경우 수정해주는건 라이브러리 많던데
가장 우수한 문자는 알파벳이 맞다
리눅스에서 한글 쓰려면 뒤저나갑니다..ㅋㅋㅋ
nabi 부터 ibus에 fcitx뭐에 뭐에 일일히 테스트 해보고 안되면 아 안되는구나 한글은 포기 하고 쓰기라도 하는데,
어디서는 또 되다가 크롬에서는 안되다가 하면 삽질에 삽질에....
xwindow환경에서는 잘 출력되던게 콘솔로 나오면 ㅁㅁㅁㅁㅁ????? 이러고 있고..
그러니 한글 지원 잘되는 윈도우를 쓰세용.
유명한 배포판에선 잘 못들어본것 같은데
navi랑 fcitx같은것도 있었군여
고1때였나 교과서에 한글은 컴퓨터 프로그램 만드는데 가장 알맞는 문자라고 써놓은거 보고 얼탱이 없었던적 있었음
ㄹㅇ 희대의 개소리 ㅋㅋ
모바일 사용자 입장에서 편하긴 한데 프로그램 만들때는 한자보다는 좋지만 알파벳보다 훨 안좋음
초성검색의 구현방법은 항상 궁금했던 내용이었는데, 재미있게 아주 잘 설명해 주셔서 궁금이 잘 풀렸습니다. 정말 감사합니다. 다른 영상들도 흥미롭네요.
알파벳은 시장에서 하나하나 장봐서 요리만드는거라면 한글은 밀키트같은거네요
한글은 양파 쓰려면 스테이크 밀키트에서 고기 버리고 양파만 빼와야함
알파벳은 마트마냥 재료가 하나하나 다 따로 진열되어 있지만 한글은 완성된 요리에서 특정 재료만 추출해야하는느낌?
어린 백성도 10시간 만에 글을 깨우치게 만드셨으나, 성리학도 안 통하는 기계를 벌하기 위한 세종대왕님의 명안 ㄷㄷ
오늘도 원어가 영어인 외국인들이 정밀 부럽다
한국어의 우수성은 모르겠고 그냥 영어가 최고다
그래도... 사랑하시죠..?
NO. 😊
그지같은 LunarDate얘기도 부탁드립니다. 중국이랑 한시간 차이나서 작년 석가탄신일이 하루가 바뀌어버렸죠.
자연어처리 하는 사람입니다
한글 최고예요 덕분에 먹고살아요
감사합니다 킹갓세종대왕님
ㄹㅇ 디지털상에서 뭐 할때마다 영어 마려움... 검색할때도, 코딩할때도 한글만 끼면 걍 전부 개판됨
나는 이 말을 매우 좋아합니다.
"사용자가 웃으면, 개발자는 운다."
한글폰트 저작권 걸린다고 난리쳐서 폰트 두개 만들다 뒤질뻔했던거 생각나네요
5:12 세종대왕이 한글을 만든 이유:한국어가 한자에 부적합해서 한국어에 적합한 새로운 글자를 만듦.
오늘도 너무 멋진 내용 감사하니다. 2부 너무 기...없구나;;
0:24 악의적 편집에 속지 마십시요 여러분... 울트라가 76% 입니다.... 울라리 아니야~~~~~~~~~~~~~~~ㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋ
딩애님 영상 잘 봤습니다.
저그충 긁혔네
코플님 영상 잘 봤습니다.
딩요애미ㄷㄷ
오~ 필승 코리아 개웃기네 ㅋㅋㅋ
자바스크립트로 키 자판 만들다가 검색하며 배운 것들이 나오니 반갑네요
세종대왕님이 별표찍는다에서 빵터졌네 ㅋㅋㅋㅋㅋㅋ
0:26 왜 대놓고 주작을 하십니까
ㅋㅋ 진짜 재밌게 만드시네요
3:54 왜 시비임?
TMI: 언어학 용어를 빌려와 chosung 대신 onset을 이용할 수 있다 (둘이 완전히 같은 의미는 아니지만)
외국인이 배우기 가장 어려운 언어가 한국어. 이유가 말이 쓸데없이 다양해서 막상 배우고 한국 오면 늘 한국어 어렵다는 사람 많음. 한국어 7년이나 배운 외국인도 아직까지 한국어 맞춤법이나 문법 어렵다고 이야기할정도. 근데 우리도 늘 맞춤법이나 문법 어려워하는거 보면 수십년해도 제대로 못 익히는게 한국어가 아닌가 싶다.
참고로 한국어 다음으로 일본어가 어렵다는데 생각보다 외국인들 일본어 잘 배우더라. 한국어보다는 발음구조가 단순하고 문장구조도 한국어에 비해 그렇게 다양하지 않고 딱딱 형식대로 맞춰떨어지는게 있다보니 쉽다고함. 반대로 한국어는 형식이 없을정도로 다양해서 사실상 고립어에 가까움. 특히 유행에 따라 새로운 문장들이 창조되는데 사실상 외국인 입장에선 암호수준
코딩애플만 기다렸다면 믿어 줄래?
콰욱
쌌지만 또 싼다!
유니코드 한글 자모(확장 제외)
초성 :
ᄀᄁᄂᄃᄄᄅᄆᄇᄈᄉᄊᄋᄌᄍᄎᄏᄐᄑᄒ
ᄓᄔᄕᄖᄗᄘᄙᄚᄛᄜᄝᄞᄟᄠᄡᄢᄣᄤᄥ
ᄦᄧᄨᄩᄪᄫᄬᄭᄮᄯᄰᄱᄲᄳᄴᄵᄶᄷᄸ
ᄹᄺᄻᄼᄽᄾᄿᅀᅁᅂᅃᅄᅅᅆᅇᅈᅉᅊᅋ
ᅌᅍᅎᅏᅐᅑᅒᅓᅔᅕᅖᅗᅘᅙᅚᅛᅜᅝᅞ
중성 :
ᅡᅢᅣᅤᅥᅦᅧᅨᅩᅪᅫᅬᅭᅮᅯᅰᅱᅲᅳᅴᅵ
ᅶᅷᅸᅹᅺᅻᅼᅽᅾᅿᆀᆁᆂᆃᆄᆅᆆᆇᆈᆉᆊ
ᆋᆌᆍᆎᆏᆐᆑᆒᆓᆔᆕᆖᆗᆘᆙᆚᆛᆜᆝᆞᆟ
ᆠᆡᆢᆣᆤᆥᆦᆧ
종성 :
ᆨᆩᆪᆫᆬᆭᆮᆯᆰᆱᆲᆳᆴᆵᆶᆷᆸᆹᆺᆻᆼᆽᆾᆿᇀᇁᇂ
ᇃᇄᇅᇆᇇᇈᇉᇊᇋᇌᇍᇎᇏᇐᇑᇒᇓᇔᇕᇖᇗᇘᇙᇚᇛᇜᇝ
ᇞᇟᇠᇡᇢᇣᇤᇥᇦᇧᇨᇩᇪᇫᇬᇭᇮᇯᇰᇱᇲᇳᇴᇵᇶᇷᇸ
ᇹᇺᇻᇼᇽᇾᇿ
ᇯ?
아니 중세국어는 왜 있는거지ㅋㅋㅋㅋㅋ
조사는 보통 영어로 particle이라 하고 초성 중성 종성은 보통 initial medial final로 쓰지 않나요...?
뭐로 부르든 간 영어가 익숙 하지 않으니 코드 보는 사람 입장에서 편하라고 그냥 코드 변수를 chosung 이런식으로 바꿨다가 핵심 아닐까용
예를 들어서 getFinal이란걸 만들었다고 하면, 이게 종성을 갖고오는건지 어떤 물건의 마지막 버전을 갖고오는건지 뭘 갖고오는건지 모르잔슴
한글표현을 굳이 영어용 표현으로 써서 다시 한국어로 해석해와 사용해야할 필요가.. 😅
맞습니다. 보통 외국인을 대상으로 한글을 가르칠 때 조사는 particle이라고 많이 합니다. 다만 (자모분해 시)"자모"는 해당하는 단어가 없어 jamo라고 많이 하고요. 자모는 consonant(자음) vowel(모음)이 아니냐 하시는 분들도 있을텐데 "아잉"을 자모분해하면 ㅇㅏㅇㅣㅇ이지만 1번 2번 ㅇ은 consonant이 아닙니다. 음가가 없거든요. 아잉의 first consonant는 놀랍게도 마지막 받침 ㅇ입니다.
토쓰 한글 라이브러리 잘 쓰고 있음돠
분해할때 초성 과 종성도 짜증나구요
'긱' 의 초성 'ㄱ' 과 종성 'ㄱ' 은 다른 코드라서 그냥 대충 썻다간 'ㄱㅣㄱ' 이 되어버리구요
중성도 빠질수 없죠.
'의' 단어를 분해하면 'ㅇㅢ' 가 남는데,
이걸 그대로 쓰실분은 상관이 없지만,
'ㅇㅡㅣ' 로 사용해야 한다면 예외처리를 해주셔야 하구요.
ㅢ 뿐만이 아니라 ㅘ ㅙ ㅚ ㅝ ㅞ ㅟ 도 같이 해주셔야 하구요.
검색엔진 솔루션 업체 다니는데 .. 검색결과에 "말모이" 가 맨앞에 와야한다고 하는데 .. 매년 나오는 신조어 ㅂㄷㅂㄷ
0:11 저건 조사가 아니에요 용언의 어미이지 절대 조사 아닙니다 아니 자세히 보니 어미도 아니네. 달리다를 형태소 단위로 분해하면 "달리-" + "-다" 가 됩니다. "달리-" 까지가 어긴이고 나머지 부분이 어미인데 어미에 모음 ㅣ 까지 포함하고 있네요 아이고 뒷목잡는다 문과살려~~~~~~~
푸스로다
서두의 한국어와 한글이 우수하다고 보는 관점은 조금 이상합니다. 자바스크립트 문법과 자바라는 언어를 두고서 둘중 무엇이 더 열등해? 우수해? 묻는 것은 조금 이상한 질문같이 들릴것입니다. 언어는 인간의 생각을 표현하며, 전달하고 기록하는 도구이고 그것이 얼마나 효율적이고 적확하게 기능할 수 있는지에 대해 이야기하는 것이 더 중요할 것입니다.
5:16 initial로 번역하면 되지 않을 까 하는 개인적안 생각입니다
포우에 챔피언검색인가 장인랭킹 검색할때는 초성도 되던데 어케한거에요? 심지어 애니 검색할때 ds 쳐도 나옴 ㅇㄴ 라서
아니 2편이 없으면 1은 왜 붙이신거죠 ㅋㅋㅋㅋㅋ
대공감하는 이유가
유저한패에도 여러번 참여해보고
기술자분들이 게임 인수분해하던 걸 보며 느낀게
한글도 참 좋긴한데 좋같게 보이더군요 ㅋㅋㅋㅋㅋㅋㅋㅋㅋ
좋고 좋같은 ㅋㅋㅋㅋㅋㅋㅋ
카는 양산형 쓰레기 유튜버랑 다르게 바로 본론으로 넘어가는게 너무 좋음
욕먹을까봐 뜬금없이 계속 한글 칭찬나오거 개웃기네 ㅋㅋ
나 아싸라 가끔 세종대왕이 원망스러움
@@껍질-l1w 한글 없다고 영어 쓰지 않았을 걸요
더 최악인 한문 쓰고 있을건데요
0:21 울라리는 없어 울라리는 없어 울라리는 없어 울라리는 없어 울라리는 없어 울라리는 없어 울라리는 없어 울라리는 없어 울라리는 없어 울라리는 없어 울라리는 없어 울라리는 없어 울라리는 없어 울라리는 없어 울라리는 없어 울라리는 없어 울라리는 없어 울라리는 없어 울라리는 없어 울라리는 없어 울라리는 없어 울라리는 없어 울라리는 없어 울라리는 없어 울라리는 없어 울라리는 없어 울라리는 없어 울라리는 없어 울라리는 없어 울라리는 없어 울라리는 없어 울라리는 없어
영어 문법을 쉽게(굴절어 ->고립어) 만들어준 고대 바이킹들한테 감사하도록 합시다. 발음과 철자가 따로 논다는 문제가 있지만...
옛날에 쓰던 조합형이 훨씬 데이터 처리면에서 합리적일 것 같은데, 왜 완성형이 표준으로 채택되었나요?
한글 폰트 마다 조합해서 합쳐진거랑 합쳐서 만드는 글자가 디자인이 달라서요
… 한글을 모든 나라에 배포하던가
…한글 너란 아이 ㅜㅜ
진짜 재밌어요
울트라가 언제부터 울라리로 된거지...
그러게요 스타를 2010년도까지밖에 안해서그런가
한글 유니코드가 19*21*28 개라서, (문자 - '가') / 28 / 21 하면 바로 초성 인덱스가 나옵니다
울라리로 줄이는거 진짜 int 자료형 최대값 만큼 화나네
5:25 initial이 있잖아...
consonant 쪽이 오히려 부정확한 표현입니다. "이웃"의 first/initial consonants는 ㅇㅇ이 아닌 nullㅅ입니다. 초성 ㅇ은 음가가 없어 엄밀히 따지면 consonant이 아니기 때문에 initial consonant도 잘못된 표현이 되는 것입니다.
나무위키 검색어는 표제어를 메인으로 두고 약어를 모두 병기하는 방식이라 검색엔진에서 약어로도 검색 가능한거..
컴퓨터가 똑똑한게 아니라 코딩해놓은 인간이 똑똑한거였구나?
한글 2편 나올때까지 숨참고 있습니ㄷ
세종대왕님이 ★표 찍습니다 ㅋㅋ
초성은 영어로 initials라고 할 수 있습니다.
저도 유니티에서 한글 검색 구현해야 해서 고생했는데 마지막에 나오는 함수명 똑같이 지은거 보고 터졌네요 ㅋㅋ
유니코드에서 cjk가 코드스페이스의 80퍼인가 잡아먹음. 한글이 개 민폐 짓함.
China Japan korea임?
@@odyyx9e6osydyodyo75ㅇㅇ
근데 한자가 더 많을걸
유니코드 자체가 원래 그려려고 만든 물건인데...
지나가던 문과입니다. 자기전에 틀어두기 좋은 영상인거 같아요
초성검색에서 한글이 유저입장에서는
디지털에 최적화된 게 확실히 맞네요. 개발자들 고생이야 알바 아니고(도망치자)
조사를 찾기위해 조사하다가, 조사량이 너무 많아 내머리가 조사지겠다. . .
조사 알고리즘 하나 짜려다가 짜증났던 적이
게시글 댓글 크롤링해서 보면 가관입니다. 죽어라 노력해서 크롤링 글들 분석안하려고 대기업감
한글을 그냥 풀어쓰기로 만드는 수밖에 없다
지루해질뻔한 막바지에 겁나 재밌게 해놨네ㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋ
아이폰에서 한글 검색이 빈약하다는 이유가 여기서 나오는군요... 갤럭시가 잘되는 이유는 결국 엄청난 고생의 대가네요