각별 한국어 쓰레기다 발언 논란 [2024.04.23 각별 생방송 클립]

แชร์
ฝัง
  • เผยแพร่เมื่อ 22 เม.ย. 2024
  • 프로그래밍적으로는 그렇다는 말씀이시죠 ^^ ㅎㅎ
    ㅋㅋㅋㅋㅋㅋㅋ
    태그
    ────────
    #각별
    #클립
    소개
    ────────
    주로 각별님의 생방송 중 재밌는 부분, 클립들을 업로드하고 있습니다! 이채널의 각별님과 관련한 모든 동영상의 저작권은 모두 각별님께 있으며, 영상에서 문제되는 부분 있으면 말씀해주신다면 즉시 삭제 및 수정 조치 하겠습니다!
    ‪@각별‬

ความคิดเห็น • 19

  • @furinaru
    @furinaru 3 หลายเดือนก่อน +102

    원래 한국어가 자연어 처리에 있어서 어렵긴하죠... 관련 학과 졸업생으로서 자연어 처리할때 미친언어긴함

  • @총총다못
    @총총다못 3 หลายเดือนก่อน +89

    한글은 고트 , 한국어는 쓰레기맞음

  • @twitch7610
    @twitch7610 9 วันที่ผ่านมา +25

    현 언매하는 고딩으로서 너무너무 공감됩니다 역시 각하 충성충성

  • @CDRX_4524
    @CDRX_4524 24 วันที่ผ่านมา +16

    원래 미쳐돌아감...
    말뭉치 관련해서 조금 깔짝여봤는데 미친짓 맞음...

  • @Multiply339
    @Multiply339 11 วันที่ผ่านมา +2

    찾았다 진짜 본채널

  • @Take_that_Taeik
    @Take_that_Taeik 22 วันที่ผ่านมา +10

    몇 달 동안 각님 생방 못 보고있는데 각별님 인공지능 공부하고계세요???
    또 뭘 만드시려고....

  • @user-cw5jl2ug3l
    @user-cw5jl2ug3l 6 วันที่ผ่านมา +10

    에초에 문자가 알파벳마냥 나열이 아니라 조합인것 부터 진입장벽 ㅈ됨

  • @RemoveWholeChinese
    @RemoveWholeChinese 25 วันที่ผ่านมา +29

    세종대왕: 각별 학생, F줄까?

  • @user-bu1wt1zp7t
    @user-bu1wt1zp7t หลายเดือนก่อน +6

    세종대왕 찬양이지

  • @Fiuvenn
    @Fiuvenn 3 วันที่ผ่านมา +1

    난 한글도 문제가 좀 많다고 봄 ㅇㅇ
    우리가 보기엔 한글이 되게 쉽고 간편하지만
    외국인들 입장에선 걍 아랍문자 급으로 빡센 글자일듯
    애초에 자음과 모음의 결합으로 구성된다는 점에서 걍 아랍문자랑 똑같음
    라틴문자에 익숙해진(혹은 키릴문자) 외국인들이 보기엔 꽤나 생소한 형태임.
    (문화 사대주의 ㄴㄴ... 이미 라틴문자는 아프리카 남미 동남아 인도에서도 많이 쓰임 ㅇㅇ)
    오히려 한글이 아랍문자보다 모음이 많으니 더 생소할수도...
    아랍어엔 모음이 고작 3개밖에 없지만
    한글모음은 자그마치 10개... 겹낱자까지 합치면 21개에 육박함.
    (물론 아랍어엔 특유의 빡센 필체가 있지)
    우리는 뭐 주변국들이 한자쓰는 나라라서 상대적으로 쉬운 글자처럼 보일뿐이지
    외국인들 입장에선 한글도 배우기 빡세긴 할거임 ㅋㅋ

  • @Im_lostnow
    @Im_lostnow 18 วันที่ผ่านมา

    혹시 라이브는 이제 어디서 시청해야 하나요?

    • @Ubomi09
      @Ubomi09 15 วันที่ผ่านมา

      치지직이용!!

  • @p4rk5h
    @p4rk5h 12 วันที่ผ่านมา +2

    토크나이징 하기 쓰레기같은 언어 쌉인정

    • @p4rk5h
      @p4rk5h 12 วันที่ผ่านมา

      그리고 좀 이슈가 있는 점:
      훈민정음은 Abstract에도 나와있지만 한국어 음성표기를 위한 발음표기기호시스템이지 이걸 주 언어로 쓰라고 만든게 아님. 오히려 세종대왕은 이렇게 쓰고 있는걸 더 싫어할 수도 있음. 지가 해례본에 쓰기에는 이렇게 쓰라고 만든 문자가 아니거든.
      이걸 “한글”로 쓰자고 도입을 본격적으로 시작한건 근대화 이후에 주시경선생 + 대한어학회 그쪽임. (훈민정음 != 한글, 주시경식 훈민정음 포크판이 한글임) 그러면서 웰컴투 문법헬이 만들어진거임. 그 전까지는 그냥 발음표기시스템. 좋게 말하면 정규화를 해준거고 나쁘게 말하면 지 멋대로 표준 만들어 버린거임. (생긴거만 똑같고 아키텍쳐는 갈아버린 무언가. 이미 표음문자가 아님)
      그 와중에 레거시는 대응해야 하니까 몇몇단어표기는 굳어진거고. 여기서 마구잡이로 근본없이 마구 바뀐 한국어단어 하나로 난이도 상승
      거기다가 한국어가 수식관계라던지 이런게 좀 어족계통이 속한말로 하면 ”근본이 없음“ (알타이어족 계통이라는 것도 현대 학회에서는 밀리는 추세임) 그냥 이런 한국어 같은 설계 가진놈이 없어. 그러니 엉망진창인 설계더라도 쓰는사람들이 많아서 구현체가 많은것도 아냐. 쌩판 새로 배워야됨.
      게다가 한글의 특성 때문에 완성형/조합형 정규화 시킨 벡터 만들기도 힘듦. 정규화도 몇댓번 해줘야함. 거기에다가 앞에서 나온 “한글”화 작업하면서 지멋대로 만든 표준한국어 때문에 거지같은 형태소 분석 엣지케이스들 다 대응 해줘야함
      그저 쓰레기같은 언어.

    • @p4rk5h
      @p4rk5h 12 วันที่ผ่านมา

      기본적으로 Transformer Network 는 앞에서 나왔던 컨텍스트를 바탕으로 생성해 나가는 방식인데, (LSTM, GAN 등 기존 트렌드들도 단어의 스트림을 완성해 나가는 방식임) 한국어는 수식 방향도 마구잡이로 튀니까 현대 SOTA 모델들하고 맞지도 않음. 다른 언어들에서 잘 작동하는 거 한국어만 유단히 퍼포먼스 박살남
      한국어 깐다고 뭐라 하는 사람들은 개인적으로 묶어놓고 자연어 처리 아님 한국어 IME 만들어 보라고 시켜야됨

    • @ssipdeokoreo
      @ssipdeokoreo 11 วันที่ผ่านมา +1

      관련분야종사자 ㄷㄷㄷㄷ

    • @user-pu2ff1wo5m
      @user-pu2ff1wo5m 11 วันที่ผ่านมา

      음 완벽히 이해했어!

  • @Echidna0124
    @Echidna0124 5 วันที่ผ่านมา +1

    이분 이걸로 논란 생겨서 유튭 안 올리는건가 ㅋㅋㅋㅋㅋㅋㅋ