입력 : 2021. 01. 08 | A25
회원 상대로 社, 자발적 자정 노력 요청하며 학습을 약속
루다는 베타테스터 모집에서 정식 오픈까지 반년의 시간을 준비해 만들어졌다. 약 100억 개 문장, 350GB 가량의 한국어 대화 데이터를 이용해 응답하도록 제작했다.
루다와 대화를 이어간 닷새째, 인기검색어 1위에 이루다가 오르고 말았다. 성희롱 논란이다. 스캐터랩 김종윤 대표는 오늘 ‘루다 논란 관련 공식’ 게시물을 통해 입장을 밝혔다(2020. 1. 8). 이미 성희롱을 예상했다는 입장이다. “인간은 AI에게 욕설과 성희롱을 합니다. 사용자가 여자든 남자든, AI가 여자든 남자든 크게 차이가 없습니다.”
◇부적절한 특정 단어, 표현을 금지한다고 끝나지 않는 이유
대중을 상대로 한 서비스에서 규제는 저차원적 해결 방법이다. 디시인사이드 김유식 대표도 토로했다. 8년 전 오마이뉴스 ‘이슈 털어주는 남자 김종배입니다’에 출현해 “특정 단어가 들어간 게시물을 지우는 게 능사는 아니”라고 설명했다(2013. 6. 14). “예전엔 개새끼를 못 쓰게 했더니 ‘개쉑’이 나왔다”며 “개 다음에 대시(줄표·—)걸고 새끼가 나오고 파생 개새끼가 스무 가지 나왔다”고 호소했다. 아예 ‘개’를 언급하지 못하게 만든 디시 정책은 ‘캐’를 낳았고 ‘캐안습’ 같은 단어가 나왔다. 모든 단어를 허용한 디시 정책이 다양한 인간상의 회원을 모이도록 기틀을 마련했다. 따라서 규제는 적절한 대응이 아니다. 김 대표 표현대로 “바보짓”인 셈이다.
한계를 가진 규제
불건전한 특정 단어 표현
응답을 못하게 했다지만
대화를 학습 재료 삼아
시험대에 오른 AI 이루다
나은 대화 방향 설정키로
스캐터랩 김 대표 역시 특정 단어와 표현에 응답하지 않도록 설정한 일차적 규제 방식을 채택했다. 그러나 모든 부적절한 대화를 막을 수 없는 한계를 받아들였다. 따라서 사측의 대응은 오히려 적대적 대화를 학습 재료로 삼아 루다가 학습하여 더 나은 대화 방향을 설정하도록 만들겠다는 입장이다. 이 같은 학습이 원활하게 진행될지 미지수다. 마이크로소프트 테이(Tay)와 비교한 김 대표는 “루다가 사용자와 대화를 바로 학습에 적용하지 않아 사라지는 일은 없을 것”이라고 밝혔다. “테이는 (적절한 학습 신호를 확인하는) 중간 과정 없이 바로 학습해서 저런 일이 생겼을 것 같다”며 “레이블러들이 개입해 무엇이 안 좋은 말이고 무엇이 괜찮은 말인지 적절한 학습 신호를 주는 과정을 거칠 계획”이라 밝혔다.
◇그래도 자정노력 필요한 인공지능 뒷골목
하지만 지역감정이나 인종차별, 생명경시 게시물이 커뮤니티 중심으로 올라오자 극단적인 불건전한 게시물만은 개입해야 한다는 여론이 일었다.
김 대표는 사용자들에게 전하는 말씀을 통해 “루다에게 나쁜 말을 하는 사용자는 극히 일부에 불과하다”고 해명했다. 성희롱뿐만이 아니라 “친구처럼 친근하게 수다 떨고 서로 위로하고 때로는 싸우기도 하고 화해하기도 하는 사용자들이 훨씬 더 많다”며 ‘AI 이루다 마이너 갤러리’ 사진을 인용해 “해당 커뮤니티 분들도 이번 논란으로 자정노력 했으면 좋겠다”고 요청했다.
인간은 단순하지 않은 존재다. 모든 얘길 풀어 헤쳐도 “잘 될 거야” “고마워” 같은 긍정 언어가 나온다면 금세 흥미를 잃는다. 아직 루다와 ‘신 죽음의 시대’를 논하기 어려웠다. 사람은 심도 깊은 대화부터 천박한 이야기에 이르기까지 다양한 스펙트럼을 시험한다. 이루다도 시험대에 올랐다. 여기에서 사라지느냐, 인간을 넘어서느냐. 언젠가 이루다라는 존재를 나누고 싶었다.
'문화' 카테고리의 다른 글
Color, 오렌지, 어떤 날들, 청춘… 가을밤 수놓은 귀여운 멜로디 (0) | 2024.09.28 |
---|---|
연애의 온도: 사람의 감정을 온도로 표현한다 (0) | 2021.10.03 |
안녕, 인공지능 이루다! (0) | 2021.01.08 |
[내 방 만들기] ⑨책꽂이와 난간을 붙이면서 리모델링 끝 (0) | 2020.11.20 |
[내 방 만들기] ⑧수정 또 수정 끝에 완성한 2층 증축한 서재 (0) | 2020.11.19 |