top of page

자막이

Task Force Project

2021 2H

자막이는 온라인 강의에 대해 자막이 필요한 청각장애 대학생과 자막 기부 봉사자를 연결하는 사회적 가치 지향 플랫폼입니다. 자연어 말소리를 텍스트로 자동 변환해주는 STT(Speech-to-Text) 기술을 기반으로 하며 비장애인 전공생들의 참여를 통해 전문 용어 데이터베이스를 구축하고 기존 STT보다 고등 학습에 적합한 AI를 구현하는 데에 목적이 있습니다.

 

자막이는 비대면 학습의 확산이 가속화되고 있는 중, 충분한 대비 없이 마주한 변화에 큰 어려움을 겪는 학내 구성원에 대한 공감과 상생의지에서 시작된 프로젝트로, 시범적으로 마케팅원론의 내용을 담은 데이터베이스를 구축하였고 플랫폼 초기 단계로써 웹 사이트 개설에 성공하였습니다.

 SDGs: 4. Quality Education
Page3.png

 COVID-19의 확산을 막기 위해 비대면 학습으로의 전환이 가속화되는 중, 충분한 대비 없이 마주한 변화에 학내 구성원 중 사회취약계층 학생들이 가장 큰 어려움을 겪고 있습니다. 특히 실시간 수업의 경우 교수자 차원에서 자막이 제공되는 경우가 거의 없고 강의자의 입모양 판별 또한 어렵기 때문에 청각 장애인이 강의를 수강하기에 부적절한 상황이 지속 중입니다. 자막이팀은 급격한 변화로 생겨난 비장애인과 장애인 간 교육 불평등에 문제의식을 가졌고 AI를 활용한 자막 변환 기술을 이용하여 이를 완화할 수 있지 않을까 생각했습니다.

유사 STT 서비스의 한계
자막이 오류 예시.jpg

프로그램 기획 과정에서 유사 서비스들을 조사한 결과, 여러 플랫폼에서 현재 보급하고 있는 자막 변환 기능은 전공 속 전문 용어에 대한 정확성이 떨어짐을 발견할 수 있었습니다. 결국 AI 자막 기술 보급에 앞서 사회의 긍정적인 영향력을 통해 자막 AI 발전을 위한 발판을 마련하는 것이 필요하다는 판단을 하였고 비장애인 전공생이 Speech to Text(이하 STT) AI 기술의 정확도를 높이는 데 기여하는 플랫폼을 만들어 청각 장애인의 학습 환경을 개선함과 동시에 하나의 사회적 커뮤니티를 조성하고자 하였습니다.

Database
Page6.png

우선 앞서 언급한 데이터베이스 구축의 가이드라인을 만들고자 직접 특정 전공에 대한 개념어 데이터를 모았습니다. 유사 서비스 시장 조사 때 기준으로 삼은 ‘마케팅원론’을 비슷한 근거의 연장 선상으로 초기 가이드라인 과목에 선정했고 이 과정에서 Python의 Konlpy를 이용한 어휘 코퍼스 추출과 전공생들에 의한 수업 교재 데이터 처리가 병행되었습니다.

 

개념어 데이터 구축은 단어의 빈도수를 파악하여 높게 활용되는 단어 목록에 대한 자체적인 필터링을 거치면서 이루어졌습니다. 생성된 음성 및 텍스트 데이터들은 AI 모듈의 학습 효율을 높이고 생성된 자막의 정확도를 상승시키기 위해 기계 학습에 활용될 것 입니다. 전공 강의에는 일상적으로 사용되지 않는 단어가 많이 포함되어 있으며 각자 타전공들과도 구별되는 고유성이 강하기 때문에 비장애 전공생들의 참여가 자막의 정확성 향상에 큰 도움을 줄 것으로 예상합니다. 

  • Facebook
  • Instagram
  • YouTube
  • kakao-talk
  • 152657_call-icons-png

Copyright © Sustainable Development Program

bottom of page