무하유, 국회도서관 융복합서비스 데이터셋 구축사업 성료

스타트업

무하유, 국회도서관 융복합서비스 데이터셋 구축사업 성료

Jo Kim 기자
등록 2024.02.14 22:20:32

AI 기업 무하유가 '국회도서관 융복합서비스 데이터셋 구축 사업'을 성료했다고 15일 밝혔다.

무하유는 이번 사업을 통해 국회도서관에서 제공 중인 AI 의정분석 서비스 '아르고스'에 법률 관련 Q&A 데이터셋을 구축했고, 이를 통해 국회 및 공공 관련 법규 등 법률 관련 질의사항에 대화형 문답으로 쉽게 설명함으로써 이용자의 편의성을 높였다.

무하유는 원활한 사업 추진을 위해 법률 지식을 보유한 전문가들을 포함한 데이터셋 구축인력을 구성했다. 이는 법률에 관련 이슈 키워드와 제개정일·의안·회의록·주요 사건 및 인물에 대한 정보는 물론, 통계 표의 제목 및 매칭 키워드 등 광범위한 영역을 포함하는 고품질 데이터셋 구축 성료로 이어졌다.

HWP와 PDF 파일 내 법률 관련 통계표 또는 이미지의 제목 및 매칭 키워드 데이터도 구축해 국회도서관의 콘텐츠 품질을 강화했다. 표 및 이미지 데이터 구축은 무하유의 표절검사 서비스 내에 적용된 이미지 인식 및 추출 기술을 활용해 자동으로 해당 데이터를 추출한 후, 다차원의 품질 검수를 실시하는 식으로 이뤄졌다.

한편, 무하유는 700만 건 이상의 AI 학습 데이터를 구축해 온 노하우를 토대로 데이터 관리 올인원 플랫폼인 ‘데이터 팩토리(이하 DF)’를 활용해 데이터셋 구축에 효율을 높였다. DF는 AI 적용 솔루션을 운영하는 과정에서 필요한 데이터를 자체적으로 구축한 후 정제 및 가공하기 때문에 인력소싱, 계약, 데이터 구축, 품질관리, 저작권 관리까지 가능하다는 장점이 있다. 반면, 일반적인 데이터 구축·라벨링 업체는 라벨링 후 납품까지의 역할만 수행하고, 납품 이후의 실제 데이터셋 활용에 대해서는 고려하지 않는 경우가 많다는 점에서 큰 차이를 보인다.

무하유는 2011년 국내 최초 AI 기반 표절검사 서비스인 '카피킬러'를 선보인 후, 3500여 개 고객사에 서비스를 제공하고 있다. 카피킬러는 무하유만의 고도화된 NLU(Natural Language Understanding, 자연어이해) 기술에 기반한 서비스로, 국내외 논문·법률·실시간 콘텐츠 등 다양한 텍스트 기반 데이터를 수집, 정제, 처리하고 있다.

무하유의 신동호 대표는 "무하유는 기술로 공정의 효율화를 높이고, 인력으로 데이터의 품질을 높이는 방식의 데이터셋 구축 전략을 취하고 있다. 앞으로 검증된 AI 기술에 기반한 데이터셋 제작 역량으로 공공 분야 진출에 박차를 가할 것"이라고 밝혔다.

Jo Kim 기자의 전체기사 보기

스타트업

무하유, 국회도서관 융복합서비스 데이터셋 구축사업 성료

관련기사

포토이슈

HOT 이슈

스타트업

Global Update 2026 : “아이디어가 즉시 디자인이 된다”... 감마, AI 네이티브 기능 ‘감마 이매진’ 공개

뉴패러다임, 키움증권과 스타트업 IPO 실무 리스크 관리 세미나 성료

“AI가 그린 금지된 로맨스”... 비글루, 판타지 숏드라마 ‘블러드바운드 루나’ 공개

코리아스타트업포럼, 유니콘팜과 성장 장벽 해소를 위한 ‘정책 피칭 현장간담회’ 개최

코리아스타트업포럼-카이스트 IP영재기업인교육원, 미래 창업가 양성 위한 업무협약 체결

코스포, 앤트로픽과 손잡고 ‘K-스타트업 AI 혁신’ 지원… 기업당 1,400만 원 상당 크레딧 제공

“스타트업을 넘어 상권을 육성하라”... KAIA, ‘상권기획자’ 실전 세미나 대전 개최

코스포 “AI 데이터 세액공제 확대 환영… ‘선사용·후보상’ 원칙 정착의 신호탄”

뉴욕

글로벌 데이팅 앱과 디지털 노마드 플랫폼 위한 기술제휴 성사

SOLUM Unveils Sustainable Retail Innovation at NRF 2025

이스트 오라이온, AI로 유튜브 채널 운영 지원 서비스 선보여