아시아투데이

오피니언

사설

칼럼·기고

기자의 눈

피플

정치

정치일반

청와대

국회·정당

북한

외교

국방

정부

사회

사회일반

사건·사고

법원·검찰

교육·행정

노동·복지·환경

보건·의약

경제

경제일반

정책

금융·증권

산업

IT·과학

부동산

유통

중기·벤처

아투시티

종합

메트로

경기·인천

세종·충청

영남

호남

강원

제주

국제

세계일반

아시아·호주

북미

중남미

유럽

중동·아프리카

문화·스포츠

전체

방송

가요

영화

문화

종교

스포츠

여행

최신

지면보기

구독신청

First Edition

후원하기

제보24시

알립니다

SNS 뉴스스탠드 네이버블로그 아투TV(유튜브) 페이스북 인스타그램

다국어뉴스 ENGLISH 中文 Tiếng Việt
패밀리사이트 마켓파워 아투TV 대학동문골프최강전 글로벌리더스클럽

Advertisements

문화·연예

출판·문화

국립국어원, AI에 가르칠 한국어 빅데이터 18억 어절 분량 공개

공유하기

읽기모드

글자크기

기사듣기

기사듣기중지

기사듣기

인쇄하기

공유하기

URL 복사

https://onelink.asiatoday.co.kr/kn/view.php?key=20200825010013336

글자크기

전혜원 기자

승인 : 2020. 08. 25. 13:40

구글 검색 선호 출처 추가 Google 검색에서 아시아투데이 기사를 더 자주 볼 수 있습니다.

Advertisements

Advertisements

	ㅇ	0
‘모두의 말뭉치’ 첫 화면./제공=국립국어원

국립국어원은 인공지능의 한국어 처리 능력 향상에 필수적인 한국어 학습 자료 13종 18억 어절 분량을 25일 국립국어원 ‘모두의 말뭉치’(https://corpus.korean.go.kr)에서 공개한다고 밝혔다.

공개하는 자료는 한국어 분야의 빅데이터로, 전문 분야에서는 말뭉치(corpus)라고 한다. 챗봇이나 인공지능 비서가 한국어를 자연스럽게 알아듣고 분석해 말하려면 반드시 다양한 한국어 말뭉치로 학습을 해야 한다.

국립국어원은 2018년 대규모 한국어 학습 자료 구축 사업을 시작했으며, 이번 자료는 작년까지 구축한 18억 어절 규모의 말뭉치이다.

자료는 ‘모두의 말뭉치’ 사이트에서 온라인 약정서를 작성해 승인받으면 누구나 이용할 수 있다.

‘모두의 말뭉치’에서 받을 수 있는 자료에는 최근 10년간의 신문 기사와 서적 2만188종, 일상생활에서의 음성 대화와 메신저 대화, 방송 자료, 대본 등이 있다. 각종 인터넷 사이트 블로그, 게시판 등의 자료 210만 건도 포함됐다.

국립국어원은 “초기 구축에 큰 비용과 시간이 소요되는 한국어 말뭉치의 대규모 공개로 중소기업 등이 한국어 처리 기술 개발에 쉽게 접근할 수 있게 됐다”며 “대기업이나 관련 연구 기관 등도 다양한 서비스 개발과 성능 향상에 많은 도움을 받게 됐다”고 했다.

전혜원 기자summerrain@asiatoday.co.kr

좋아요 0; 슬퍼요 0; 화나요 0
후속기사 원해요 0

ⓒ 아시아투데이, 무단전재 및 재배포 금지

기사제보 후원하기

Advertisements

많이 본 뉴스

이란, 호르무즈 재봉쇄 선언…미·이란 MOU 통항 재개 이틀 만에 흔들려

레바논이 흔든 미·이란 종전 MOU…호르무즈·핵협상 60일 시계 첫날부터 불안

이란, 호르무즈 재봉쇄 선언…21일 스위스 종전 협상 앞두고 MOU 흔들려

김용범 “호황에 부동산 꿈틀할 수도…보유·양도세 조정 필요”

하나증권 “하이닉스 시총, 삼전 95%까지 추격…쏠림현상 금융위기급”

G7의 세계 지배는 끝났다, 中 관영지 주장

중국인, 일본 여행 재개 무산

지금 뜨는 뉴스

포드, 초대형 SUV 익스페디션 국내 출시…1억2350만원

혼인율, 8년 만에 최다…결혼 준비에 유용한 카드는

10분 충전으로 250㎞ 질주…BMW ‘더 뉴 iX3’ 국내 출시

부대 인근 ‘나홀로 관사’, 7300세대 주거단지로 탈바꿈 시동

“스타워즈 제작진도 엄지척”…LG 올레드 TV, 美·유럽서 호평

회사소개 광고안내 신문구독 채용: 윤리강령 독자권익보호위원회 알립니다 제보24시 저작권 회원약관 개인정보취급방침 청소년보호정책 사이트맵

아시아투데이

등록번호 : 서울 아00160 | 등록일 : 2006년 1월 18일 | 제호 : 아시아투데이 | 회장·발행인·편집인 : 우종순

대한민국 서울특별시 영등포구 의사당대로1길 34 인영빌딩 | 발행일자 : 2005년 11월 11일 | 대표전화 : 02) 769-5000 | 청소년보호책임자 : 성희제

아시아투데이의 모든 콘텐츠(기사)는 저작권법의 보호를 받으며, 무단전재 및 수집, 복사, 재배포 등을 금지합니다.

Copyright by ASIATODAY Co., Ltd. All Rights Reserved.

본지는 한국신문윤리위원회의 서약사로서 신문윤리강령을 준수합니다.