top of page

정보시스템 개발사례 업로드 전자문서 자동요약 시스템 레폿 VC

  • ceden320
  • 2020년 12월 11일
  • 2분 분량

정보시스템 개발사례 업로드 전자문서 자동요약 시스템 레폿




정보시스템 개발사례 업로드 전자문서 자동요약 시스템


[정보시스템 개발사례] 전자문서 자동요약 시스템


[정보시스템 개발사례] 전자문서 자동요약 시스템


목차


[정보시스템 개발사례] 전자문서 자동요약 시스템


Ⅰ. 관련 연구


Ⅱ. 시스템 구현


1. 시스템 개요

2. 형태소 분석기

3. 문장 랭킹 / 추출기


Ⅲ. 시스템 평가

[정보시스템 개발사례] 전자문서 자동요약 시스템


전자문서 자동요약 시스템은 날로 대용량화 되어가는 전문(Full-text)의 웹 페이지 자료와 매일을 자동 요약하여 줌으로써 사용자의 정보검색

효율성을 도모할 수 있는 시스템을 제시하고 구현하였다. 문서자동요약에 있어서 통계적인 기법과 전자메일의 구조적인 특성을 고려하여 시스템을 형태소 분석기능, 문장랭킹기능, 문장추출기능으로 분류하여 좀더 기본적인 내용을 유지 가능하게 하면서 복잡도를 줄이려고 노력하였으며, 현존하는 웹에서 쉽게 구현이 가능하고 멀티유저 환경에 적합하다.

그리고 본 시스템을 정보검색 시스템에 응용함으로써 웹 서비스 품질을 향상시킬 수 있다.


I....[정보시스템 개발사례] 전자문서 자동요약 시스템






목차


* [정보시스템 개발사례] 전자문서 자동요약 시스템


Ⅰ. 관련 연구


Ⅱ. 시스템 구현


1. 시스템 개요

2. 형태소 분석기

3. 문장 랭킹 / 추출기


Ⅲ. 시스템 평가

[정보시스템 개발사례] 전자문서 자동요약 시스템


전자문서 자동요약 시스템은 날로 대용량화 되어가는 전문(Full-text)의 웹 페이지 자료와 매일을 자동 요약하여 줌으로써 사용자의 정보검색

효율성을 도모할 수 있는 시스템을 제시하고 구현하였다. 문서자동요약에 있어서 통계적인 기법과 전자메일의 구조적인 특성을 고려하여 시스템을 형태소 분석기능, 문장랭킹기능, 문장추출기능으로 분류하여 좀더 기본적인 내용을 유지 가능하게 하면서 복잡도를 줄이려고 노력하였으며, 현존하는 웹에서 쉽게 구현이 가능하고 멀티유저 환경에 적합하다.

그리고 본 시스템을 정보검색 시스템에 응용함으로써 웹 서비스 품질을 향상시킬 수 있다.


I. 관련연구


자동요약이란 본래 문서의 기본적인 내용을 유지하면서 문서의 복잡도, 즉 문서의 길이를 줄이는 작업이다. 자동요약은 먼저 문서내용을 이해하기 위한 문장분석, 문서주제를 형성하고 있는 단어를 선별하기 위한 키워드 추출 그리고 요약문 생성의 세 단계로 구분할 수 있다. 자동요약에 관한 연구들은 연구방법론에 따라 여러 가지 형태로 분류되어 소개되고 있다.

장동현은 요약시스템을 문장구성요소 추출 시스템, 텍스트 이해기반시스템, 혼합형태, 틀 기반 시스템으로 분류하여 소개하고 있다. 문장구성요소 추출 시스템은 원문이 가지고 있는 언어적 혹은 구조적 정보를 이용하여 각 문장이 요약문에 포함될 가능성이 있는가를 판단하여 추출된 문장을 단순히 열거하거나 재정렬하는 방법이다. 텍스트 이해기반 시스템은 다양한 파싱 기술과 개념표현을 사용하며, 문서의 내용을 파악하여 주제를 표현하고 있는 정보를 식별한 후 요약문장을 생성한다. 혼합 형태는 두 가지 형태를 혼합한 시스템이며, 틀 기반 시스템은 개념을 틀로 정의하고 텍스트 분석을 통해 틀을 떼꾼 후 요약문을 생성하기 때문에 한정된 분야에 사용될 수 있다.

한경수는 크게 언어학적 접근방법과 통계기반 접근방법으로 나누어

소개하고 있다. 전자의 언어학적 접근방법은 어휘사슬(lexical chain)이

나 담화 트리(discourse tree) 등을 이용하여 문서의 담화구조를 판단한

다음 요약을 제시하는 방법이다. 통계기반 접근방법은 단어의 빈도, 제

목, 문장의 길이, 문장의 위치, 실마리 단어나 구(clue word or phrase)

등을 자질(feature)로 사용하여 문서상에서 단어의 출현민도를 이용하여

각 문장이나 문단의 중요도 값을 구하고 그 값이 높은 문장이나 문단을

요약으로 제시하는 방법이다.

또한, 최종 결과물을 생성하는 방식에 따라 요약과 추출로 나눌 수 있는데 추출과 관련된 연구가 현재 국내에서 활발히 진행되고 있다. 류동원은 각 단락들 간의 단어공기정보(word co-occurrence)를 이용해 이들 간의 관계를 바탕으로 중요 단락을 추출하여 문서를 요약하고 있다. 류제는 단어의 공기관계 그래프를 이용하여 문서의 키워드를 추출하고, 추출된 키워드를 이용하여 문서내에서의 핵심문장을 찾아내는 문서요약

시스템을 제안하고 있다. 한경수는 의사적합성 피드백(pseudo relevance feedback)에 의한 질의확장(queudo expansion) 기법을 적용한 요약을 제안하고 있다. 즉 문서의 제목을 초기 질의로 사용하여 의사적합성 피드백을 통해 질의를 확장해 가면서 요약문을 생성한다.


II. 시스템 구현


1. 시스템 개요

요약에 필요한 문장의 추출을 위해서 본 시스템에서는 앞서 예시한 추출기법 중 문장 구성요소 추출기법과, 단어의 빈도수 등 문장의 자질(feature)에 관한 확률정보를 학습한 후 이를 이용하여 원문의 각 문장이 요약문에 포함될 확률을 계산하는 혼합된 형태의 자동요약 시스템을 구현하였다. 아울러 본 연구에서 제




[문서정보]


문서분량 : 7 Page

파일종류 : HWP 파일

자료제목 : 정보시스템 개발사례 업로드 전자문서 자동요약 시스템

파일이름 : [정보시스템 개발사례] 전자문서 자동요약 시스템.hwp

키워드 : 정보시스템,개발사례,전자문서,자동요약,시스템,업로드

자료No(pk) : 11031647

 
 
 

최근 게시물

전체 보기
중국 현대사의 출발점 5 4 운동 보고서 GY

중국 현대사의 출발점 5 4 운동 보고서 문서파일 (압축문서).zip 중국 현대사의 출발점 5 4 운동 오늘날 5·4운동은 중국에서 청년절, 대만에서는 문예절로 각각 기념행사를 할 만큼 중요한 사건으로 간주되고 있으며 이는 중국 현대사에서 하나의...

 
 
 
일의 발견 다운로드 BU

일의 발견 다운로드 파일문서 (다운로드).zip 일의 발견 일의 발견에 대해서 .. 일의발견 [문서정보] 문서분량 : 16 Page 파일종류 : PPT 파일 자료제목 : 일의 발견 파일이름 : 일의 발견.ppt 키워드 : 일의,발견...

 
 
 

Comments


게시물: Blog2_Post
  • Facebook
  • Twitter
  • LinkedIn

©2020 by ceden320. Proudly created with Wix.com

bottom of page