2025_10 AI 기반 보고서 작성을 위한 HWP(한글) 양식 표준화 및 생성 도구 개발 제안
1. 제안 배경: LLM 시대와 HWP 문서의 간극
바야흐로 LLM(거대 언어 모델)이 단순히 문서를 읽는 것을 넘어, 직접 본문을 생성하고 요약하는 시대입니다. Google Gemini Pro와 같은 최신 AI는 사용자와의 대화 내용을 바탕으로 Google Docs 문서를 자동으로 생성하는 등, AI와 문서 도구의 결합은 이미 현실화되었습니다.
하지만 이러한 기술 발전에도 불구하고, 국내 공공 및 연구 분야의 표준 문서 형식인 HWP는 AI 기술을 효과적으로 활용하지 못하는 'LLM 비친화적' 환경에 머물러 있습니다.
2. 현황 및 문제점
현재 HWP 기반의 문서 작업은 다음과 같은 심각한 비효율을 안고 있습니다.
2.1. 문제 1: 내용보다 '조판'에 소모되는 과도한 수작업
LLM이 HWP의 복잡한 서식을 직접 생성하지 못하기에, 현업에서는 다음과 같은 비효율적인 수작업이 반복되고 있습니다.
수동 '복사-붙여넣기': LLM이 생성한 텍스트 초안을 HWP에 붙여넣습니다.
반복적인 서식 작업: 공문서 양식에 맞춰 문단별로 개조식 머리글자(□, ○, -, · 등)를 일일이 찾아 적용합니다.
스타일 복사:
Alt+C(모양 복사) 기능을 수십, 수백 번 반복하며 서식을 '칠'합니다.
이는 '내용 작성'이 아닌 '조판'에 막대한 시간과 노력을 소모하는 주객전도 현상입니다. 최신 한컴독스에 탑재된 AI 기능 역시 내용 생성에 초점을 맞출 뿐, 이러한 구조화된 서식을 자동 적용하지는 못합니다.
이러한 현실은 현업 종사자들의 큰 고충으로 이어지고 있습니다.
"연구계획서를 쓰고 있습니다. hwp에서 표를 고치고 있습니다. 예쁘게 글자가 놓이도록 장평과 자간을 고칩니다. 뇌가 없어도 될 것 같습니다."
( 2024.01.26., 한국에너지기술연구원 이제헌 박사 페이스북, https://www.facebook.com/share/p/1BMXXfvK6p )
2.2. 문제 2: 내용과 디자인이 분리되지 않는 경직된 구조
현대적인 문서 도구는 내용(HTML)과 디자인(CSS)을 분리합니다. MS Office(Word, PowerPoint)의 '디자인' 기능이나 오픈소스 변환기 'Pandoc'의 '레퍼런스 문서' 옵션은 문서의 구조는 유지한 채 테마(폰트, 색상, 간격 등)를 손쉽게 변경할 수 있게 합니다.
반면, HWP는 내용과 서식이 강력하게 결합되어 있어 디자인 테마를 일괄적으로 변경하는 기능이 사실상 부재합니다.
2.3. 문제 3: 기계가 읽기 어려운 복잡한 양식
현재 HWP 양식, 특히 공문서와 보고서는 기계가 처리하기 매우 어려운 두 가지 특성을 지니고 있습니다.
데이터가 아닌 '양식형 표' (Form-like Table)
한국의 보고서는 행과 열로 구성된 데이터 표(Tabular Data)가 아닌, 정보를 기입하는 '서식'이나 '구획' 역할을 하는 복잡한 표(중첩 표, 셀 병합이 많은 표)를 과도하게 사용합니다.
심지어 강조 문구나 머리글자 표현을 위해 1x1 표를 사용하는 등, 표를 본래 용도(데이터 표시)가 아닌 레이아웃 배치 목적(HTML의 '테이블 레이아웃' 안티패턴)으로 사용하고 있습니다.
이는 정보를 밀도 높게 집약해 보여주는 장점은 있으나, 기계가 내용을 구조적으로 읽고(Machine-readable) 데이터를 추출하는 것을 거의 불가능하게 만듭니다.
비표준화된 복잡한 번호 및 목록 체계
미국 정부 문서 등이
1.1.1.1.처럼 일관된 번호 체계를 사용하는 것과 달리, 한국의 문서는 제목 단계마다1.,가.,(1),1)등 번호 체계가 일관성 없이 바뀝니다.본문 내 목록(□, ○, ·) 역시 유니코드 기호를 쓰거나, Wingdings 같은 특수 폰트를 사용하거나, 심지어 입력의 어려움으로 ㅁ( 한글 미음), o(영어 소문자 O), ㅇ(한글 이응),
.(마침표) 등으로 대체하는 등 표준이 없습니다.
2.4. 문제 4: AI 시대의 표준 '마크다운'과 HWP의 호환성 부재
LLM은 입출력 시 토큰 효율성(비용 절감)과 범용성을 위해 마크다운(Markdown) 형식을 사실상의 표준으로 사용합니다. 마크다운은 문법이 단순하고, DOCX 등 다른 형식과 상호 변환이 용이합니다.
Gemini가 Google Docs 문서를 쉽게 생성할 수 있는 이유도, LLM의 출력(마크다운)이 Google Docs의 구조화된 형식과 쉽게 매핑되기 때문입니다. HWP는 이러한 표준에서 완전히 고립되어 있습니다.
3. 개선 제안
이러한 문제를 해결하고 HWP를 'LLM 친화적' 문서 도구로 진화시키기 위해 다음 두 가지를 제안합니다.
3.1. 제안 1: HWP 양식의 '단순화' 및 '표준화'
AI가 문서를 이해하고 생성할 수 있으려면, 사람이 하던 복잡한 '조판' 영역을 기계가 처리할 수 있도록 단순화해야 합니다.
표 사용의 원칙 수립: 레이아웃을 위한 표(특히 1x1 표, 양식형 표, 중첩 표) 사용을 금지하고, 표는 데이터 표시에만 사용하도록 양식을 개정해야 합니다.
번호 및 목록 체계 표준화:
제목 단계별 번호 체계를 1.1.1.1. 과 같이 일관되게 통일합니다.
본문 내 목록 머리글자(□, ○, · 등)를 유니코드 표준 기호로 명확히 정의하고, 2단계를 초과하는 복잡한 목록은 지양합니다. (단계가 많아질 경우 미국식처럼 제목 단계로 분리)
3.2. 제안 2: '마크다운-HWP' 변환 도구 및 표준 API 개발
표준화된 양식을 바탕으로, LLM의 출력물(마크다운)을 HWP 문서로 자동 변환하는 도구 개발이 필요합니다.
(가칭) HWP 생성 엔진 개발: 이 도구는 단순 텍스트가 아닌, '표준 양식(제안 1)'에 정의된 서식과 스타일이 완벽하게 적용된 HWP 파일을 생성해야 합니다.
기능:
마크다운의 제목(
#,##)을 HWP의제목 1,제목 2스타일로 자동 변환마크다운의 목록(
*,-)을 HWP의 표준화된 목록(□,○) 스타일로 자동 변환표준화된 템플릿(레퍼런스 문서)을 적용하여 기관별 맞춤형 디자인(폰트, 간격 등)을 일괄 적용
4. 기대 효과
본 제안이 수용된다면, 연구자와 행정 인력은 '조판'이라는 단순 반복 노동에서 해방될 수 있습니다.
생산성 향상: LLM으로 초안을 생성한 뒤, 변환 도구를 통해 즉시 HWP 보고서를 완성하여 문서 작업 시간을 획기적으로 단축할 수 있습니다.
고부가가치 업무 집중: '장평과 자간을 맞추는' 비창의적 업무 대신, 보고서의 '내용'과 '논리'를 다듬는 본질적인 업무에 집중할 수 있습니다.
AI 기술 내재화: HWP라는 고유의 자산을 AI 시대에 맞게 발전시켜, 국내 문서 환경의 디지털 전환을 가속화할 수 있습니다.