2025_10 KISTI 오픈소스 경진대회' 개최 및 'Pandoc HWPX Writer' 개발 추진

1. 제안 배경: AI 시대, HWP의 기술적 고립

앞서 'AI 기반 보고서 작성을 위한 HWP 양식 표준화'[^1] 제안에서 밝혔듯이, 현업에서는 LLM이 생성한 텍스트를 HWP 문서에 수동으로 복사-붙여넣기 하고 서식을 다시 입히는 비효율적인 '조판' 작업이 반복되고 있습니다.

AI가 Google Docs와 같은 문서는 직접 생성하지만, HWP는 그렇지 못하는 이 간극을 메우기 위해 LLM의 표준 출력물(마크다운)을 HWP로 자동 변환하는 도구의 개발이 절실히 요구됩니다.

[^1]: AI 기반 보고서 작성을 위한 HWP(한글) 양식 표준화 및 생성 도구 개발 제안


2. 현행 방식의 한계와 근본적인 해결책

개인적으로 이 문제를 해결하기 위해 2018년 마크다운-HML(한글 마크업 언어) 변환기[^2]를 시도했으나, 표와 이미지 변환 등의 한계로 실용화에 이르지 못했습니다.

[^2]: https://github.com/msjang/md2hml


마크다운을 변환한 HTML에 CSS를 적용하면 웹페이지에 쉽게 렌더링 할 수 있습니다[^3]. 하지만 이 HTML 파일을 HWP에서 열었을 때는 CSS가 적용되지 않아 목록의 머릿글자 등과 폰트가 적용되지 않았습니다.

[^3]: https://wiki.kreonet.net/msjang/03-kgov-256344341.html


현재 소속 부서에서는 웹 공동편집 도구로 작성한 주간업무보고를 DOCX로 내보낸 뒤, 이를 HWP 양식에 맞게 변환하는 'hwpfy'라는 내부 도구를 개발하여 1년간 사용 중입니다. 마크다운 혹은 간단한 HTML 문법으로 생성된 DOCX 문서는 서식이 단순하여 HWP에서 'MS 워드 호환 문서'로 열 때 레이아웃 깨짐이 적다는 장점이 있습니다. 하지만 이는 AI 도구에 직접 연결하여 HWP/HWPX 파일을 즉시 생성하는 근본적인 해결책이 아닌, 우회적인 방식에 불과합니다.


이 문제의 가장 효과적이고 범용적인 해결책은, 전 세계적으로 가장 널리 쓰이는 문서 변환 오픈소스인 Pandoc에 'HWPX Writer' 모듈을 추가하는 것입니다. Pandoc에 HWPX 생성 기능이 탑재된다면, LLM의 결과물을 단 하나의 명령어로 완벽한 HWPX 보고서로 변환하는 수많은 응용 프로그램(예: AI 보고서 봇)을 누구나 손쉽게 만들 수 있습니다.


3. 제안: 'KISTI 오픈소스 경진대회' 개최

Pandoc 모듈 개발은 상당한 전문성과 집중적인 노력을 요구하는 프로젝트입니다. 개인 차원에서 현업과 병행하며 진행하기에는 큰 부담이 따릅니다.

제가 만들어 보려고 Pandoc 코드를 살펴 보니, 마크다운 수준의 최소한의 문법만을 변환하는 것은, 그렇다고 완전히 불가능한 과제는 아닐 것 같다는 판단이 들었습니다.

본 과제는 KAIST, POSTECH, 서울대 등 국내 최상위권 전산학부 학생들이 졸업 프로젝트 주제로 삼아 한 학기 이상 몰입할 때 성공 가능성이 높은, 가치와 난이도를 동시에 갖춘 프로젝트라는 생각이 들었습니다.

이에, KISTI가 국가 연구개발 및 AI 활용을 선도하는 기관으로서 Google의 'Summer of Code'와 유사한 'KISTI 배 오픈소스 경진대회'의 개최를 공식적으로 제안합니다.

  • 방식: KISTI가 국가·공공·연구 분야에 필요하지만 개발되지 않고 있는 핵심 오픈소스 주제를 발굴하여 제시합니다.

  • 지원: 우수한 성과를 낸 학생 및 개발팀을 선정하여 시상하고, 지속적인 개발을 지원합니다.


4. 첫 번째 도전 과제: Pandoc HWPX Writer

경진대회의 첫 번째 핵심 도전 과제로 'Pandoc HWPX Writer 개발'을 상정할 것을 제안합니다.

이는 단기 이벤트성 과제가 아니라, 2~3년간 지속적으로 운영하며 성과를 축적해야 할 KISTI의 대표 오픈소스 기여 사업이 될 수 있습니다. 본 과제의 성공은 KISTI 내부의 업무 효율화를 넘어, 대한민국 공공 및 연구 분야 전체의 문서 작성 패러다임을 AI 시대에 맞게 혁신하는 핵심 기술 기반을 마련할 것입니다.