Published December 8, 2025 | Version v1
Presentation Open

데이터셋의 환경적 전환 : 인공지능과 함께 읽기(Co-Reading)를 통한 한국 근현대 시–감정–색채 멀티모달 미디어

Authors/Creators

  • 1. ROR icon Academy of Korean Studies

Description

 본 연구는 인공지능과 인간이 ‘함께 읽기(Co-Reading)’를 수행함으로써 구축된 한국 근현대 시(詩)- 감정–색채 데이터셋을 하나의 ‘미디어(media)’로 조망한다. 기존의 문학 연구에서 데이터셋은 보조적 자료나 중간 산물로 이해되는 경우가 많았으나, 본 연구는 데이터셋을 새로운 감각적 경험과 해석을 가능케 하는 디지털 세계의 환경적 조건으로 규정한다. 이는 McLuhan(1964)의 “미디어는 메시지다”라는 명제를, Peters(2015)가 주장한 “미디어는 곧 우리 존재를 가능하게 하는 환경”이라는 관점으로 확장하여 한국 근현대 시 연구의 디지털 전환 속에서 재해석한 것이다. 본 연구에서 구축한 ‘함께 읽기 체계(Co-Reading System)’는 데이터셋을 매개로 인간과 인공지능이 공동 독자(Co-Reader)가 되어 해석 환경을 공유하도록 한다.

 이를 위해  본 연구는 김소월, 윤동주, 이상, 임화, 한용운 등 5인의 대표 근현대 시인 작품 483편, 7,662개 시구를 대상으로, 한국어 댓글 감정 라벨링 데이터셋 KOTE(Jeon et al., 2024)의 44개 세분 감정 범주(불안/걱정, 행복, 비장함, 안타까움/실망 등)를 적용하여, 5명의 주석자가 참여한 KPoEM(Korean Poetry Emotion Mapping) 데이터셋을 구축했다(Lim et al., 2025). 또한 기존 색채 심리학 이론과 사용자 반응을 토대로, 감정과 색채를 대응시킨 KCoEM(Korean Color Emotion Mapping) 데이터셋을 병행해 구축했다. 이는 인간의 시를 인간 주석자의 아날로그적 해석 행위를 통해 디지털로 전이시켜, 본 연구에서 구축한 시스템을 통해 인공지능이 문학 텍스트를 함께 읽고 감각적으로 재해석하는 구성 요소가 된다. 이러한 데이터 라벨링 작업은 Drucker(2014)가 지적했듯이 데이터가 ‘주어진(given)’ 것이 아니라 ‘취해진(taken)’ 해석의 산물임을 보여준다. 

나아가 KPoEM(https://doi.org/10.57967/hf/6303)은 시의 감정을, KCoEM은 감정과 색채를 기계가 읽을 수 있는 미디어로 가공하여 ‘오직 전환 가능한 것만이 존재한다’는 키틀러(Kittler)의 명제(Peters, 2015, p. 26)를 실현한다. 이렇게 데이터셋을 통해 인간의 시는 디지털 정보로 전환된다. 그리고 데이터셋은 ‘함께 읽기 시스템’에서 컨텍스트 엔지니어링(context engineering)을 통해 조립되어, 인공지능과 인간이 함께 해석할 수 있는 새로운 디지털 환경을 가능케 한다. 이렇게 본 연구에서 구축한 데이터셋과 시스템은 더 이상 단순한 ‘문학 분석 도구’가 아니라, 시–감정–색채–시각화라는 연쇄적 커뮤니케이션 체계를 통해 문학 텍스트를 공동으로 읽고 재구성하는 멀티모달 미디어(multimodal media)로 작동한다. 이때 출력되는 색채 이미지는 단순한 시각화가 아니라, 인간과 인공지능이 함께 읽고 생성한 감각적 메시지이자 공명(共鳴)의 ‘심상’이다.

 본 연구에서 구축한 데이터셋 KPoEM과 KCoEM은 문학 연구를 넘어 다양한 영역으로 확장될 수 있는 기반 자원으로 기능한다. KPoEM은 한국 근현대 시의 감정을 정량적으로 탐구할 수 있는 기초 자료를 제공하며, KCoEM은 한국어 감정 어휘와 색채를 연결함으로써 서구 중심의 감정–색채 연구를 보완하는 자원이 될 수 있다.  나아가 ‘함께 읽기 시스템’을 통해 생성된 감정 기반 색채 팔레트는 전시, 출판, 디지털 아카이빙, 감정 기반 추천, 색채 디자인 등 분야에서 응용될 수 있다. 따라서, 본 연구는 데이터셋과 시스템을 학문적 연구와 사회적 활용을 연결하는 환경적 매체로 제시하며, 이를 통해 문학 감정의 시각화를 단순한 분석적 도구를 넘어선 디지털 인문학의 창의적 방법론을 제안하고자 한다.

 

Files

데이터셋의 환경적 전환_ 인공지능과 함께 읽기(Co-Reading)를 통한 한국 근현대 시–감정–색채 멀티모달 미디어 _임이로.pdf

Additional details

Additional titles

Translated title (En)
The Environmental Transformation of a Dataset: Human–AI Co-Reading of Emotion–Color Multimodal Media in Korean Modern Poetry

Related works

Cites
Preprint: arXiv:2509.03932v1 (arXiv)

Dates

Issued
2025-12-06
I presented my research at the 2025 Chung-Ang University Graduate Student Conference in Film and Media Studies, themed "The Boundary Between Film and Media: Mediating Research.

References

  • AKS-DHLAB. (2025). KPoEM [Computer software]. Hugging Face. https://doi.org/10.57967/hf/6301
  • AKS-DHLAB. (2025). KPoEM[Computer software]. GitHub. https://github.com/AKS-DHLAB/KPoEM
  • AKS-DHLAB. (2025). KPoEM[Data set]. Hugging Face. https://doi.org/10.57967/hf/6303
  • Drucker, J. (2014). Graphesis: Visual forms of knowledge production. Harvard University Press.
  • Jeon, Duyoung, Lee, Junho, and Kim, Cheongtag, &User Guide for KOTE: Kore an Online Comments Emotions Dataset&, arXiv:2205.05300[cs.CL], 2022, DOI: https://doi.org/10.48550/arXiv.2205.05300
  • Lim, I., Ji, H., & Kim, B. (2025). Decoding the poetic language of emotion in Korean modern poetry: Insights from a human-labeled dataset and AI modeling. arXiv.https://arxiv.org/abs/2509.03932
  • McLuhan, M. (1994). Understanding media: The extensions of man. MIT Press.
  • Peters, J. D. (2015). The marvelous clouds: Toward a philosophy of elemental media. University Of Chicago Press.
  • Lim, I. (2025). KCoEM(Korean Color Emotion Mapping) Dataset (1.0) [Data set]. Zenodo. https://doi.org/10.5281/zenodo.17797748