PNC 2025にてHumanitextプロジェクトの新しいデータモデルに関する論文が公開されました

12/4/2025

PNC 2025 カンファレンス

2025年9月にベトナム・ハノイで開催された「Pacific Neighborhood Consortium Annual Conference (PNC) 2025」におけるHumanitextプロジェクトの研究成果が、IEEE Xploreにて正式に公開されました。

発表された論文のタイトルは「A Data Model for Integrating Annotations with Western Classical Texts for an AI Dialogue System(AI対話システムのために注釈と西洋古典テキストを統合するデータモデル)」です。本研究は、小川潤(東京大学)、岩田直也(名古屋大学)、田中一廣(桜美林大学)によって執筆されました。

研究の背景と目的

Humanitextプロジェクトでは、西洋古典籍に基づいたAI対話生成システム「Humanitext Antiqua」の開発を進めています。これまでシステムは、検索拡張生成(RAG)という技術を用いて原典テキストに基づいた回答を生成してきましたが、原典に直接記述されていない背景情報や関連情報を取り込むことには限界がありました。

特に西洋古典学の研究においては、原典そのものだけでなく、後世の学者による「注釈(Annotation)」が極めて重要な役割を果たします。しかし、従来のシステムではこれらの注釈情報を十分にAIの生成プロセスに統合できていませんでした。

提案された新しいデータモデル

この課題を解決するために、本論文では原典テキストとその注釈を「Linked Data(リンクされたデータ)」に基づくナレッジグラフとして構造化する新しいスキーマ(データ構造)を設計しました。

これにより、単なるテキスト記述を超えた広範な情報を考慮した検索やドキュメント生成が可能になります。具体的には、原典の特定箇所と、それに関連する学術的な注釈をデータ上で結びつけることで、AIがより深い文脈を理解し、回答できる基盤を構築しました。

プロトタイプ・ビューアの開発

さらに、構築されたナレッジグラフの実用性を示すために、原典テキストとその注釈を並行して閲覧できるプロトタイプ・ビューアも開発されました。これにより、ユーザーはAIとの対話だけでなく、原典と注釈を対照しながら深く考察するという、古典学本来の研究・学習プロセスをデジタル上でシームレスに行うことが可能になります。

本研究は、デジタル人文学とAI技術の融合における重要な基礎研究と位置づけられており、今後のHumanitextシステムの機能拡張に大きく寄与するものです。

詳細な論文は、以下のリンク(IEEE Xplore)よりご覧いただけます。