新潟大学「生成AI活用実践演習」にてHumanitext開発者が講義

11/13/2025

新潟大学で開講されている「生成AI活用実践演習」は、様々な分野における生成AIの活用法を実践的に学ぶことを目的とした科目です。

このたび、本講義の第6回「分野(領域)での活用」セッション（哲学）の特別講義として、Humanitextプロジェクトを主導する桜美林大学の田中一孝准教授が「人文系こそAIを使いこなそう！ -テクストデータベースの構築と活用-」と題して登壇しました。二日間にわたる講義では、合計400名の受講生が、Humanitext開発の知見を学ぶとともに、提示された実践的な課題に熱心に取り組みました。

📚 Humanitext開発の知見を教育へ

講義ではまず、人文科学、特に西洋古典や日本文学の研究に特化したAI「Humanitext」シリーズ（Antiqua, Aozora等）の開発が紹介されました。

Humanitextの核心は、RAG (Retrieval-Augmented Generation: 検索拡張生成) 技術にあります。これは、一般的な大規模言語モデル（LLM）に質問を投げるのではなく、専門家が精選・構築したデータベース（原典テキストなど）を参照して回答を生成する仕組みです。

このアプローチにより、AIは回答の根拠となった文献を正確に提示でき、研究・学習における「偽情報（ハルシネーション）」のリスクを大幅に低減できます。

🎓 専門性を活かす「データベース構築」課題

講義の後半では、Humanitextの開発知見に基づき、学生が「AIを使う側」から「AIに専門知識を組み込む側」へと視点を転換させるための、ユニークな実践演習が提示されました。

これは、Googleの「NotebookLM」のような簡易RAG構築ツールを使い、学生が自分自身の専門分野（ドメイン知識）を活かし、さらに公開を前提とした著作権への配慮を学びながら、小規模なテキストデータベース（チャットボット）を設計・構築してみるという課題です。

課題のねらい

この演習の目的は、単にAIの操作を学ぶことではありません。

どの文献をAIに読み込ませるか？（ドメイン知識に基づくデータの選定）
そのデータは公開可能か？（著作権への配慮）
目的に対して、どの情報が足りないか？（データの評価）
AIが参照すべき情報とは何か？（データベース設計）

といった、AI開発の根幹にある「前処理」や「検索設計」の重要性を実体験することにあります。

急速に進化する生成AI技術の流行り廃りから切り離され、永続的に価値を持つ「クリーンなデータベース」を設計すること。そして、そのデータベースに専門家の知見（ドメイン知識）を組み込み、いつでも最新のAI技術と接続して活用できるようにしておくこと。これこそが、AIを真に「使いこなし、活用する力」の核心であると示す、示唆に富む講義となりました。