新潟大学「生成AI活用実践演習」にてHumanitext開発者が講義
11/13/2025

新潟大学で開講されている「生成AI活用実践演習」は、様々な分野における生成AIの活用法を実践的に学ぶことを目的とした科目です。
このたび、本講義の第6回「分野(領域)での活用」セッション(哲学)の特別講義として、Humanitextプロジェクトを主導する桜美林大学の田中一孝准教授が「人文系こそAIを使いこなそう! -テクストデータベースの構築と活用-」と題して登壇しました。二日間にわたる講義では、合計400名の受講生が、Humanitext開発の知見を学ぶとともに、提示された実践的な課題に熱心に取り組みました。
📚 Humanitext開発の知見を教育へ
講義ではまず、人文科学、特に西洋古典や日本文学の研究に特化したAI「Humanitext」シリーズ(Antiqua, Aozora等)の開発が紹介されました。
Humanitextの核心は、RAG (Retrieval-Augmented Generation: 検索拡張生成) 技術にあります。これは、一般的な大規模言語モデル(LLM)に質問を投げるのではなく、専門家が精選・構築したデータベース(原典テキストなど)を参照して回答を生成する仕組みです。
このアプローチにより、AIは回答の根拠となった文献を正確に提示でき、研究・学習における「偽情報(ハルシネーション)」のリスクを大幅に低減できます。
🎓 専門性を活かす「データベース構築」課題
講義の後半では、Humanitextの開発知見に基づき、学生が「AIを使う側」から「AIに専門知識を組み込む側」へと視点を転換させるための、ユニークな実践演習が提示されました。
これは、Googleの「NotebookLM」のような簡易RAG構築ツールを使い、学生が自分自身の専門分野(ドメイン知識)を活かし、さらに公開を前提とした著作権への配慮を学びながら、小規模なテキストデータベース(チャットボット)を設計・構築してみるという課題です。
課題のねらい
この演習の目的は、単にAIの操作を学ぶことではありません。
- どの文献をAIに読み込ませるか?(ドメイン知識に基づくデータの選定)
- そのデータは公開可能か?(著作権への配慮)
- 目的に対して、どの情報が足りないか? (データの評価)
- AIが参照すべき情報とは何か? (データベース設計)
といった、AI開発の根幹にある「前処理」や「検索設計」の重要性を実体験することにあります。
急速に進化する生成AI技術の流行り廃りから切り離され、永続的に価値を持つ「クリーンなデータベース」を設計すること。そして、そのデータベースに専門家の知見(ドメイン知識)を組み込み、いつでも最新のAI技術と接続して活用できるようにしておくこと。これこそが、AIを真に「使いこなし、活用する力」の核心であると示す、示唆に富む講義となりました。